Теги на ZX-Art
Данная статья адресована, прежде всего, тем, кто вносит теги к графике на портале ZX-Art. Хотя, если вы этого еще не делаете, то, возможно, вам тоже будет интересно :).
Прежде всего, зачем надо вносить теги?
Ответ очевиден — для более удобного поиска конкретных картинок. Часто мы забываем авторов работ, я уж не говорю о названиях картинок и из каких игр они или демо, или в каком конкурсе они принимали участие. Поскольку машинное распознавание образов пока у нас отсутствует как инструмент на ZX-Art, остается только одно — распознавание образов «вручную», то есть человеком и запись информации о наборе образов в виде набора слов, например тегов.Зачем соблюдать какие-то правила при внесении тегов?
В принципе эти правила в данный момент никак и не прописаны на ZX-Art, но это, похоже, никак не мешает пользователям их вносить.Необходимость соблюдения правил при внесении тегов кажется очевидной, — это необходимо для того, чтобы вы могли найти те работы, теги по которым вносил другой пользователь. Если вы будете искать тег «Рука», а кто-то впишет только «Ладонь» или «Руки», то вы по своему запросу ничего не найдете. Получается, что необходимо договориться, в каком случае должен употребляться тег «Ладонь», а в каком «Рука», и что, например, множественное число для тегов использоваться не будет. Учитывая эти правила мы максимально повысим вероятность нахождения необходимых нам работ.
Откуда я такой умный взялся со своими правилами? Ниоткуда :) У меня есть лишь опыт участия в подобной работе на портале Artcity, где действовали следущие принципы:
1) Работы загружают пользователи и администраторы
2) Работы проверяют администраторы
3) Теги пишет тот, кто проверяет и публикует работу
4) Есть определенные принципы постановки тегов
5) Каждый администратор несет ответственность за свои теги, что означает, что он же сам исправляет все ошибки в своих тегах, найденные другими администраторами
6) Теги вносятся только на английском языке
7) Теги могут иметь специальный тип (например, год, пати, группы, платформы и т.п.), т.е. структурирование информации по годам и конкурсам сделано на Artcity через теги.
Таким образом, каждый администратор Artcity старается соблюдать четкую и однозначную систему тегов, чтобы сократить трудозатраты на исправление ошибок, и все публикуемые картинки при этом сопровождаются тегами.
Принципы наполнения архива и тегирования на ZX-Art в данный момент отличаются от Artcity, а именно:
1) Работы загружают пользователи и администраторы
2) Работы публикуются сразу же, без проверки
3) Теги вносит любой пользователь или администратор
4) Нет договоренностей о правилах тегирования, действует принцип самоорганизации (каждый обучается самостоятельно, на основе уже имеющегося облака тегов и выпадающих подсказок, либо вносит теги как получится)
5) Ответственности за ошибки нет, любой пользователь может править любые теги и добавлять свои
6) Теги мультиязычны (переводить теги могут только администраторы)
7) У тегов есть синонимы (их могут добавлять администраторы)
Как следствие, ZX-Art больше ориентирован на пользователей: пользователи имеют более широкие возможности (чем на Artcity) по наполнению и упорядочиванию архива. С недавнего времени авторы имеют практически полный контроль над своими галереями и треками. Такой подход позволяет более равномерно распределить нагрузку по внесению работ и метаинформации, но при этом и повышает ее энтропию по причине отсутствия правил и договоренностей. В частности набор тегов, составленный на данный момент по разным правилам, во-первых неоднороден по структуре, и, во-вторых, содержит явные ошибки.
Факты по тегам на ZX-Art
За 5 лет (с июля 2007 г.) внесено 23 910 тегов, при этом в базе 9 835 картинок, в среднем 2,4 тега на 1 картинку. Про музыку я пока даже не говорю, хотя теги на ZX-Art общие для музыки и графики, и это следует обязательно учитывать в будущем при систематизации тегов.Всего внесено 1 781 уникальных тегов. Их внесли 29 пользователей, из них только 7 являются администраторами. Больше всего тегов внес tiboh – 7 870 тегов (33%).
5 наиболее употребимых тегов:
Game Graphics — 1 490 (6,2%)
Loading Screen — 1 230 (5,1%)
Male — 953 (4,0%)
Female — 619 (2,6%)
Logo — 561 (2,3%)
При этом в базе 711 (40%!) уникальных тегов, которые употребляются всего 1 раз.
О чем все это говорит?
1) 2,4 тега на картинку в среднем – это ничтожно мало, большая часть работы еще впереди (на Artcity, для сравнения, — 5,3 тега на картинку).2) 40% тегов встречаются употребляются 1 раз – значит отсутствует четкая систематизация тегов. Не могут быть картинки настолько уникальными.
Какие проблемы с систематизацией тегов на данный момент и какие есть ошибки?
1. Опечатки в тегах.Примеры: Губка Боь, Кражаб6502, Человекк и т.п. (реальные примеры, пока не исправлены).
Причины: невнимательность.
Последствия: ценность тегов почти нулевая, информацию найти невозможно.
Как устранить: в админке фильтровать малоупотребляемые теги, исправлять ошибки, объединять дубли.
Как предотвратить: автоматически — никак, если только не накапливать словарь опечаток :) внимательно следить за подсказками системы по существующим тегам: частоупотребимые теги все должны выпадать в виде подсказок.
2. Внесение тегов на другом языке.
Примеры: достаточно зайти в облако тегов на любом языке и посмотреть на начало и конец облака, т.к. оно отсортировано по алфавиту.
Причины: пользователь вносит теги на языке, отличном от языка интерфейса, выбранного в данный момент на ZX-Art самим же пользователем.
Последствия: затрудняется поиск по тегам.
Как устранить: 1) вручную заменить теги на правильные в каждой картинке, что трудоемко при большом количестве подобных тегов. Либо: 2) перевести теги, устранить дубли за счет операции объединения тегов.
Как предотвратить: встроить определение языка при вводе тегов. Например, после нажатия кнопки Submit проверять символы и выводить сообщение о том, что теги на другом языке не были добавлены.
3. Дублирование тегов.
Примеры: Aborigen, Ball, Balloon, Bike, Boat, Cap, Clown, Cup, Devil, Diver, Electronics, Flash, Fly, Fruit, Ghost, Girl, Hat, Jacket, Jesus, Monk, Oldman, Palm, Religion, Shining, Shoe, Sorcerer, Speaker, Spruce, Statue, Text, Ufo
Причины: дубли тегов возникают при переводе тегов, как следствие предыдущей проблемы.
Последствия: не критично, на поиск влиять не должно, если поиск учитывает все вхождения в базу, а не останавливается на первом найденном.
Как устранить: объединить дубли тегов.
Как предотвратить: подсвечивать дубли тегов в админке, либо реализовать специальный поиск подобных дублей.
4. Употребление множественного числа.
Примеры: Architectural monuments, Arrows, Balls, Birds, Boots, Brains, Bubbles, Canines, Cards, Cassettes, Claws, Clouds, Crosses, Dimensions, Dragons, Ears, Electronics, Eyes, Fingers, Games, Gloves, Hieroglyphs, Hooves, Horns, Invaders, Jaws, Jungles, Leaves, Mountains, Olympics, Pigs, Pirates, Robots, Rocks, Roots, Ruins, Simbols, Tiles, Tools, Torns, Transformers, Wires
Причины: невнимательность пользователя, вносящего теги, отсутствие представлений о необходимых правилах.
Последствия: затрудняется поиск по тегам.
Как устранить: 1) вручную заменить теги на правильные в каждой отдельной работе. Либо 2) перевести теги, объединить дубли тегов с уже существующими.
Как предотвратить: автоматически отслеживать вряд ли возможно. Заранее договориться, о том, что употребляем только единственное число там, где это возможно, исключение можно сделать для слов, которые более привычно слышать во множественном числе и которые маловероятно, что встретятся в единственном числе, например Earphones, Headlights, Lips.
5. Внесение относительных, неопределенных тегов, либо тегов, не соответствующих принципам систематизации информации.
Примеры: Dream, Future, Pixel-Art, New Ideas.
Причины: отсутствие договоренностей о правилах систематизации информации, невнимательность.
Последствия: ценность тегов почти нулевая, маловероятно, что теги будут использоваться кем-то ещё кроме пользователя, который их внес.
Как устранить: дополнительно проверять теги в админке, отделяя проверенные теги от непроверенных.
Как предотвратить: ознакомиться с облаком тегов, поискать схожие теги и постараться употреблять уже имеющиеся теги, нежели вносить новые. Что такое тег Dream? Откуда мы знаем, что персонаж на картинке спит? Вместо этого можно внести тег Closed Eyes. Аналогично – Sci-Fi вместо Future (ведь мы не знаем, каким реально будет будущее, а наши представления о нем – это скорее фантастика). А New Ideas – это скорее Mockup.
Какие еще есть правила?
Исходя из собственного опыта предлагаю к использованию следующие простые правила:1. Для описания людей:
— Face – когда на картинке видно только лицо и ничего более за его контуром;
— Head – когда видна только голова;
— Portrait – когда человек уже виден минимум по плечи и более.
2. Стараться не забывать указывать, так называемые, родительские теги, например:
— Gun, Weapon;
— Lion, Animal;
— Mercedes, Car;
— Michael Jackson, Celebrity;
— Spiderman, Superhero;
— Terminator, Movie;
И т.п.
При этом родительский тег Human предлагаю употреблять только тогда, когда не определен пол (Male или Female). Если же пол определен, то Human не указывать.
3. Еще раз читать облако тегов, обсуждать друг с другом спорные и непонятные вопросы.
Ну и в конце, хотелось бы сказать о сегодняшнем нововведении на ZX-Art:
Починен поиск по тегам в разделе Database, теперь можно искать сразу по нескольким тегам (включая синонимы!). Например Female, Spaceman или Female, Astronaut:
http://zxart.ee/api/action:filter/types:zxPicture/export:zxPicture/language:eng/start:0/limit:50/order:date,desc/filter:zxPictureTagsInclude=female,%20spaceman;
http://zxart.ee/api/action:filter/types:zxPicture/export:zxPicture/language:eng/start:0/limit:50/order:date,desc/filter:zxPictureTagsInclude=female,%20astronaut;
Результат будет один и тот же. И чем больше тегов, тем точнее будет поиск!
42 комментария
zxart.ee/rus/grafika/tegi/iron-maiden/
О, спасибо за годноту!
> На Artcity даже специально исключали их из автоматической ротации…
Злые они :\
Затраты минимальные, а народ развлечет прекрасно.
Предлагаю такие любопытные теги где-нибудь складировать, хоть даже в комментариях здесь, а потом можно какой-то recommended список на ZX-Art вывесить куда-то. Много кому это полезно будет в итоге.
Сейчас вообще на ZX-Art с этим беда — контента много, а знают о нем не все лишь. Топы и рейтинги немного это решают, но теги, например, еще не выведены должным образом на общее внимание, а там уже сейчас есть на что посмотреть — есть персонажи из фильмов, есть знаменитости, есть обнаженка.
zxart.ee/rus/grafika/tegi/manowar/
собственно все что я делал по тегам.
то что теги плохо видно в описании работы это факт — поле для редактирования видно хорошо, сами теги плохо — может быть на зло всем нормам дизайна сделать их крупнее?
С тематическими тегами другая проблема — даже если ты сделаешь нормальное облако, наверху будет РУКА и НОГА (при вашем текущем подходе). Я на emulate_su когда с тегами работал сделал жесткое ограничение в 300 штук (хотя начинал со 100 и 200) и подгонял материалы под них. Это был вариант для нормального формирования облака. Но у вас художников другой случай
Вообще, вот на Artcity довольно неплохо все данные по каждой работе структурированы, м.б. и на ZX-Art переверстать их…
1) видна только рука
2) рука на переднем плане (крупно)
Соответственно, если таких рук много, то должен быть какой-то еще другой особенный контекст, объясняющий ситуацию, в которой на переднем плане много рук или много рук, которые видны, а людей не видно. Ну например руки корреспондентов с микрофонами: hand, mic, group, interview.
Впрочем, если вы в поиск напишете всего лишь hand, то это уже сильно сузит выдачу и позволит найти нужную картинку.
Действительно, никто за эту систематизацию не брался, нужна была инициатива. Я думаю, что правила внесения тегов сформулирую кратко по выводам из статьи, запишу в FAQ на сайте и добавлю ссылку в форму внесения тегов.
Помимо этого, с моей стороны нужны:
1. Поиск дублей в тегах. В админке какую-нибудь кнопочку приделаю, чтобы можно было как-то быстро посмотреть.
2. Родительские теги. Это очень, очень крутая идея, мы повысим охват картинок тегами в два-три раза, ничего дополнительно не внося.
3. Инструмент внесения тегов. Чтобы предлагал неохваченные популярные работы на тегирование, чтобы самому не искать, где тегов нет.
Тема тегирования имеет огромнейший потенциал. Как пример, мне нужно было деревья рисовать, я нашел кучу хороших приемов не только по памяти, но и воспользовался поиском по тегам:
zxart.ee/eng/graphics/database/sortParameter:date/sortOrder:desc/tagsInclude:tree%2CGame%20Graphics/resultsType:zxitem/ — даже при текущем низком охвате уже есть польза. А представьте, какие возможности для художнико по обучению графике появятся, когда мы осуществим хотя бы половину необходимых действий?
Такого я не видел ни на одной платформе, честно говоря.
Возможно, потом понадобится инструмент разделения тэгов, чтобы Savage (дикарь в графике) и Savage (движок бипера) были отдельно.
1) На первый взгляд они никак не пересекаются
2) Логично отображать 2 отдельных облака тегов — одно для графики, другое для музыки
3) Демо тоже не должно вроде бы никак пересекаться ни с графикой ни с музыкой по тегам
Есть даже теги которые ни разу не употребляются. Точнее по ним не выдается ни одной работы. Пример: тег «Александр Александров»
Еще бы хорошо сделать сортировку тегов по убыванию частоты, чтобы сперва можно было проверить наиболее часто используемые теги.
Предлагаю:
Game Graphics заменить на Game и помечать им ВСЮ игровую графику, включая заставки. То есть чтобы тег Game означал принадлежность картинки к игре, неважно, существующей или воображаемой/находящейся в разработке.
Tiles, Sprites, Interface, Background и прочие — сделать отдельными тегами для обозначения отдельно изображенных набора тайлов, набора спрайтов, макета интерфейса, фоновых изображений игры.
Menu, Credits, Ingame и прочие — для пометки скриншотов различных игровых экранов (игровое меню, экран с авторами, скриншот геймплея и прочие).
Mockup — применять если речь идет о макетах, проектах игр. Можно даже Loading Screen Mockup заменить парой Loading Screen, Mockup.
Для обзначения изображений настольных игр использовать Board Game, для спортивных игр — Sport + конкретное название игры, для изображения компьютерных/консольных внутри картинки — Videogame, для игровых автоматов — Coin-op, Arcade.
Насчет Game — согласен, но предлагаю Game на каком-то этапе сделать родительским тегом для всех игровых тегов, а не переименовывать Game Graphics.
Практически, чего хотелось бы добиться: раздельный поиск и раздельные топы для Menu, Credits, Ingame, и междууровневых вставок (или Game Intro/Outro/Finalcut?), туда же можно закинуть Game Over.
Что думаете, товарищи? Прямо сейчас из этого обсуждения складывается guideline, как скажете — так и будет. Всё, что договоримся, пойдет на сайт в виде инструкции.
и настоятельно рекомендовать заливщикам для начала вдумчиво вчитаться в основной список, и затем лишь что-то своё придумывать