Теги на ZX-Art



Данная статья адресована, прежде всего, тем, кто вносит теги к графике на портале ZX-Art. Хотя, если вы этого еще не делаете, то, возможно, вам тоже будет интересно :).

Прежде всего, зачем надо вносить теги?
Ответ очевиден — для более удобного поиска конкретных картинок. Часто мы забываем авторов работ, я уж не говорю о названиях картинок и из каких игр они или демо, или в каком конкурсе они принимали участие. Поскольку машинное распознавание образов пока у нас отсутствует как инструмент на ZX-Art, остается только одно — распознавание образов «вручную», то есть человеком и запись информации о наборе образов в виде набора слов, например тегов.

Зачем соблюдать какие-то правила при внесении тегов?
В принципе эти правила в данный момент никак и не прописаны на ZX-Art, но это, похоже, никак не мешает пользователям их вносить.

Необходимость соблюдения правил при внесении тегов кажется очевидной, — это необходимо для того, чтобы вы могли найти те работы, теги по которым вносил другой пользователь. Если вы будете искать тег «Рука», а кто-то впишет только «Ладонь» или «Руки», то вы по своему запросу ничего не найдете. Получается, что необходимо договориться, в каком случае должен употребляться тег «Ладонь», а в каком «Рука», и что, например, множественное число для тегов использоваться не будет. Учитывая эти правила мы максимально повысим вероятность нахождения необходимых нам работ.

Откуда я такой умный взялся со своими правилами? Ниоткуда :) У меня есть лишь опыт участия в подобной работе на портале Artcity, где действовали следущие принципы:

1) Работы загружают пользователи и администраторы
2) Работы проверяют администраторы
3) Теги пишет тот, кто проверяет и публикует работу
4) Есть определенные принципы постановки тегов
5) Каждый администратор несет ответственность за свои теги, что означает, что он же сам исправляет все ошибки в своих тегах, найденные другими администраторами
6) Теги вносятся только на английском языке
7) Теги могут иметь специальный тип (например, год, пати, группы, платформы и т.п.), т.е. структурирование информации по годам и конкурсам сделано на Artcity через теги.

Таким образом, каждый администратор Artcity старается соблюдать четкую и однозначную систему тегов, чтобы сократить трудозатраты на исправление ошибок, и все публикуемые картинки при этом сопровождаются тегами.

Принципы наполнения архива и тегирования на ZX-Art в данный момент отличаются от Artcity, а именно:

1) Работы загружают пользователи и администраторы
2) Работы публикуются сразу же, без проверки
3) Теги вносит любой пользователь или администратор
4) Нет договоренностей о правилах тегирования, действует принцип самоорганизации (каждый обучается самостоятельно, на основе уже имеющегося облака тегов и выпадающих подсказок, либо вносит теги как получится)
5) Ответственности за ошибки нет, любой пользователь может править любые теги и добавлять свои
6) Теги мультиязычны (переводить теги могут только администраторы)
7) У тегов есть синонимы (их могут добавлять администраторы)

Как следствие, ZX-Art больше ориентирован на пользователей: пользователи имеют более широкие возможности (чем на Artcity) по наполнению и упорядочиванию архива. С недавнего времени авторы имеют практически полный контроль над своими галереями и треками. Такой подход позволяет более равномерно распределить нагрузку по внесению работ и метаинформации, но при этом и повышает ее энтропию по причине отсутствия правил и договоренностей. В частности набор тегов, составленный на данный момент по разным правилам, во-первых неоднороден по структуре, и, во-вторых, содержит явные ошибки.

Факты по тегам на ZX-Art
За 5 лет (с июля 2007 г.) внесено 23 910 тегов, при этом в базе 9 835 картинок, в среднем 2,4 тега на 1 картинку. Про музыку я пока даже не говорю, хотя теги на ZX-Art общие для музыки и графики, и это следует обязательно учитывать в будущем при систематизации тегов.

Всего внесено 1 781 уникальных тегов. Их внесли 29 пользователей, из них только 7 являются администраторами. Больше всего тегов внес tiboh – 7 870 тегов (33%).

5 наиболее употребимых тегов:
Game Graphics — 1 490 (6,2%)
Loading Screen — 1 230 (5,1%)
Male — 953 (4,0%)
Female — 619 (2,6%)
Logo — 561 (2,3%)

При этом в базе 711 (40%!) уникальных тегов, которые употребляются всего 1 раз.

О чем все это говорит?
1) 2,4 тега на картинку в среднем – это ничтожно мало, большая часть работы еще впереди (на Artcity, для сравнения, — 5,3 тега на картинку).
2) 40% тегов встречаются употребляются 1 раз – значит отсутствует четкая систематизация тегов. Не могут быть картинки настолько уникальными.

Какие проблемы с систематизацией тегов на данный момент и какие есть ошибки?
1. Опечатки в тегах.
Примеры: Губка Боь, Кражаб6502, Человекк и т.п. (реальные примеры, пока не исправлены).
Причины: невнимательность.
Последствия: ценность тегов почти нулевая, информацию найти невозможно.
Как устранить: в админке фильтровать малоупотребляемые теги, исправлять ошибки, объединять дубли.
Как предотвратить: автоматически — никак, если только не накапливать словарь опечаток :) внимательно следить за подсказками системы по существующим тегам: частоупотребимые теги все должны выпадать в виде подсказок.

2. Внесение тегов на другом языке.
Примеры: достаточно зайти в облако тегов на любом языке и посмотреть на начало и конец облака, т.к. оно отсортировано по алфавиту.
Причины: пользователь вносит теги на языке, отличном от языка интерфейса, выбранного в данный момент на ZX-Art самим же пользователем.
Последствия: затрудняется поиск по тегам.
Как устранить: 1) вручную заменить теги на правильные в каждой картинке, что трудоемко при большом количестве подобных тегов. Либо: 2) перевести теги, устранить дубли за счет операции объединения тегов.
Как предотвратить: встроить определение языка при вводе тегов. Например, после нажатия кнопки Submit проверять символы и выводить сообщение о том, что теги на другом языке не были добавлены.

3. Дублирование тегов.
Примеры: Aborigen, Ball, Balloon, Bike, Boat, Cap, Clown, Cup, Devil, Diver, Electronics, Flash, Fly, Fruit, Ghost, Girl, Hat, Jacket, Jesus, Monk, Oldman, Palm, Religion, Shining, Shoe, Sorcerer, Speaker, Spruce, Statue, Text, Ufo
Причины: дубли тегов возникают при переводе тегов, как следствие предыдущей проблемы.
Последствия: не критично, на поиск влиять не должно, если поиск учитывает все вхождения в базу, а не останавливается на первом найденном.
Как устранить: объединить дубли тегов.
Как предотвратить: подсвечивать дубли тегов в админке, либо реализовать специальный поиск подобных дублей.

4. Употребление множественного числа.
Примеры: Architectural monuments, Arrows, Balls, Birds, Boots, Brains, Bubbles, Canines, Cards, Cassettes, Claws, Clouds, Crosses, Dimensions, Dragons, Ears, Electronics, Eyes, Fingers, Games, Gloves, Hieroglyphs, Hooves, Horns, Invaders, Jaws, Jungles, Leaves, Mountains, Olympics, Pigs, Pirates, Robots, Rocks, Roots, Ruins, Simbols, Tiles, Tools, Torns, Transformers, Wires
Причины: невнимательность пользователя, вносящего теги, отсутствие представлений о необходимых правилах.
Последствия: затрудняется поиск по тегам.
Как устранить: 1) вручную заменить теги на правильные в каждой отдельной работе. Либо 2) перевести теги, объединить дубли тегов с уже существующими.
Как предотвратить: автоматически отслеживать вряд ли возможно. Заранее договориться, о том, что употребляем только единственное число там, где это возможно, исключение можно сделать для слов, которые более привычно слышать во множественном числе и которые маловероятно, что встретятся в единственном числе, например Earphones, Headlights, Lips.

5. Внесение относительных, неопределенных тегов, либо тегов, не соответствующих принципам систематизации информации.
Примеры: Dream, Future, Pixel-Art, New Ideas.
Причины: отсутствие договоренностей о правилах систематизации информации, невнимательность.
Последствия: ценность тегов почти нулевая, маловероятно, что теги будут использоваться кем-то ещё кроме пользователя, который их внес.
Как устранить: дополнительно проверять теги в админке, отделяя проверенные теги от непроверенных.
Как предотвратить: ознакомиться с облаком тегов, поискать схожие теги и постараться употреблять уже имеющиеся теги, нежели вносить новые. Что такое тег Dream? Откуда мы знаем, что персонаж на картинке спит? Вместо этого можно внести тег Closed Eyes. Аналогично – Sci-Fi вместо Future (ведь мы не знаем, каким реально будет будущее, а наши представления о нем – это скорее фантастика). А New Ideas – это скорее Mockup.

Какие еще есть правила?
Исходя из собственного опыта предлагаю к использованию следующие простые правила:

1. Для описания людей:
— Face – когда на картинке видно только лицо и ничего более за его контуром;
— Head – когда видна только голова;
— Portrait – когда человек уже виден минимум по плечи и более.

2. Стараться не забывать указывать, так называемые, родительские теги, например:
— Gun, Weapon;
— Lion, Animal;
— Mercedes, Car;
— Michael Jackson, Celebrity;
— Spiderman, Superhero;
— Terminator, Movie;
И т.п.

При этом родительский тег Human предлагаю употреблять только тогда, когда не определен пол (Male или Female). Если же пол определен, то Human не указывать.

3. Еще раз читать облако тегов, обсуждать друг с другом спорные и непонятные вопросы.

Ну и в конце, хотелось бы сказать о сегодняшнем нововведении на ZX-Art:

Починен поиск по тегам в разделе Database, теперь можно искать сразу по нескольким тегам (включая синонимы!). Например Female, Spaceman или Female, Astronaut:

http://zxart.ee/api/action:filter/types:zxPicture/export:zxPicture/language:eng/start:0/limit:50/order:date,desc/filter:zxPictureTagsInclude=female,%20spaceman;

http://zxart.ee/api/action:filter/types:zxPicture/export:zxPicture/language:eng/start:0/limit:50/order:date,desc/filter:zxPictureTagsInclude=female,%20astronaut;

Результат будет один и тот же. И чем больше тегов, тем точнее будет поиск!

42 комментария

avatar
Моя теги любить, моя проставлять много тегов уже!

zxart.ee/rus/grafika/tegi/iron-maiden/
avatar
Кстати вопрос, насколько уместно писать тег именно Iron Maiden, а не Eddie. Или это целиком арт с альбомов группы?
avatar
Iron Maiden более широкий тег и более узнаваемый, то что героя зовут Eddie знают далеко не все. Это вскрывает один важный момент в вопросах тегов — туловище, голова, рука, лицо — это отлично! Но еще нужны простые тематические теги (радость, ненависть, Iron Maiden). И эти истории вполне могут пересекаться.
avatar
Ага, арт по Iron Maiden, а скорее даже по Cannibal Corpse раскроет тему отдельных тегов. Хотя больше подойдет тег Torture (слабонервным не рекомендую искать по этому тегу ни на ZX-Art, ни тем более на Artcity), не самые приятные работы находятся. На Artcity даже специально исключали их из автоматической ротации…
avatar
На Artcity по torture есть довольно жуткие работы, а есть довольно ржачные. С сиськастыми женщинами, приносимыми в жертву богу-таракану, например.
avatar
> слабонервным не рекомендую искать по этому тегу ни на ZX-Art, ни тем более на Artcity

О, спасибо за годноту!

> На Artcity даже специально исключали их из автоматической ротации…

Злые они :\
avatar
Круто! По таким тегам потом очень прикольно на пати всякие слайды показывать. Или распечатать и сделать стенд — все Эдди на ZX-Spectrum.
Затраты минимальные, а народ развлечет прекрасно.

Предлагаю такие любопытные теги где-нибудь складировать, хоть даже в комментариях здесь, а потом можно какой-то recommended список на ZX-Art вывесить куда-то. Много кому это полезно будет в итоге.
Сейчас вообще на ZX-Art с этим беда — контента много, а знают о нем не все лишь. Топы и рейтинги немного это решают, но теги, например, еще не выведены должным образом на общее внимание, а там уже сейчас есть на что посмотреть — есть персонажи из фильмов, есть знаменитости, есть обнаженка.
avatar
zxart.ee/rus/grafika/tegi/microsoft/
zxart.ee/rus/grafika/tegi/manowar/

собственно все что я делал по тегам.
то что теги плохо видно в описании работы это факт — поле для редактирования видно хорошо, сами теги плохо — может быть на зло всем нормам дизайна сделать их крупнее?

С тематическими тегами другая проблема — даже если ты сделаешь нормальное облако, наверху будет РУКА и НОГА (при вашем текущем подходе). Я на emulate_su когда с тегами работал сделал жесткое ограничение в 300 штук (хотя начинал со 100 и 200) и подгонял материалы под них. Это был вариант для нормального формирования облака. Но у вас художников другой случай
avatar
Теги можно покрасить каким-нибудь другим цветом, тогда будут в глаза бросаться.
Вообще, вот на Artcity довольно неплохо все данные по каждой работе структурированы, м.б. и на ZX-Art переверстать их…
avatar
Тем не менее третьего дня я зашел туда чтобы найти Me And My Little Sister by Louie с учетом того что я забыл ник автора. Теги-хуеги, 20 минут убил. Можете повторить эксперимент, представив что у вас в голове только две девочки Sister и Me (ну и еще ААААААМИГА!!!!).
avatar
Ну, учитывая, что кроме крупных лиц почти ничего нет, нашел за минут 5. Female, child, на 7ой странице из 10. Увы. Чтобы быстрее находить такие штуки, нужны теги типа «Обнимашки», например.
avatar
А что если я помню, что там явно не одна рука, а много? Мне было бы удобно искать hands, а не hand
avatar
Дело в том, что тег «рука» уместно использовать только в том случае, если
1) видна только рука
2) рука на переднем плане (крупно)
Соответственно, если таких рук много, то должен быть какой-то еще другой особенный контекст, объясняющий ситуацию, в которой на переднем плане много рук или много рук, которые видны, а людей не видно. Ну например руки корреспондентов с микрофонами: hand, mic, group, interview.

Впрочем, если вы в поиск напишете всего лишь hand, то это уже сильно сузит выдачу и позволит найти нужную картинку.
avatar
Я думаю, что для часто используемых случаев (прецедентно, то есть), можно множественное число внести в синонимы тега. Синонимы в этом отношении вообще удобны — не засоряют список тегов, а поиск упрощается.
avatar
Спасибо за анализ!
Действительно, никто за эту систематизацию не брался, нужна была инициатива. Я думаю, что правила внесения тегов сформулирую кратко по выводам из статьи, запишу в FAQ на сайте и добавлю ссылку в форму внесения тегов.
Помимо этого, с моей стороны нужны:
1. Поиск дублей в тегах. В админке какую-нибудь кнопочку приделаю, чтобы можно было как-то быстро посмотреть.
2. Родительские теги. Это очень, очень крутая идея, мы повысим охват картинок тегами в два-три раза, ничего дополнительно не внося.
3. Инструмент внесения тегов. Чтобы предлагал неохваченные популярные работы на тегирование, чтобы самому не искать, где тегов нет.

Тема тегирования имеет огромнейший потенциал. Как пример, мне нужно было деревья рисовать, я нашел кучу хороших приемов не только по памяти, но и воспользовался поиском по тегам:
zxart.ee/eng/graphics/database/sortParameter:date/sortOrder:desc/tagsInclude:tree%2CGame%20Graphics/resultsType:zxitem/ — даже при текущем низком охвате уже есть польза. А представьте, какие возможности для художнико по обучению графике появятся, когда мы осуществим хотя бы половину необходимых действий?
Такого я не видел ни на одной платформе, честно говоря.
avatar
Фигачь! Вообще, имхо, лучший сайт по графике. А можно платформу выделить в какой-нибудь фреймворк, я бы такой же по NES-тематике хотел видеть)
avatar
а у NES есть нативный (не исполняемый) формат хранения картинок?
avatar
а какой критерий хранения графики? NES тут не причем
avatar
у Ширу есть интересный редактор с форматом, мне кажется над ним можно поплясать.
avatar
ZX-Art заточен под нативные форматы: можно скачать и посмотреть на реале. А в онлайне нативный формат автоматически конвертируется в PNG/GIF. Но для этого написан конвертор с учетом особенностей каждого формата.
avatar
Вот такой вопрос: планируются тэги для демо. А не свалится ли все в кучу?
avatar
Думаю, что не должно. Теги уже сейчас общие для музыки и графики, вроде пока казусов не случилось.
Возможно, потом понадобится инструмент разделения тэгов, чтобы Savage (дикарь в графике) и Savage (движок бипера) были отдельно.
avatar
Да, нужно. Желателен быстрый переход по нужным тегам — графика, музыка, софт. только я хз как это бы выглядело.
avatar
Гм, ну вот в принципе не очень понятно, зачем с точки зрения пользователя нужны общие теги для графики, музыки и демо.
1) На первый взгляд они никак не пересекаются
2) Логично отображать 2 отдельных облака тегов — одно для графики, другое для музыки
3) Демо тоже не должно вроде бы никак пересекаться ни с графикой ни с музыкой по тегам
avatar
Не знаю, какие общие. Если в планах есть линки с прода на графон-музон, то можно искать и без общих тегов. Наверное.
avatar
Теги должны быть сквозные через все материалы — так вижу. Тогда по тегу «дикий ад» сразу найдется сущность во всех ее проявлениях.
avatar
Вам бы только дикий ад везде присунуть, отец ))
avatar
не надо гнаться за 1 словом, более популярной теме (по количеству работ) даем тег-ключ, а менее популярной тег из двух слов (Savage beeper).
avatar
А никто и не гонится, тегов из 2 слов хватает и сейчас, а есть и из трех.
avatar
>При этом в базе 711 (40%!) уникальных тегов, которые употребляются всего 1 раз.

Есть даже теги которые ни разу не употребляются. Точнее по ним не выдается ни одной работы. Пример: тег «Александр Александров»
avatar
Есть. Если написать новый тег с ошибкой, отправить его, а затем исправить на новый, то первый ошибочный тег останется и не удалится. Возможно такие теги стоит удалять автоматически, например раз в сутки?
avatar
Я таки дико извиняюсь, но хочу в очередной раз задать вопрос частично относящийся к теме. Можно ли уже автору разделять работы в своей галерее хотя бы на Featured, Scraps и All как на девианте? Пусть это будут скрытые теги, которыми можно управлять отображением. Ну либо на базе другого метода который подойдёт для такой сортировки, я плохо в веб-программировании ориентируюсь. Т.е. ещё раз обозначу свой запрос: я хочу чтобы по-умолчанию пользователю отображались только те работы которые я, как автор, пометил тегом/поместил в папку Featured. Все остальные работы будут доступны по-нажатию на тег Scrap. Вообще все работы отсортированные по-годам и т.д. можно будет посмотреть нажав на All. Спасибо!
avatar
Да, это известная проблема. Для её решения запланированы «альбомы», которые автор сам сможет назначать. Работы из альбомов по дефолту в общем списке работ автора показаны не будут.
avatar
¡Люто плюсую эту идею!
avatar
@moroz1999, в админке, в taglist.untranslated наверное можно не выводить проверенные теги. Часть тегов не требует перевода, типа английских имен собственных (названия игр, компаний, групп, названия звуковых движков и другого ПО).

Еще бы хорошо сделать сортировку тегов по убыванию частоты, чтобы сперва можно было проверить наиболее часто используемые теги.
avatar
Да, а заодно для изображений без тега добавить #notag. Пока свободное время есть, я бы занялся…
avatar
По игровой графике. Сейчас есть тег Game Graphics с кучей синонимов (Games, Gameplay, Sprites, Tiles, Ingame, Background) и аналогично на русском. Как категория тег нужен. Но как замена отдельным тегам Sprite, Tile, Ingame, Background, — я считаю, что нет. У нас ведь есть отдельные теги Loading Screen, Loading Screen Mockup, Alternate Loading Screen. Кроме этого есть не очень понятные Game и Videogame теги.

Предлагаю:
Game Graphics заменить на Game и помечать им ВСЮ игровую графику, включая заставки. То есть чтобы тег Game означал принадлежность картинки к игре, неважно, существующей или воображаемой/находящейся в разработке.
Tiles, Sprites, Interface, Background и прочие — сделать отдельными тегами для обозначения отдельно изображенных набора тайлов, набора спрайтов, макета интерфейса, фоновых изображений игры.
Menu, Credits, Ingame и прочие — для пометки скриншотов различных игровых экранов (игровое меню, экран с авторами, скриншот геймплея и прочие).
Mockup — применять если речь идет о макетах, проектах игр. Можно даже Loading Screen Mockup заменить парой Loading Screen, Mockup.
Для обзначения изображений настольных игр использовать Board Game, для спортивных игр — Sport + конкретное название игры, для изображения компьютерных/консольных внутри картинки — Videogame, для игровых автоматов — Coin-op, Arcade.
avatar
похожую инструкцию нужно на сайте написать, чтобы не было путаницы.
avatar
Я за то, чтобы скриншоты игрового процесса отделять от междууровневых игровых вставок.
Насчет Game — согласен, но предлагаю Game на каком-то этапе сделать родительским тегом для всех игровых тегов, а не переименовывать Game Graphics.
Практически, чего хотелось бы добиться: раздельный поиск и раздельные топы для Menu, Credits, Ingame, и междууровневых вставок (или Game Intro/Outro/Finalcut?), туда же можно закинуть Game Over.
Что думаете, товарищи? Прямо сейчас из этого обсуждения складывается guideline, как скажете — так и будет. Всё, что договоримся, пойдет на сайт в виде инструкции.
avatar
может, сделать группы «основные теги» и «уточняющие»? первую пополняют только админы; основной тег как минимум один обязателен
и настоятельно рекомендовать заливщикам для начала вдумчиво вчитаться в основной список, и затем лишь что-то своё придумывать
avatar
Была похожая мысль. Можно прежде всего предлагать проверенные теги (есть такой статус у тегов, в админке выставляется после ручной проверки).
avatar
Как раз подойдут сюда родительские и дочерние теги. Считаю, что вряд ли стоит перенапрягать людей, вносящих теги. Их сейчас и так немного, а если ужесточить правила и усилить ответственность, то будет еще меньше. Лучше думать над максимальной автоматизацией, подсказками, массовыми инструментами.
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.