Отличное тёплое интервью, Рома, ты скромняга и красавчик, очень нравится твой стиль. Если когда-нибудь решусь на свою игру, художником позову только тебя.
То с чего коллега начал называется img2img. Да, оно очень прикольное и круто заходит, но есть деталь: чтобы одно ZX-изображение превратить в другое все равно нужно обучение. Поэтому мы конкретно решаем именно эту задачу.
То есть все это источник для референсов тоже предельно понятно. Вот классика emulate.su/2009/konferentsiya-razrabotchikov-kompyuternyh-igr-1979/ постараюсь добавить ее как видео сюда. Смотрите на русском там нормальный перевод. Момент, когда борода под глубокой Бугульмой начинает просто выдавать названия видеоигр. И сравните, как долго другие участники совещание выдавали свои мысли. А борода быстро. Вот он и есть нейросеть. Только нейросеть питается электричеством и работает так, что печени на аналогичное количество Бугульмы не хватит у нас всех вместе взятых. Соответственно, нейросеть не зло, но штука эта очень опасная для неподготовленного мозга. Если кто помнит историю Запилятора то там были детские шутки по сравнении с этими возможностями.
Дед вам так молвит… Для победы там всё уже есть. Нужно совсем чуток.
1) Время (оно решается через более быструю видеокарту с бОльшим объемом памяти. Сейчас у нас карты на 12 Гб, скоро будут на 24 Гб.
2) Мороз должен напрячься. Надо прописывать теги ZXArt в PNG для экспорта.
3) Надо проставлять теги на ZXArt. Более того. Надо все русские теги конвертнуть в латинские на четком и внятном языке вероятного противника.
Для победы этого будет достаточно. Отдельная тема — датасет на полностью Ч/Б и датасет на 53с — последний вообще бомба, но нужны теги.
И да… вот откуда нападения мы не ждали. Можно генерить БК-графику, более того, ее даже УДОБНЕЕ генерить и учить. Такие вот дела.
С заставками и прочим мелкопиксельным большая проблема т.к. нейросеть плохо распознает предмет\лицо\позу в несколько пикселей по контексту :) Та же картинка стилизованная, где рыцарь на коне в схватке с драконом и замком на заднем плане — уже непросто, хотя образы достаточно просто идентифицируются. Тут нужна предобученная модель на размеченном датасете, где к оригинальной картинке будет точное описание, что слева зеленый дракон с красными перепочатыми крыльями, рыцарь к копьем на белом коне и на заднем фоне белый замок…
Проще всего дела обстоят с крупными лицами, пейзажами, зарисовками зданий, крупными легко определяемыми предметами — машина, стул, окно, пистолет, нож.
Прекрасное. Было бы интересно посмотреть на всякие классические игровые заставки. Втч какой-нибудь кринж должен получится из заставок, типа PSSST и Atic Attac.
Да, игр где были скроллинги по обоим осям и так то было меньше остальных, а чтобы еще и монолитный статус-бар — это был своего рода высший пилотаж и вообще редко обычно в шедеврах. :)
Блин сижу читаю как в первый раз а уже прокомментировать успел когда то, память совсем дырявая. Я имел виду третью часть, но сейчас сообразил, что все вертикальные уровни не пересекаются с горизонтальными и разделены дверьми. Такая же схема и в Power Blade 2. Только Battletoads and Double Dragon приходит на ум где совмещены оба направления без разрывов.
Ещё одно предложение по спрайтам от Monster^Sage с последующей доводкой introspec
Если коротко то формат спрайта меняется на байт маски+уплотненный байт спрайта, в конверторе генерируем маску зная где у нас прозрачный пиксел а где нет. вывод такой:
pop bc ;берём маску в с и уплотненный байтик в b
ld a, (hl) ;берём байт
and c ;накладываем маску
or b ;орим
ld (hl), a ;кладем в экран
Итого 32т на две точки. По итогу сумасшедшее ускорение от моего первоначального варианта.
Я постараюсь всё это оформляю в отдельный опенсорсный движок-TSU, будет 8 спрайтов против 6 в Ringo, размер вырастет на две линии в высоту и плюс ещё 16 маленьких спрайтов 5х5. Также полностью доступны два нижних бордюра на код игры.
тут можно поспорить. call nnnn вполне себе «затолкать в стек непосредственное данное зашитое в инструкцию»
То есть все это источник для референсов тоже предельно понятно. Вот классика emulate.su/2009/konferentsiya-razrabotchikov-kompyuternyh-igr-1979/ постараюсь добавить ее как видео сюда. Смотрите на русском там нормальный перевод. Момент, когда борода под глубокой Бугульмой начинает просто выдавать названия видеоигр. И сравните, как долго другие участники совещание выдавали свои мысли. А борода быстро. Вот он и есть нейросеть. Только нейросеть питается электричеством и работает так, что печени на аналогичное количество Бугульмы не хватит у нас всех вместе взятых. Соответственно, нейросеть не зло, но штука эта очень опасная для неподготовленного мозга. Если кто помнит историю Запилятора то там были детские шутки по сравнении с этими возможностями.
www.youtube.com/watch?v=T2PiUWW2S9c
1) Время (оно решается через более быструю видеокарту с бОльшим объемом памяти. Сейчас у нас карты на 12 Гб, скоро будут на 24 Гб.
2) Мороз должен напрячься. Надо прописывать теги ZXArt в PNG для экспорта.
3) Надо проставлять теги на ZXArt. Более того. Надо все русские теги конвертнуть в латинские на четком и внятном языке вероятного противника.
Для победы этого будет достаточно. Отдельная тема — датасет на полностью Ч/Б и датасет на 53с — последний вообще бомба, но нужны теги.
И да… вот откуда нападения мы не ждали. Можно генерить БК-графику, более того, ее даже УДОБНЕЕ генерить и учить. Такие вот дела.
Проще всего дела обстоят с крупными лицами, пейзажами, зарисовками зданий, крупными легко определяемыми предметами — машина, стул, окно, пистолет, нож.
Если коротко то формат спрайта меняется на байт маски+уплотненный байт спрайта, в конверторе генерируем маску зная где у нас прозрачный пиксел а где нет. вывод такой:
Итого 32т на две точки. По итогу сумасшедшее ускорение от моего первоначального варианта.
Я постараюсь всё это оформляю в отдельный опенсорсный движок-TSU, будет 8 спрайтов против 6 в Ringo, размер вырастет на две линии в высоту и плюс ещё 16 маленьких спрайтов 5х5. Также полностью доступны два нижних бордюра на код игры.