Нейросеть Kandinsky 2.2. Что изменилось в новой версии?

Нейросеть Kandinsky 2.2. Что изменилось в новой версии?

Не успела выйти новая бета-версия нейросети Шедеврум от Яндекса, как подоспела новая версия нейросети Сбера Kandinsky 2.2. Рассмотрю, чем может порадовать пользователя.

Что бросилось в глаза сразу, появилась возможность создания стикера и выбора размера изображения. Помимо пропорции картинки 1:1, теперь можно выбрать и другие варианты: 16:9, 3:2, 2:3, 9:16.

Девушка шаман обнимает белого волка. Нейросеть Kandinsky 2.2
Девушка шаман обнимает белого волка

Новая версия позволяет создать более фотореалистичные изображения, нежели предыдущий вариант, хотя «фотография» зачастую получается несколько размытая. Сколько я ни делала попыток сгенерировать четкую картинку на запрос «мужчина средних лет с бородой в куртке», все портреты получались на одно лицо. Не балует сберовская нейронка разнообразием. Запрос для последнего изображения несколько изменен и расширен.

Мне удобней работать с телеграм-ботом. В нем для создания подобных фото изображений необходимо применять стиль 4k. Если вы предпочитаете сервисы rudalle.ru или fusionbrain.ai, на этих сайтах есть возможность выбрать стили «Портретное фото», «Студийное фото», «Детальное фото». Изображения выходят примерно одинаковые, а если запрос один и тот же, лица похожи.

Теперь я посмотрю, что изменилось, если применить стиль artstation в телеграм-боте. Очевидно, картинка стала более детализированной и точной, хотя косяки в виде кривоватых башенок на деревенских домах остались.

Еще одно сравнение. Беру откровенно неудачную картинку девочки-подростка в стиле artstation, сгенерированную в версии Kandinsky 2.1 (вернее, наименее неудачную — сделала массу попыток, но руки — это сущий кринж), и отправляю тот же запрос в том же стиле.

Получилось не с первого раза. С руками Кандинский 2.2 тоже выдает ляпы. Руки явно разной длины и толщины, временами сливаются. С очками какая-то беда. В новой версии светильники висят где-то за окном, а в старой девочка и вовсе умудрилась зажаться между кухонной мебелью. Зато изображение стало намного позитивней. Я в запросе не указывала, что на столе должны быть мусор, початые банки и бутылки. Плохо, что появилось преобладание кислотных красно-желтых оттенков.

Теперь сравню изображение двух хрюшек, сделанное в стиле 4k. Запросы немного разнятся, но суть одна.

Изображения стали более натуральными, объемными, но на втором изображении снова появился кислотный оттенок, на этот раз желто-зеленый, а также чрезмерная контрастность. Это просто какой-то ужас! Похоже, нереально яркие цвета — это основной недостаток Кандинского 2.2.

Что делать? Добавляю в очередной запрос промт «приглушенное освещение». Это помогло, но недостаточно.

Пейзаж с закатом или восходом солнца — еще одна проблема. Все вокруг совершенно нереально залито красным и желтым цветом. Ну, просто вырвиглазный пейзаж получился!

Река, лес, закат. Нейросеть Kandinsky 2.2.
Река, лес, лето, закат

Пытаюсь исправить ситуацию, применяя промты. Уже намного лучше.

Приглушенного освещения явно оказалось недостаточно. Все равно желтый и оранжевый цвета размазаны по картинке, правда, тона более спокойные. Можно подсказать Кандинскому, на какой фотоаппарат должно быть снято фото. Нейросеть, оказывается, в курсе особенностей фотоаппаратов.

Фото корги у озера, 10 часов утра, лето. Нейросеть Kandinsky 2.2.
Фото корги у озера, 10 часов утра, лето

С изображением корги у озера та же проблема — чересчур насыщенные цвета и большая контрастность. Попытаюсь исправить, добавив в тот же запрос уточняющие промты.

Как видите, получилось. Правда, если в изображении не предусмотрены яркие цвета, дополнительные промты могут и не понадобиться.

Кот в одежде тибетского ламы медитирует, на заднем плане тибетские горы и озеро. Kandinsky 2.2.
Кот в одежде тибетского ламы медитирует, на заднем плане тибетские горы и озеро

Иное дело, если вместо кота посадить лхасского апсо. Эта собачка на Тибете считается маленьким Буддой. Есть поверье, будто в лхасских апсо вселяются на время души лам, которые достигли Нирваны. А посему пусть медитирует.

Другие арты можно посмотреть в галерее ниже.

Еще одно новшество. Телеграм-бот теперь позволяет создавать стикеры. Это очень просто. Если стикер понравился, его можно добавить в свой стикерпак в Телеграм и использовать при общении.

(Всего визитов: 1 975, сегодня: 1)
Поделиться:
Подписаться
Уведомить о
guest
1 Комментарий
Старые
Новые
Межтекстовые Отзывы
Посмотреть все комментарии
Неистовый носорог
Неистовый носорог
9 месяцев назад

В предыдущей версии Кандинский рисовал с*ач и негатив. Новая версия чересчур ванильная. Качество изображений, вроде, возросло, но не знаю, что лучше.

1
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x