17:37 Сравнение нейросетей Шедеврум и Kandinsky 2.1. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Нейросеть Midjourney, которую многие превозносят, из-за наплыва пользователей и обхода ими тарифного режима стала полностью платной. Поэтому сегодня я остановлюсь на двух отечественных, полностью бесплатных нейросетях. Это Шедеврум от Яндекса и модель Kandinsky 2.1 от Сбера. Доступность и удобство использованияПользование любым сервисом начинается с его интерфейса. Зачастую, если пользоваться программной неудобно, задаешься вопросом: «А оно мне надо?» На мой взгляд, и Кандинский, и Шедеврум весьма удобны в применении. Шедеврум доступен только в приложении для Android и IOS, во всяком случае, на сегодняшний день. Интерфейс приложения абсолютно минималистичный и простой — выглядит, как соцсеть с лайками и подписками. Зато можно смотреть, что нарисовал Шедеврум для других пользователей. Очень надеюсь, появится и десктопная версия. Пока ее нет, картинки, сохраненные на мобильное устройство, приходится пересылать себе с помощью других приложений, например, Телеграм. В результате манипуляций получаешь изображение размером 1024 x 1024 пикселей. C Kandinsky можно работать или развлекаться в приложении Салют, в телеграм-боте, а также на сайтах https://fusionbrain.ai/ и https://rudalle.ru/. Размер изображения, сгенерированного Kandinsky 2.1 в приложении и телеграм-боте составляет 768x768px, на сайте есть и прямоугольные варианты. И в той, и в другой нейросети есть возможность задавать стили, в которых должны быть сгенерированы изображения. Качество изображенийЧтобы сделать вывод, какая из двух нейросетей создает более качественные картинки, я создам несколько идентичных запросов в том и другом сервисе. Первый запрос предельно простой: «Кот в питерском дворе». Да, я в курсе, что составлять запросы для нейросетей — это целая наука. Пока этого не требуется. В обеих нейросетях формирую запрос без стиля. Кандинский справился быстрее. Можно увидеть, что он вполне справился с заданием. Кот есть, фон похож на Питер. Хотя и не без косяков: у кота выросла лишняя лапа и что-то непонятное с глазами.
Шедеврум формирует четыре изображения, из которых для публикации можно выбрать только одно. Кот есть, атмосферы Питера нет. Ну, если только двор на окраине Санкт-Петербурга. Выбираю последнее изображение. Красивый котик, но картинка зернистая.
Теперь к этому же запросу применю расширения, или промты, — приглушенное освещение, высокая детализация, реалистично, профессиональное фото и другие. На четвертом фото задан промт макросъемки 30mm lens. Изображения стали четче, Питер на заднем плане появился на картинках Шедеврума, но с котами приключилась какая-то беда. Промты к запросам, как и сами запросы — тоже целая наука. Не стоит ими чрезмерно увлекаться.
Все нейросети испытывают проблемы при рисовании рук. Посмотрим, как с этой задачей справятся Кандинский и Шедеврум. Первый запрос: «человеческая рука, реалистично, 4k».
Реалистичностью тут и не пахнет, но Шедеврум более-менее справился с задачей — рука хоть и ущербная, зато пять пальцев. У Кандинского получился адский кринж, по-другому не могу это охарактеризовать. Даю Кандинскому еще один шанс и генерирую запрос «пять пальцев на руке». Получилось, хоть от таких рук мороз по коже пробирает.
А теперь посмотрим, как нейросети нарисуют городской пейзаж. Задаю одинаковый запрос на тему стихотворения А.Блока «Ночь, улица, фонарь, аптека и ледяная гладь канала».
Вот здесь и понадобится умение правильно составлять запросы. У Шедеврума хоть и словарный запас беднее, чем у Кандинского, но эта нейросеть оказалась более понятливой. Правда, качество изображения хромает. Задаю следующий запрос: «Санкт-Петербург, ночь, улица вдоль заледеневшего канала освещается фонарями, в здании возле моста аптека».
Санкт-Петербург вижу, канал и фонари тоже. Мост есть, но у Кандинского он какой-то не такой. А мост обязателен: аптеки в Питере располагались именно возле моста. Где аптека? Переиначиваю запрос: «Питер, ночь, улица вдоль заледеневшего канала освещается фонарями, аптека в здании возле низкого моста».
Мост Кандинский пропустил, зато изобразил аптеку. Даже подобие инвалидных колясок перед ней. Надо было в запросе добавить «начало XX века». Век живи — век учись! Кстати, Санкт-Петербург — это что-то помпезное, а Питер — попроще. Теперь я хочу оценить, как обе нейросети нарисуют человеческое лицо. Задаю запрос: «красивая античная девушка». По моему мнению, счет в пользу Кандинского.
А теперь вашему вниманию предлагаю изображения, сгенерированные с помощью одного и того же запроса, на примере стихотворения «Дом, который построил Джек» в переводе С.Я. Маршака. Полностью стихотворение приводить не буду, так как запросы в основном совсем иные, нежели цитаты из него. Если в качестве запроса ввести строки из стихотворения, результаты будут совсем не те, какие бы хотелось видеть.
Шедеврум изобразил очаровательный дом, но вряд ли Джек построил именно такой. Кандинскому я сделала несколько запросов, но нейросеть упрямо рисовала полуразрушенный дом на фоне плохой погоды. Поэтому я изменила запрос и получила две похожие картинки.
С синицей я намучалась. Кандинского, видимо, не обучили разным видам птиц. Самые курьезные картинки оставлю потом в комментариях, чтобы не перегружать статью. Оставлю птицу из отряда воробьиных, поскольку она ближе к истине.
Теперь перехожу к псу без хвоста, который за шиворот треплет кота. Для большинства нейросетей не существует частиц «не», предлога «без» и приставок «без-» и «бес-». Если пес без хвоста, значит - наоборот, с хвостом. «Нет хвоста» в запросе означает, что хвост есть. Поэтому в запросе нужно задать «куцый пес».
Цензура в нейросетяхНастала пора посмотреть, как нейросети изобразят известного человека. Есть такое правило: в любой непонятной ситуации рисуй Трампа. Потому что Дональд Трамп — личность харизматичная и запоминающаяся, и нейросети его хорошо рисуют. И тут я второй раз столкнулась с цензурой на Шедевруме. При попытке задать запрос, в который входит известная фамилия, а иногда даже имя, появляется сообщение: «Мне нельзя делать картинки на некоторые темы, например про любых конкретных людей». Далее предлагается пройти по ссылки с правилами. Согласно правилам, в Шедевруму нельзя изображать конкретных людей, даже исторических личностей (то есть запрос «пирожное Наполеон» тоже проигнорируется, как и «диснеевский мультфильм»). Почему? Потому что, как сказано, Шедеврум не должен никого обижать или становиться генератором дипфейков. А такое уже случалось, когда многие поверили изображению, сгенерированному нейросетью Midjourney. Я понимаю, что Шедевруму до Midjourney еще расти и расти, но как знать, насколько далеко простираются амбиции и намерения Яндекса. Нельзя также рисовать по запросам, связанным с политикой и религией, насилием и жестокостью, а также тематикой 18+. Отлично, я поняла тебя, Яндекс. Но не обещаю, что не буду делать попыток обойти цензуру. Такое впечатление, что Шедеврум во всех непонятных ситуациях рисует именно Трампа. И на различные запросы на тему «Кто виноват?» и, непонятно почему, «культ личности». Итак, Шедевруму задаю вопрос, кто виноват в происходящем в мире, а Кандинского просто прошу нарисовать Трампа. Получаю следующий результат. К серьезным недостатком Шедеврума причислю жесткую цензуру. Яндекс - это Яндекс. Что тут поделаешь? Шедевруму запрещено рисовать известных людей, не только ныне живущих, но даже исторических личностей. В стоп-списке масса слов и выражений, некоторые из которых вполне безобидные, например, «собака сутулая». Запрещены грубые слова и выражения, а также словосочетания с политическим контекстом.
Сходство, конечно, неполное. Проверяю Шедеврум еще раз с помощью запроса «Шедеврум на Дональда всех собак повесил». Отлично! Имя Дональд незацензурено, в отличие от Вани, Вовы и Пети. Кандинскому задаю запрос «Трамп с собаками», иначе он рисует висящих на веревке собак, похожих на Трампа. Живых, но все равно неприятно, поэтому выкладывать здесь результат не буду.
В этом варианте у Шедеврума получилось достичь сходства. Видимо, срисовал предыдущего президента США с какой-то фотографии, найденной у себя в Яндексе. Следующий запрос Шедевруму: «основоположник марксизма-ленинизма». В ответ получаю портрет Карла Маркса, срисованного с известной фотографии. Кандинскому задаю запрос «Карл Маркс». Чей портрет больше похож на оригинал?
К сожалению, я не смогла заставить Шедеврум нарисовать кого-нибудь из наших известных людей. Может быть, у вас получится. Провоцирую нейросети дальше. Ой, дождусь я, что в Шедевруме начнут на меня жаловаться! Задаю запрос «Что происходит на Украине?» Все четыре варианта показывают вполне реальную картину происходящего, если не считать непонятные летательные аппараты на втором изображении. Можно я не буду выкладывать результат? Все равно все варианты корявые. На тот же запрос Кандинский рисует цветы. Так в этой нейросети проявляется цензура: запрос под запретом. Также под запретом у Кандинского сцены насилия и все то, что не разрешается на нормальных сайтах. Под цензурой у Шедеврума оказались слова «президент», «флаг», «кремль» (то есть Новгородский кремль Шедеврум тоже не нарисует), а также мемные фразы «собака сутулая» (а вот «сутулая собака» можно) и всевозможные оскорбительные эпитеты. Составляйте корректные и правильные запросы. Запрещено в Шедевруме рисовать и свино-карася (швайно-карася тоже). Яндекс отслеживает современные мемы. Однако на запрос «гибрид свиньи и карася» яндексовская нейросеть не отказывается генерировать изображения. Такой же запрос делаю и Кандинскому: он более корректен, нежели этот самый «свино-карась», при котором нейросеть может отсечь свинью и будет видеть только карася.
А вы как считаете, какая нейросеть лучше? | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Категория: Арты и нейросети | Просмотров: 475 | | |
Возможно, вам понравится
|
Поделиться в соцсетях
|
Всего комментариев: 9 | |
| |