Друзья! Позвольте небольшое лирическое отступление, прежде чем углубитесь в чтение. Посмотрите на картину «современная Красная Шапочка», я её сделал при помощи парочки нейросетей (генерация небольшой картинки, а потом раздвигая её дорисовывал опять же в ИИ). Ушло всего несколько минут! А ведь, если постараться можно ещё более интересные и сложные картины рисовать в нейросетях… и возможно кто то даже продаёт их! Да уж, в интересное время мы живем…
Приветствую Вас, уважаемый читатель моего микроблога! Да, я особо не балую свой микроблог новыми публикациями и делаю это в те моменты, когда мне особенно кажется нужным выговорится. Считайте, что такой повод настал — поговорим о нейросетях, которые умеют генерировать изображения!
Ребята — сейчас мы живем в прогрессивное время — куча новых технологий, что в итоге привело к появлению квадрокоптеров, продвинутых электросамокатов и электровелосипедов, различная роботизированная техника (роботы пылесосы, роботы курьеры, роботы голосовые-ассистенты типа «Алисы») и наконец нейросети или как в народе их прозвали, ИИ (Искусственный Интеллект). Так вот, насколько же он интеллект во всех смыслах слова и действительно ли он настолько крут, как его нам описывают? Давайте разберемся…
Мы рассмотрим те, которые умеют генерировать фотографии по текстовому запросу. В настоящий момент известно по крайней мере несколько нейросетей (ИИ), которые завоевали всеобщую популярность, например:
-
- ChatGPT — Иностранный сервис, в настоящее время к нему затруднен доступ из некоторых стран (РФ, РБ и некоторые другие). Считается самым известным и продвинутым из ИИ, способен генерировать картинки, писать тексты на различные темы, помогать в программировании и т.д.
- DALL-E 2 — Иностранный сервис, принадлежит к той же компании, что и ChatGPT, но «заточен» для генерации картинок. Тоже есть проблемы с доступом из некоторых стран, включая РФ.
- Midjourney — Иностранный сервис, но развивается отдельно от ChatGPT. Возможен доступ из всех стран, включая РФ, но в настоящий момент переведен полностью на платную основу.
Эти три сервиса конечно самые известные и по своему крутые, но в России наблюдаются некоторые проблемы с доступом к ним, последний из списка выше и вовсе стал полностью платным. Как быть? Выход один — искать им альтернативу, где нам позволят беспрепятственно пользоваться бесплатно или оплачивать без проблем из РФ и прочих под санкционных стран. И сейчас я дам вам парочку альтернатив подобных онлайн-сервисов, которыми можно пользоваться или бесплатно, или условно-бесплатно, да и с доступом из РФ проблем не возникнет. И чуть подробнее остановимся с работой с ними, но и в то же время не будем особо лезть в дебри…
Leonardo.AI — По части генерации изображений — хороший иностранный аналог вышеперечисленных сервисов, к тому же условно бесплатный. Каждый день тут доступно 150 токенов(монет), чего в принципе достаточно на несколько генераций, а если хочется большего, то сможете купить тарифный план. Выдает вполне качественные изображения с минимумом ошибок в них. Хотя и встречаются конечно неудачные генерации, например с пальцами, но это проблем фактически всех нейросетей. Как я понял, работает данный сервис на базе Stable Diffusion, но использует собственные модели для обучения нейросети. Как и вышеупомянутые сервисы принимает исключительно английские промты (запросы), так что составляйте их в переводчике, а затем английскую версию запроса «скармливаете» нейросети. Главное удобство в том, что никакие дискорды не нужны (пинок в сторону Midjourney ), все управление построено на сайте и всё достаточно интуитивно понятно. Смысла расписывать тут всё это не вижу.
Давайте поглядим на примеры результатов генераций картинок. испробуем три модели ИИ из восьми доступные на текущий момент в Leonardo.AI. Это DreamShaper v5, LeonardoDiffusion и StableDiffusion 2.1…
Нашим тестовым запросом будет что то такое:
very beautiful girl, brown hair, brown eyes, appearance of Hermione, dressed in the female robe of Hogwarts, smiling, against the backdrop of a fabulous landscape, high detail, realism style, hdr
или дословно на русский:
очень красивая девушка, шатенка, карие глаза, внешность Гермионы, одетая в женское одеяние Хогвартса, улыбается, на фоне сказочного пейзажа, высокая детализация, стиль реализм, hdr
Этот же запрос оставим и для других нейросетей, что протестируем в этой статье. И так результаты от Leonardo.AI
Классическая модель от Stable Diffusion показала вполне неплохой результат, ничего лишнего в кадре и главный персонаж (Гермиона) вполне неплохо прорисована. Давайте теперь попробуем модель Leonardo Diffusion, вроде как фирменная модель от самого сервиса…
тоже неплохо, но на мой взгляд фотографа кадр несколько недоэкспонирован, главный объект фото (Гермиона), частично провалилась в тени. Хотя в целом вполне неплохо, я бы даже сказал реалистичнее что ли Давайте теперь поглядим самую продвинутую на мой взгляд модель данного сервиса — DreamShaper v5. Название как бы намекает, что это полностью фирменная модель этого сервиса (раз уж нет слова Diffusion).
Ну вот, тут совсем уже другое дело и лицо девушки можно хорошо разглядеть и её одежду. Вообще эта модель мне чем то напомнила Stable Diffusion 2.1, но с некоторыми доработками. Вообще все три модели в целом справились неплохо. Но у этого сервиса может набраться и парочка минусов, для некоторых людей это может быть критичным. Например оплата, да сейчас вроде никто не жалуется из РФ, но я ничего не могу сказать, не покупал там тариф. Учитывая, что Leonardo.AI скорее всего Французский сервис, то однажды некоторых пользователей он может «обрадовать» некоторыми ограничениями, как по оплате, так и по доступу. Но, повторюсь, сейчас как бы с этим вроде все нормально, но есть ещё одна веская причина показать вам другую альтернативу — русские промты(запросы), да-да именно они! Кому то из вас возможно неудобно постоянно (если плохо владеете английским), перескакивать между окнами нейросети и переводчика, а хочется просто набрать запрос и быстро получить результат… Что ещё? Ну давайте порассуждаем, чего бы мы хотели от нормального сервиса нейросетей по генерации картинок? Вот 5 причин (прям почти как у Игоря Николаева в песне), чтоб нейросеть подошла нам с вами…
- Русские запросы к нейросети прямо из текстового поля приложения Телеграм!
- Нет необходимости врубать VPN и прочие инструменты подмены своего местонахождения
- Быстрая и удобная оплата тарифов нейросети из РФ, без всяких там «плясок с бубном»
- Условно-бесплатный сервис, чтоб давал несколько бесплатных генераций картинок по нашим запросам.
- Чтоб работал быстро, а лучше без всяких там сайтов, прямо внутри телеграмм-мессенджера напрямую!
Кроме того — сервис, который поддерживается русскими программистами, есть специальный общий чат, где все пользователи сервиса общаются. делятся промтами(запросами), показывают друг-другу картинки, тут же в общении принимает активное участие и администрации и разработчики сервиса. Любые ошибки и замечания по сервису они оперативно могут решить — одним словом всегда на связи! Есть ли такой сервис в телеграмм-мессенджере? Конечно! Встречайте и жмите ссылку — ТурбоТекст (TurboText) собственной персоной!
Как стать его ( TurboText )пользователем? Все очень просто, у вас должно быть установлено приложением Telegram, хотя оно почти наверняка у вас уже установлено в телефоне или в планшете. Для удобства советую установить Вам ещё и версию Telegram для Windows (если у вас есть ПК), что позволит вам ещё удобнее пользоваться сервисом. Жмите на указанную ссылку, попадаете в бота данного сервиса, там выполняете просьбу бота подписаться на канал сервиса и… получаете в подарок бесплатные попытки на генерацию!
ВНИМАНИЕ ПРЕДУПРЕЖДЕНИЕ!!! В TurboText действуют достаточно жесткие правила и цензура (хотя на первый взгляд так может не показаться), как в отношении некоторых версий моделей нейросети (например v4), так и в общем чате для общения, где любые ваши возмущения касательно политики проекта, даже если они не будут нарушать цензуру, могут быть восприняты как давление на администрацию и дестабилизацию обстановки в их чате. Поверьте — я уже попал под раздачу, хотя и вел себя там максимально адекватно… Что-ж, сам дурак получается. ))
После чего можете на русском языке писать запросы боту, предварительно выбрав в меню нужный режим, а режимов у него там поверьте много (от генерации текста на разные темы — до картинок и их обработки)! Конечно же есть генерация картинок и для этого там доступно несколько моделей для таких генераций! С подсказок бота вы научитесь там составлять свои первые запросы, кроме такого в этих запросах можно устанавливать параметры, такие-как размер картинки, количество шагов в создании картинки, стиль и т.д.
Давайте протестируем сервис вышеназванным нашим запросом, но на этот раз по русски и пока без дополнительных параметров:
очень красивая девушка, шатенка, карие глаза, внешность Гермионы, одетая в женское одеяние Хогвартса, улыбается, на фоне сказочного пейзажа, высокая детализация, стиль реализм, hdr
Ну вот два результата (если не покупали тариф, то будет один результат) и оба вполне прилично выглядят! Но мне кажется, что нейросеть сделала слишком молодую Гермиону… давайте ей немного возраст поднимем, скажем до 18 лет…
Ну.. совсем другое дело — Гермиона подросла! Но в запросе нет никаких параметров, лишь наши пожелания, а как быть, если мы хотим сгенерировать картинку в определенной модели нейросетей, я выше упоминал же, что их тут несколько (до 4 точно). Давайте добавим к нашему запросу пару параметров, изменим версию модели, а так же укажем явно стиль. По умолчанию, если не указывать ничего — генерация идет в модели 3 версии, давайте укажем 2 версию и стиль реализм…
Замечательно! Как видим Гермиона слегка поменялась как и стиль генерации картинки. На мой взгляд в 3 версии больше деталей и реализма, чем во 2, но у 2 версии есть и свои плюсы, как раз за счет того, что реализма в ней меньше — она выглядит практически как иллюстрация из книги! Кстати о иллюстрациях, а точнее о рисунках… Ведь тут есть модель и для генерации мультяшных изображений — проще говоря рисунки, давайте применим наш запрос и тут, но так-как нам не нужна реалистичность, уберем из запроса все, что с этим связано… Рисованный — это версия 1 в параметре…
Как видим теперь наша Гермиона выглядит более мультяшной и уже реально годится для иллюстрации какой ни будь книги. Если вы заметили здесь и в результатах выше, есть проблема с руками, а особенно с пальцами, но это уже болячка многих ИИ на текущий момент. Да и парапет, на который облокотилась Гермиона, за её спиной прорисован ниже… Поэтому или придется генерировать пока идеальный результат не получится, или обрезать изображение, чтоб руки не попадали в кадр и ретушировать в Фотошопе. Кстати на момент этой статьи не так давно вышла бетка Фотошопа со встроенным ИИ, как раз пальцы рук можно и там исправить попробовать и другие ошибки генерации. Я не буду особо заострять на нем внимание, скажу лишь, что очень мощный инструмент теперь есть в фотошопе и частично может решить проблемы с ретушью некоторых частей фото, как например рук с пальцами, а так же ИИ может дорисовать там недостающую часть изображений (как это видит ИИ нового фотошопа). Но новый Фотошоп я воспринимаю лишь как дополнительный инструмент к TurboText, чтобы исправлять некоторые проблемные картинки, в остальном у того самого нового фотошопа есть как минимум две проблемы.
- Слишком крутой цензор, который может счесть, как то, что вы дорисовываете или исправляете на картинке — является контентом 18+ и т.п. В этом случае он просто выведет сообщение и никаких вам результатов не покажет. И это довольно часто случается…
- Adobe явно прогнулось под натиском BLM активистов, либо самой компанией руководят чернокожие (Афро-Амеркианцы)… Просто 7 из 10 людей, которые вам сгенерирует фотошоп почти наверняка будут эти самые чернокожие, даже если вы уточните этнос и цвет кожи — все равно ИИ Фотошопа будет выдавать представителей народов Африки так или иначе…
Хотя и в самом TurboText есть инструменты для обработки фото, например такие как исправление лица и глаз, добавить или заменить объект на фото, удалить фон, увеличить фото, изменить стиль и т.п. Например можно исправить глаза и лицо в целом (если вы при отправлении запроса не указывали параметр face_restore до этого).
Вот например мне не очень нравится как ИИ нарисовал лицо этой Гермионы:
Как видим глаза не совсем выразительные, да и зубки тоже… Давайте исправим!
А вот и результат! Круто правда? И без всякого фотошопа за несколько секунд! Так что мой вердикт, что самая доступная и лучшая нейросеть доступная для Российских и Белорусских пользователей — это TurboText, а новый фотошоп с ИИ просто считайте бонусом к указанному сервису!*
*UPD (27.09..2023) В новой версии фотошопа «халяву» прикрыли и теперь генеративная заливка (функция ИИ рисования) без официальной лицензии не будет работать. Путей решения для возвращения «халявы» пока не известно, точнее оно есть, но придется каждый месяц создавать новый аккаунт для «Триального периода». Если Вам известны пути решения, пишите в комментариях, я тогда добавлю в эту статью.
Ну и теперь подведем небольшой итог и ответим на вопросы, так ли страшен этот ИИ, как о нем многие говорят, что скоро Скайнет из Терминатора станет реальностью… Нет и ещё раз нет, до искусственного разума нам ещё » -как раком до Луны» или куда то там ещё… То, что мы сегодня с Вами протестировали не является панацеей и чем то фантастическим, которое «завтра» поставит человечество на колени, а просто набор программного кода с алгоритмами обработки, которые заранее определены и срабатывают на ключевые запросы, т.е. как любой поисковик работает (гугл, яндекс и т.п.) и выдает нам результат. Получается по этой же логике поисковики тоже можно назвать ИИ? Все эти нейросети просто более продвинутая версия поисковиков, в алгоритмы которых заложены методы обработки изображений, опираясь на эталонные референсы реальных картинок, если хотите примитивная версия программного «мозга». Хотя да, технология крутая и позволяет на наши запросы получать вполне интересные результаты, которые могут использовать фотографы, дизайнеры, художники, веб-дизайнеры и другие творческие люди в своей работе. Мне как фотографу например удобно использовать нейросети для оформления обложек альбомов, чтоб объект съемок гармонично вписать в сказочный пейзаж и «одеть» в более сказочную одежду…
Мой вердикт- человечеству пока никакой ИИ не угрожает и чтоб перейти эту пресловутую черту под названием свобода воли и свобода принятия решений машиной — ещё очень-очень далеко. Никакой пресловутый «Скайнет» нам не грозит, но проблема в другом… Учитывая, что данная технология позволяет достаточно качественно манипулировать медиа-контентом — изготовить любое фото или видео, на котором можно внедрить любого известного персонажа, например точную копию известного политического деятеля, а учитывая, что нейросети ещё могут имитировать любой голос — тогда это уже серьезное информационное оружие (Скайнет отдыхает). Таких видео с дипфейками (DeepFake) уже полно на том же YouTube. Технология нейросетей продолжает развиваться, то возникают достаточно тревожные мысли, ведь в обозримом будущем любой компромат на реального человека можно будет сделать как говорится «по щелчку пальцев». В этой части некоторые фантастические фильмы уже могут начать сбываться. Хотя надеюсь, что придумают механизм контроля такого контента, созданного нейросетями и нам ничего не угрожает, включая и войны с машинами…
Так что желаю всем нам и нашим близким хорошего здоровья, долгой жизни и мирного неба над головой! Для тех, кто из наших подписчиков здесь, дочитал статью до этого абзаца в комментариях есть возможность задать вопрос или просто оставить свой отзыв, а если вы желаете прочитать полную версию этой статьи с бонусным контентом, то приглашаю вас к первоисточнику этой статьи, там, сразу после этого абзаца я расскажу о возможности совершенно бесплатно использовать нейросеть прямо на своем компьютере неограниченное количество раз! Главное, чтоб ваша «железка» была достаточно мощной, а особенно видеокарта… Там уже все пользователи Телеграм могут под статьёй оставить свои отзывы.
А ТЕПЕРЬ БОНУСНЫЙ КОНТЕНТ!
Да, вероятно для кого то это уже не новость и название такой ИИ — Stable Diffusion WebUI с интерфейсом от AUTOMATIC1111 (или ему подобные), программный комплекс с локальным веб-интерфейсом, о котором в сети интернет уже написано немало статьей и обзоров, поэтому не станем углубляться в дебри, что это такое и как работает (в конце этой статьи вас ждет подробное видео по этой теме от нашего коллеги). Рассмотрим просто один из вариантов такой сборки, благо есть масса вариантов, а мы выберем наиболее удобный из них в установке и использовании. И кратко пройдемся по нему…
По сути установка будет проходит как инсталляция любого ПО на ваш компьютер, но есть достаточно весомые требования к вашему «железу», перечислю основные:
- Много оперативной памяти, лучше 32ГБ (у меня 48ГБ), минимум 16ГБ. Если у вас меньше оперативной памяти, то как говорят, в принципе может и её хватить (что и не факт)
- Шустрый и желательно многопоточный процессор, в моем случае i7 6850K 6 ядер и 12 потоков (всякие там старенькие целероны и пентиумы могут просто стать узким звеном в быстродействии при генерации изображений)
- И самое ВАЖНОЕ — видеокарта! рекомендуется именно NVIDIA с её CUDA ядрами и рекомендуемый минимум видеопамяти 6ГБ. Я например использую GTX1080TI, карта хотя и не новая, но с её 11ГБ вполне хорошо справляется с генерациями. Более новая и мощная карта только приветствуется! AMD карты тоже могут работать, но не так быстро (как отмечают в некоторых источниках).
И так, если вы уверены в своей конфигурации компьютера, тогда давайте скачаем одну из удобных сборок со Stable Diffusion WebUI с интерфейсом от AUTOMATIC1111. Жмем на ссылку ниже и попадаем на страничку GitHab…
Версия Stable Diffusion Portable
Видим примерно следующее:
Видите там эту зеленую кнопочку «Code»? Смело жмем по ней и она раскроется, там ниже читаем «Download ZIP», тоже смело жмем и скачиваем…
В итоге получаем архив «stable-diffusion-portable-main.zip», распаковываем его в любое удобное место на вашем компьютере, но желательно, чтоб путь к этому месту был не длинный от корня диска и не содержал русских названий папок. В идеале чтоб папка stable-diffusion-portable-main была как можно ближе к букве диска… Например «G:stable-diffusion-portable-main»… Ну и заходим внутрь этой папки и видим следующее:
Видите в списке файл «webui-user.bat» Смело запускаем его и НИКАКИХ там с правами администратора, а просто запускаем (дважды кликнув по нему)… Файл начнет выполнятся и устанавливать-подтягивать все необходимые компоненты сборки. Вам нужно просто запастись терпением и ждать, пока вас не пригласит проследовать на страничку под адресом «127.0.0.1:7860». Вообще именно в этой сборке по окончании установки автор позаботился, чтоб вас перекинуло на указанную страничку автоматически, если этого не случилось, закрываем окошко и открываем в любом текстовом редакторе (блокноте) файл webui-user.bat и приводим одну из строчек к такому виду:
set COMMANDLINE_ARGS=--xformers --autolaunch
После этого сохраняем файл и запускаем его! В итоге попадаем в веб-интерфейс программы, который выглядит как сайт, где мы можем наблюдать органы управления нашей с вами нейросетью. Да да! Теперь у вас есть своя нейросеть, со своим блекджеком и т.д. =) Давайте начнем наше первое знакомство с ней…
И так, теперь протестируем её нашим запросом, но на английском языке, русский по умолчанию не поддерживается, но можно установить бесплатный мод чтоб подключить API того же Яндекса или Гугла, но эти два сервиса данную возможность уже предоставляют на платной основе. Так что будем ручками через переводчик составлять запрос:
very beautiful girl, brown hair, brown eyes, appearance of Hermione, dressed in the female robe of Hogwarts, smiling, against the backdrop of a fabulous landscape, high detail, realism style, hdr
Вписываем этот запрос в основное поле «Promt», ниже мы видим поле «Negative Promt», в нем тоже пишем на английском, но то, что мы не хотим увидеть в результате (искажения тела, пальцев и т.д.) Давайте и его заполним, что я уже и сделал кстати, даже к некоторым добавив скобки и указав вес — это цифры через двоеточия. это можно указать. Впрочем управлять весом и вставлять часть слов в скобки можно и в главном запросе тоже. Так, перед тем, как начнем генреацию поглядим какой модуль у нас подключен, скорее всего в вашем случае по умолчанию будет установлен «v1-5-pruned-emaonly.safetensors»
С уважением Ваш «покорный слуга» — Виталий Ч.
Давайте нажмем кнопку «Generate», чтобы проверить, а работает ли наша нейросеть? Должен побежать ползунок прогресса выполнения генерации, а в консоли (в том самом окошке, где был процесс установки тоже будет виден процесс текущей генерации) и в итоге увидим примерно следующее:
Поздравляю! У нас с вами получилась первая генерация нейросети и при этом бесплатно! При этом бесплатных попыток у нас с Вами теперь столько… насколько хватит вас самих = ). Ладно, а теперь давайте установим ещё одну популярную модель нейросетей и применим некоторые настройки к нашей новой генерации. Установим популярную модель Deliberate v2, которую можете скачать ТУТ. После скачивания файла «deliberate_v2.safetensors», копируем его и помещаем в одну из папок нашей нейросети по следующему пути:
"G:stable-diffusion-portable-mainmodelsStable-diffusion"
В вашем случае путь и буква могут немного отличаться, но сути не меняет. Теперь переходим в веб-интерфейс программы и обновляем список моделей, нажав на эту кнопочку, после чего можем выбрать из списка нашу новую модель нейросети:
Основной запрос и негатив-промт оставим те же, но теперь изменим разрешение картинки (повысим немного его) и изменим ещё некоторые параметры, такие как метод семлинга (Sampling method) и скейлинг (CFG Scale), также можно задать нужное количество шагов при генерации (Sampling steps). Теперь жмем генерацию и видим следующий результат, но уже на новой модели…
И вот теперь мы видим наш новый результат на другой модели, но на самом деле мне пришлось несколько генераций забраковать и причину этого вы можете увидеть во втором поле, где я добавил «two head». Да, именно — тут тоже есть «болячки» всех нейросетей, как с прорисовкой пальцев рук и даже дубликаты голов и людей. Для этого необходимо как раз в поле Negative Promt пробовать избавляться от того, что так назойливо лезет в кадр. Универсального способа нет, нужно всегда пробовать самим подбирать запрос и если нужно заключать в скобки — в несколько скобок и ещё добавлять вес. Есть ещё масса настроек в этой программе, такие как Seed, Scripts, Styles и инструменты для работы с картинками в других вкладках программы и много, много ещё чего. А впрочем…
Что-ж, основные моменты этой программы я вам рассказал в этой статье и первое знакомство с ней можно считать, что уже состоялось. Добавлю лишь несколько полезных ссылок от себя:
Лучшие Models для Stable Diffusion 2023
22 модели для Stable Diffusion
И более наглядно и подробно обо всём этом и ещё несколько полезных ссылок даст по теме и Вам расскажет наш коллега в видео ниже.
А Я желаю Вам всего наилучшего и творческих успехов! Ваш Виталий Ч.
PS: На мой взгляд все же более реалистично рисует фото нейросеть от TurboText, по сравнению со Stable Diffusion WebUI (зато последний бесплатный и неограниченный)
Приветы! нейросети это круто!