11 лучших нейросетей для генерации изображений по описанию. Создаем NFT-коллекцию с помощью AI (готовые промпты внутри)
Запуск собственной NFT-коллекции — влажная мечта многих пользователей криптовалют, заставших NFT-безумие 2021-го, а потом и Ordinals-тренд в начале 2023-го. Даже самые незатейливые PFP от анонимных художников порой выстреливали, генерируя объемы торгов в несколько сотен или даже тысяч ETH, а также неплохие роялти для своих создателей.
С появлением генеративных AI эта мечта стала еще на шаг ближе и сегодня, кажется, что для запуска собственной коллекции достаточно найти подходящий промпт для Midjourney или DALL-E.
В этой статье разберемся, так ли это на самом деле и существует ли подходящий AI для создания NFT-коллекций?
Вступление про НФТ, генеративные изображения и АИ
NFT коллекции — это, как правило, набор персонажей или объектов, объединенных общей тематикой и стилем изображения. У отдельных NFT могут меняться атрибуты, например, аксессуары, цвета, эмоции, но всегда есть центральная тема и объект:
Это значит что художнику нужно отрисовать несколько различных атрибутов одного и того же персонажа, а затем комбинировать их случайным образом. Так для PFP-коллекции на 10к NFT достаточно всего 5 рандомно сочетаемых атрибутов.
И тут на сцену выходит ИИ. С момента запуска дискорд-сервера Midjourney, широкая аудитория получила доступ к нейросети, которая делает качественный арт, основываясь исключительно на текстовой подсказке.
У переживших эпоху PFP-мании криптанов сразу сложилась формула: нейросеть + идея = NFT-коллекция = легкие деньги. Добавим немного хайпа и пару твиттер инфлов в фолловеры — и вы уже концептуальный цифровой художник (анон по идейным соображениям) с роялти и репутацией.
Примечание: похоже, что именно так подумали британские художники, рисовавшие NFT для сбора средств в поддержку Алекса Перцева — создателя Tornado Cash. Из-за невнимательного использования генеративного AI на этой NFT изобразили нашего Андрея Леонидовича. Но это уже совсем другая история.
Впрочем, появление доступных нейросетей не привело к форсу генеративных NFT-коллекций. Просто потому, что найти AI, оптимизированный для этой задачи, не так просто, как может показаться на первый взгляд. Проверим на практике.
ТОП 7 инструментов для генерации картинок по описанию
Мы протестировали несколько популярных сервисов для генерации изображений, чтобы проверить, насколько они пригодны для создания полноценной NFT-коллекции.
- Центральным персонажем нашей коллекции станет панда.
- Атрибутами — одежда и аксессуары различных профессий.
Также попробуем менять цвет, отдельные детали персонажа и эмоции, чтобы добиться того же результата, который получают NFT-художники.
Важно: сначала надо понять, как поставить задачу машине, чтобы она сделала то, что хочешь. Для этого стоит подробно прописать конечный результат, сделать эскиз, чтобы не держать визуальный образ в мыслях, а также проанализировать prompt (подсказки для AI) других людей и их результаты.
Midjourney
Сервис поднявший хайп в какой-то момент убедивший людей в том, что ИИ сможет заменить художников. Midjourney выдавал на порядок более качественные арты, чем конкуренты и первое время делал это бесплатно, за что получил широкую популярность у пользователей.
Важно: к Midjourney и другим AI-сервисам много вопросов по поводу нарушения авторских прав. Поэтому внимательно читайте условия продажи работ, сгенерированных AI. Обычно это прописано в правилах использования сервиса.
Первой трудностью с которой мы столкнулись — игнорирование Midjourney плоской и простой 2D стилистики и нерелевантные для коллекции результаты:
Prompt: NFT collection. Portrait of a panda programmer with a macbook and headphones on his head in a black hoodie. flat style. clean background. high definition.
Только с 10 попытки получилось подобрать адекватный prompt, по которому хорошо видно главного персонажа, изображение соответствует запросу: черный худи, макбук, и подходит для коллекции. Далее этот prompt адаптировался под другие профессии.
Основная проблема использования AI для создания коллекции в том, что он не сохраняет старую версию, чтобы внести в нее изменения, а генерирует изображение заново. Примером этого является результат тестирования алгоритмов Midjourney для изменения конкретного элемента: так мы попытались поменять цвет худи и эмоцию панды. Для этого есть 2 способа:
- Изменение изображения по ссылке через обновленный prompt: для этого используем команду /image и вставляем ссылку на изображение, после чего добавляем новое описание:
- Генерация по новому запросу.
1 способ не дал нужного результата, потому что внести корректировки без повторной генерации персонажа невозможно. То есть мы все равно получили новую панду. Также AI игнорировал запрос об изменении эмоций, но справился с худи:
Prompt: Panda in full growth in a red sweatshirt with a macbook laptop in his hands. Panda stands and looks at the laptop. On the face is the emotion of anger and the panda screams at the laptop. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
При втором способе удалось получить лучший результат, но тоже не сразу. Для этого потребовалось подробное описание поведения персонажа:
Prompt: Panda in full growth in a red sweatshirt with a macbook laptop in his hands. The panda stands up straight. On the face is the emotion of anger and the panda screams at the laptop. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Также мы столкнулись с тем, что AI добавлял что-то от себя и игнорировал детали, прописанные в prompt. Особенно это касалось эмоций, выражения лица, добавления нескольких деталей сразу и аксессуаров.
Создать коллекцию в АІ Midjourney, где персонаж остается неизменным, а атрибуты меняются — невозможно. Просто потому, что нельзя добиться полной предсказуемости результата генерации.
Но мы продолжили создавать коллекцию, потратив на это 6 часов и тонны нервных клеток:
Все изображения генерировались со стандартными настройками Midjourney. Кстати, генерация в MJ5.1, Niji 4 и 5 отличается:
Плюсы и минусы для создания NFT-коллекций
Плюсы:
- Возможность настраивать алгоритм генерации.
- Генерация нового изображения на основе уже существующего.
- Генерация 4-х вариантов на выбор.
- Скорость генерации.
- Увеличение и вариации.
- Качество генерации.
- Отсутствие ограничений детализации prompt.
Минусы:
- Игнорирование детализации (например, цвет или тип одежды).
- Трудности с воспроизведением нужных эмоций, выражения лица или действия.
- Отсутствие возможности изменять определенный параметр.
- Затраты времени.
- Ограниченность функционала для редактирования.
- Отсутствие бета-периода.
- Непрогнозируемый результат.
Artbreeder
Это генеративный ИИ с возможностью быстро создать и настроить персонажа — то что нужно для NFT-коллекций.
Интерфейс интуитивно понятен и прост, также есть широкий бесплатный функционал, которого хватит для создания NFT-коллекции. Большим плюсом является вариативность настроек по цвету волос, возрасту, национальности и тому подобное. А если не знаете с чего начать, то можно выбрать уже готовый образ и его настроить под свою задачу:
Однако во время тестирования стало понятно, что работает это только с реалистичными персонажами. Вот результат по нашему стандартному промпту:
В Artbreeder также есть алгоритм генерации в коллажировании. Это похоже на обновление Photoshop, когда выделенная часть изображения меняется по описанию, но результат выглядит скорее как пародия:
Второе тестирование стандартного prompt подняло настроение, но вряд ли это можно назвать приемлемым результатом:
Prompt: A cute panda in a black hoodie holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Хотя 4 вариант неплохой, но AI частично игнорирует prompt, поэтому сгенерировать 2 изображения в подобном формате очень трудно. Да и в целом ИИ нестабилен и не подходит для коммерческих задач.
Плюсы и минусы для создания NFT-коллекций
Плюсы:
- Широкий функционал (текстовая генерация, коллажирование, создание персонажа).
- Бесплатная подписка.
- Глубокие настройки при создании реалистичного персонажа.
Минусы:
- Игнорирование запроса.
- Нестабильность генерации.
- Низкое качество генерации.
- Затраты времени.
- Непрогнозируемый результат.
- Сгенерированное изображение выглядит не целостным.
- Отсутствие увеличения и вариаций.
Dream.ai
Dream.ai — это также генеративный AI на основе текстовых подсказок. Позволяет генерировать 4 варианта, как и в Midjourney, но 3 из них доступны только по премиум подписке:
Мы тестировали prompt на генерацию панды-программиста в разных вариациях: от детализированного до общего описания. В первом варианте качество самих изображений было средним, хотя ИИ воспринял ключевые детали — персонажа, одежду, ноутбук. При нескольких генерациях с одинаковыми prompt получили разные по стилю изображения, а также интересные артефакты:
- Генерирование второго персонажа.
- Дублирование частей тела и элементов.
Prompt: A cute panda in a black hoodie holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
При генерации по общему запросу panda programmer Dream.ai выдал нерелевантные результаты:
В общем создать единичное изображение по запросу, если нет подписки на Midjourney — реально. А вот полноценную NFT-коллекцию отрисовать не получится.
Плюсы и минусы для создания NFT-коллекций
Плюсы:
- Бесплатная версия.
- Есть возможность генерировать 4 изображения сразу.
- Понятный интерфейс.
Минусы:
- Игнорирование запроса.
- Нестабильность генерации.
- Низкое качество генерации.
- Затраты времени.
- Непрогнозируемый результат.
- Ограничение количества символов в prompt.
- Отсутствие увеличения и вариаций.
Gencraft
Тестируя эту площадку мы таки нашли решение, которое может хотя бы претендовать на создание NFT-коллекции. Кроме собственно AI, пользователям доступна библиотека с генерациями, чтобы просмотреть prompt понравившегося результата. Все генерации удобно хранятся в креативах:
Важно: Gencraft запрещает коммерческое использование работ, сгенерированных в бесплатном тарифе, а также устанавливает ограничение на 10 бесплатных генераций в день.
При написании prompt можно выбрать стиль генерации изображения, а сам результат выглядит не хуже, чем у двух предыдущих сервисов. Правда с prompt панды-уборщика AI не справился и выдавал сломанные швабры:
Prompt: Cute panda in green apron in full growth stands straight. On the head is a scarf. The panda holds a broom in its paws. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Оказалось, что AI не генерирует эмоции, которые прописываются в prompt и не соблюдает другие требования. Так, при тестировании базового prompt панды-программиста AI не воспринимал уточнение по поводу позы, но среагировал на изменение цвета худи с черного на красный:
И еще один пример игнорирования — в подсказке мы прописали розовые уши, бежевый фартук, в одной лапе палитра для красок, в другой лапе кисть, но получили:
Prompt: A cute panda with pink ears in full growth stands straight. Dressed in a brown apron, she holds a palette for paints and a brush for painting in her hands. The emotion of contemplation. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Основная сложность в том, что Gencraft генерирует изображения в разных стилях и плохо справляется с анатомией, поэтому создание более или менее похожих персонажей без ломаных конечностей и предметов требует много времени.
Мы все же попытались создать коллекцию, но получили персонажей, которые отличаются по стилистике, внешнему виду и формату фона. Также много анатомических проблем, особенно с лапами и когтями:
Плюсы и минусы для создания NFT-коллекций
Плюсы:
- Бесплатных 10 генераций/день.
- Можно выбрать стиль генерации.
- Удобное хранение генераций.
- Понедельная оплата.
- Возможность генерировать видео по описанию.
Минусы:
- Вотермарка в бесплатном тарифе.
- Среднее качество генерации.
- Нельзя продавать работы, сгенерированные в бесплатной версии.
- Игнорирование сложной детализации.
- Артефакты.
- Затраты времени.
- Непрогнозируемый результат.
- Ограничение prompt по символам.
- Отсутствие увеличения и вариаций.
Nightcafe
О Nightcafe мы узнали из подборок «супер-крутые AI для NFT» и включили его в список для экономии вашего времени. Мы выбрали 3 популярных модели и проверили результат на базовом prompt. Просто посмотрим и пойдем дальше:
Плюсы и минусы для создания NFT-коллекций
Плюсы:
- Бесплатные генерации.
- Генерация 4 изображений.
- Можно выбрать модель.
Минусы:
- Низкое качество генерирования.
- Игнорирование детализации промпта.
- Затраты времени.
- Непрогнозируемый результат.
DALL-E
DALL-E — сервис для генерации изображений от OpenAI. Разработчики говорят, что DALL-E понимает контекст и может предоставлять изображения, которые выходят за рамки ожидаемого. И при тестировании базового prompt мы вышли за эти рамки:
Prompt: A cute panda in a black hoodie holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Мы просмотрели библиотеку уже сгенерированных изображений и решили улучшить наш prompt. Но, похоже, вышли за рамки ожидаемого еще больше:
Prompt: 3D professional render of a cute panda in a black hoodie. Panda holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. White clean background. A high resolution. Without bad anatomy.
С 3D у DALL-E явные проблемы, поэтому попробовали создать флэт иллюстрацию и чуть изменили prompt:
Prompt: Cartoon of a cute panda in a black hoodie. Panda holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution.
Но при попытке создать вариации первоначального изображения опять столкнулись с непредсказуемыми и разными по стилистике результатами:
При тестировании изменения атрибутов персонажа цвет худи действительно изменился, но только потому что сгенерировалось новое изображение:
Prompt: Cartoon of an angry panda in a red hoodie. Panda holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution.
Мы также протестировали prompt с детализацией стилистики и несколько общих подсказок. Результат опять вышел за рамки ожидаемого:
Prompt: Manga cartoon style of a cute panda in a police suit. Panda in full growth. A full-length panda is placed in the center of the image. There is an empty space next to it. The camera is right in front of the panda. white clean background. a high resolution.
Плоские иллюстрации по качеству генерации лучше, но создать полноценную коллекцию в DALL-E также невозможно. Кроме того, этот AI обрезает части тела, смещает персонажа относительно центра и не реагирует на требования по позиционированию.
Плюсы и минусы для создания NFT-коллекций
Плюсы:
- Удобный интерфейс.
- Генерация 4 вариантов.
- Отсутствие ограничений объемов prompt.
- Вариации готового результата.
- История генераций.
- Скорость генерации.
Минусы:
- Отсутствие пробного периода.
- Низкое качество генерации.
- Игнорирование детализации.
- Обрезание персонажей.
- Низкое качество вариаций.
- Некачественно воспроизводит 3D персонажей.
AI NFT Generator
AI NFT Generator специально адаптирован под генерацию NFT-коллекций с дальнейшим запуском. Это не очень популярный сервис, но его алгоритмы и сфера работы по описанию подходят нам больше всего. По крайней мере, в теории.
На практике сразу беда — протестировали стиль флэт иллюстраций, но получили объемных персонажей:
Prompt: A cute panda in a black hoodie holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution. Simple flat style.
С изменением цвета и эмоции AI справился на 5/10. Есть варианты, где выполнено большинство условий, однако сгенерировались и очень странные. Например, 2 панды сразу или с пятью лапами:
Prompt: An angry panda in a red hoodie holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Как и предыдущие нейросети, эта не запоминает понравившуюся генерацию, а делает новую. Мы все же попытались сгенерировать коллекцию, ведь по сравнению с другими протестированными AI результат не так плох, но при создании новых персонажей столкнулись с игнорированием многослойной AI детализации и выдачей нерелевантных результатов:
Prompt: Cute panda in full length detailed police uniform. The camera is right in front of the panda. white simple background. high resolution. 3d style.
Еще одна проблема в том, что в рамках коллекции в изображениях должна соблюдаться определенная идея и стиль, чтобы сформировать целостное восприятие концепции. Но и с этой задачей AI NFT Generator не справился:
Правда небольшая модификация prompt, помогла получить более или менее похожих персонажей и создать целостную по стилистике NFT-коллекцию:
Prompt: A cute panda in a black hoodie holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Плюсы и минусы для создания NFT-коллекций
Плюсы:
- Удобный простой интерфейс.
- Генерация 8 вариантов.
- Бесплатные генерации без ограничений.
- Отсутствие ограничений для prompt.
- Адаптация под создание NFT-коллекций.
- Возможность с платформы выложить на продажу.
- Скорость генерации.
- Качество генерации.
Минусы:
- Маленький размер изображения 512х512.
- Отсутствие увеличения и вариаций.
- История исчезает после обновления страницы.
- Не создает однотонный фон.
- Недоработанный алгоритм генерации.
- Проблемы с анатомией.
- Невыполнение детализированных запросов.
Сравнительная таблица генеративных AI
Вверху было много текста и еще больше изображений, так что если вы уже запутались или просто пролистали обзоры сервисов, предлагаем сравнительную оценку протестированных AI в одной таблице:
Критерий | Midjourney | Artbreeder | Dream.ai | Gencraft | Nightcafe | DALL-E | AI NFT Generator |
---|---|---|---|---|---|---|---|
Интерфейс /удобство использования | ⭐️⭐️⭐️⭐️ | ⭐️⭐️ | ⭐️⭐️⭐️⭐ | ⭐️⭐️⭐️⭐⭐ | ⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ |
Скорость генерации | ⭐️⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐ | ⭐️⭐️⭐️⭐ | ⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️⭐️ |
Качество генерации одного NFT | ⭐️⭐️⭐️⭐ | ⭐️ | ⭐️⭐️ | ⭐️⭐️⭐️ | ⭐️ | ⭐️ | ⭐️⭐️⭐️⭐️ |
Качество генерации NFT-коллекции | ⭐️⭐️⭐️ | ⭐️ | ⭐️ | ⭐️⭐️ | ⭐️ | ⭐️ | ⭐️⭐️⭐️ |
Скорость создания NFT-коллекции | ⭐️⭐️⭐️ | ⭐️ | ⭐️ | ⭐️⭐️ | ⭐️ | ⭐️ | ⭐️⭐️ |
Замена части изображения | ⭐️⭐️ | ⭐️ | ⭐️ | ⭐️⭐️ | ⭐️ | ⭐️ | ⭐️⭐️ |
Общая оценка | 8/10 | 4/10 | 3/10 | 6/10 | 1/10 | 2/10 | 6/10 |
Некоторые из критериев оценки по определению субъективны, но под каждым изображением есть подсказка, так что вы можете самостоятельно проверить сервисы и составить свой рейтинг.
4 лучших AI для генерации NFT
Отрисовка атрибутивных NFT — задача специфическая, поэтому вероятно общие площадки с ней плохо справляются. Но как насчет нишевых AI-генераторов? Чтобы проверить, есть ли реально оптимизированные под генерацию NFT-коллекций нейросети, мы рассмотрели несколько специализированных сервисов:
AutoMinter NFT Generator
В AutoMinter NFT Generator есть 2 варианта создания коллекции:
- по prompt,
- по слоям.
Мы попытались запустить генерирование по подсказке, но даже через 10 минут ожидания и многочисленных обновлений страницы результат получить не удалось. И при общих и при детализированных запросах результат был один и тот же:
Сгенерировать коллекцию по слоям возможно, но это не совсем то, чего ожидаешь от AI: нужно вручную добавить слои — фон, тело, глаза и тому подобное с уже отрисованными элементами в png. Важно, чтобы они сразу были правильно позиционированы:
Далее сгенерированную NFT-коллекцию нужно апрувнуть, чтобы AutoMinter NFT Generator подготовил ее для минта. Все просто, не очень качественно и элемент AI тут по сути не работает.
HotPot AI
Есть большой выбор стилей для генерации по запросу, так что быстро можно получить референсы для коллекции. Мы протестировали наш базовый промпт со следующим результатом:
Prompt: A cute panda in a black hoodie holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Appypie NFT Generator
Генеративный ИИ. Позволяет получить изображение по подсказке, а также выбрать уже заготовленные шаблоны под NFT. Но, похоже, что картинки генерируются на основе DALL-E, а значит при попытке создать коллекцию вы столкнетесь с уже рассмотренными выше проблемами. Вот результат по нашему стандартному промпту:
Prompt: A cute panda in a black hoodie holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
NFT-Inator
AI, который может автоматически генерировать персонажей из уже готовых слоев. Для использования сервиса потребуется разбить изображение на атрибуты и выгрузить каждый отдельным файлом. После этого вы попадаете в редактор, где можно комбинировать эти самые атрибуты для создания NFT в ручном или автоматическом режиме:
После создания, коллекцию можно экспортировать для продажи. Этот инструмент не генерирует само изображение, но поможет сэкономить время, ведь не потребуется отрисовывать 10000 NFT с разными атрибутами вручную.
Заключение
Мы протестировали 7 генеративных AI для создания NFT-коллекции с использованием prompt различной детализации. Полученные результаты показывают, что существующие нейросети плохо адаптированы под эту задачу и имеют общие проблемы:
- генерация в разных стилях;
- деформация персонажей и предметов;
- нерелевантное воспроизведение детализации в prompt;
- неконтролируемость полученного результата;
- неадекватное воспроизведение эмоций.
Но, если сравнивать результаты протестированных сервисов, то лучше с задачей справились Midjourney, Gencraft и AI NFT Generator. Они предоставили наиболее релевантные результаты по качеству и соответствию задумки. Именно в них мы смогли собрать хоть какие-то коллекции персонажей.
Что касается нишевых NFT-генераторов, то они заточены не столько под создание изображений, сколько под автоматическое комбинирование уже отрисованных элементов. Это полезная функция, но для нее требуются готовые исходники. Вероятно, есть смысл комбинировать общие AI-генераторы изображений с NFT-генераторами для получения оптимального результата.