11 найкращих нейромереж для генерації зображень за описом. Створюємо NFT-колекцію за допомогою AI (готові промпти всередині)
Запуск власної NFT-колекції — мрія багатьох користувачів криптовалют, які застали NFT-божевілля 2021-го, а потім і Ordinals-тренд на початку 2023-го. Навіть найпростіші PFP від анонімних художників часом вистрілювали, генеруючи обсяги торгів у кілька сотень або навіть тисяч ETH, а також непогані роялті для своїх творців.
З появою генеративних AI ця мрія стала ще на крок ближчою і сьогодні здається, що для запуску власної колекції досить знайти відповідний промпт для Midjourney або DALL-E.
У цій статті розберемося, чи так це насправді та, чи існує відповідний AI для створення NFT-колекцій?
Вступ про НФТ, генеративні зображення та АІ
NFT колекції — це зазвичай набір персонажів або об’єктів, об’єднаних спільною тематикою і стилем зображення. В окремих NFT можуть змінюватися атрибути, наприклад, аксесуари, кольори, емоції, але завжди є центральна тема та об’єкт:
Це означає, що художнику потрібно намалювати кілька різних атрибутів одного і того ж персонажа, а потім комбінувати їх випадковим чином. Так для PFP-колекції на 10к NFT достатньо всього 5 атрибутів, які рандомно поєднуються.
І тут на сцену виходить ШІ. З моменту запуску дискорд-сервера Midjourney, широка аудиторія отримала доступ до нейромережі, яка робить якісний арт, ґрунтуючись виключно на текстовій підказці.
У криптанів, які пережили епоху PFP-манії, відразу склалася формула: нейромережа + ідея = NFT-колекція = легкі гроші. Додамо трохи хайпу і кілька твіттер-інфлів у фоловери — і ви вже концептуальний цифровий художник (анон з ідейних міркувань) з роялті й репутацією.
Примітка: схоже, що саме так подумали британські художники, які малювали NFT для збору коштів на підтримку Алекса Перцева — творця Tornado Cash. Через неуважне використання генеративного AI на цій NFT зобразили нашого Андрія Леонідовича. Але це вже зовсім інша історія.
Утім, поява доступних нейромереж не призвела до форсу генеративних NFT-колекцій. Просто тому, що знайти AI, оптимізований для цього завдання, не так просто, як може здатися, на перший погляд. Перевіримо на практиці.
ТОП 7 інструментів для генерації картинок за описом
Ми протестували кілька популярних сервісів для генерації зображень, щоб перевірити, наскільки вони придатні для створення повноцінної NFT-колекції.
- Центральним персонажем нашої колекції стане панда.
- Атрибутами — одяг та аксесуари різних професій.
Також спробуємо змінювати колір, окремі деталі персонажа та емоції, щоб домогтися того ж результату, який отримують NFT-художники.
Важливо: спочатку треба зрозуміти, як поставити завдання машині, щоб вона зробила те, що хочеш. Для цього варто детально прописати кінцевий результат, зробити ескіз, щоб не тримати візуальний образ у думках, а також проаналізувати prompt (підказки для AI) інших людей і їхні результати.
Midjourney
Сервіс, який підняв хайп і в якийсь момент переконав людей у тому, що ШІ зможе замінити художників. Midjourney видавав на порядок якісніші арти, ніж конкуренти, і перший час робив це безплатно, за що здобув широку популярність у користувачів.
Важливо: до Midjourney та інших AI-сервісів багато запитань з приводу порушення авторських прав. Тому уважно читайте умови продажу робіт, згенерованих AI. Зазвичай це прописано в правилах використання сервісу.
Першими труднощами, з якими ми зіткнулися, були ігнорування Midjourney плоскої та простої 2D стилістики та нерелевантні для колекції результати:
Prompt: NFT collection. Portrait of a panda programmer with a macbook and headphones on his head in a black hoodie. flat style. clean background. high definition.
Лише з 10 спроби вийшло підібрати адекватний prompt, за яким добре видно головного персонажа, зображення відповідає запиту: чорний худі, макбук, і підходить для колекції. Далі цей prompt адаптувався під інші професії.
Основна проблема використання AI для створення колекції в тому, що він не зберігає стару версію, щоб внести в неї зміни, а генерує зображення заново. Прикладом цього є результат тестування алгоритмів Midjourney для зміни конкретного елемента: так ми спробували змінити колір худі та емоцію панди. Для цього є 2 способи:
- Зміна зображення за посиланням через оновлений prompt: для цього використовуємо команду /image і вставляємо посилання на зображення, після чого додаємо новий опис:
- Генерація за новим запитом.
1 спосіб не дав потрібного результату, бо внести коригування без повторної генерації персонажа неможливо. Тобто ми все одно отримали нову панду. Також AI ігнорував запит про зміну емоцій, але впорався з худі:
Prompt: Panda in full growth in a red sweatshirt with a macbook laptop in his hands. Panda stands and looks at the laptop. On the face is the emotion of anger and the panda screams at the laptop. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
За другого способу вдалося отримати кращий результат, але теж не відразу. Для цього потрібен був докладний опис поведінки персонажа:
Prompt: Panda in full growth in a red sweatshirt with a macbook laptop in his hands. The panda stands up straight. On the face is the emotion of anger and the panda screams at the laptop. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Також ми зіткнулися з тим, що AI додавав щось від себе й ігнорував деталі, прописані в prompt. Особливо це стосувалося емоцій, виразу обличчя, додавання кількох деталей одразу та аксесуарів.
Створити колекцію в Al Midjourney, де персонаж залишається незмінним, а атрибути змінюються — неможливо. Просто тому, що не можна домогтися повної передбачуваності результату генерації.
Але ми продовжили створювати колекцію з пандами, витративши на це 6 годин і тонни нервових клітин:
Усі зображення генерувалися зі стандартними налаштуваннями Midjourney. До речі, генерація в MJ5.1, Niji 4 і 5 відрізняється:
Плюси та мінуси для створення NFT-колекцій
Плюси:
- Можливість налаштовувати алгоритм генерації.
- Генерація нового зображення на основі вже наявного.
- Генерація 4-х варіантів на вибір.
- Швидкість генерації.
- Збільшення і варіації.
- Якість генерації.
- Відсутність обмежень деталізації prompt.
Мінуси:
- Ігнорування деталізації (наприклад, колір або тип одягу).
- Труднощі з відтворенням потрібних емоцій, виразу обличчя або дії.
- Відсутність можливості змінювати певний параметр.
- Витрати часу.
- Обмеженість функціоналу для редагування.
- Відсутність бета-періоду.
- Непрогнозований результат.
Artbreeder
Це генеративний ШІ з можливістю швидко створити й налаштувати персонажа — те що потрібно для NFT-колекцій.
Інтерфейс інтуїтивно зрозумілий і простий, також є широкий безплатний функціонал, якого вистачить для створення NFT-колекції. Великим плюсом є варіативність налаштувань за кольором волосся, віком, національністю тощо. А якщо не знаєте з чого почати, то можна вибрати вже готовий образ і його налаштувати під своє завдання:
Однак під час тестування стало зрозуміло, що працює це лише з реалістичними персонажами. Ось результат за нашим стандартним промптом:
У Artbreeder також є алгоритм генерації в колажуванні. Це схоже на оновлення Photoshop, коли виділена частина зображення змінюється за описом, але результат має радше вигляд пародії:
Друге тестування стандартного prompt підняло настрій, але навряд чи це можна назвати прийнятним результатом:
Prompt: A cute panda in a black hoodie holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Хоча 4 варіант непоганий, але AI частково ігнорує prompt, тож згенерувати 2 зображення в подібному форматі дуже важко. Та й загалом ШІ нестабільний і не підходить для комерційних завдань.
Плюси і мінуси для створення NFT-колекцій
Плюси:
- Широкий функціонал (текстова генерація, колажування, створення персонажа).
- Безплатна підписка.
- Глибокі налаштування при створенні реалістичного персонажа.
Мінуси:
- Ігнорування запиту.
- Нестабільність генерації.
- Низька якість генерації.
- Витрати часу.
- Непрогнозований результат.
- Згенероване зображення виглядає не цілісним.
- Відсутність збільшення і варіацій.
Dream.ai
Dream.ai — це також генеративний AI на основі текстових підказок. Дає змогу генерувати 4 варіанти, як і в Midjourney, але 3 з них доступні тільки за преміум-підпискою:
Ми тестували prompt на генерацію панди-програміста в різних варіаціях: від деталізованого до загального опису. У першому варіанті якість самих зображень була середньою, хоча ШІ сприйняв ключові деталі — персонажа, одяг, ноутбук. За кількох генерацій з однаковими prompt отримали різні за стилем зображення, а також цікаві артефакти:
- Генерування другого персонажа.
- Дублювання частин тіла та елементів.
Prompt: A cute panda in a black hoodie holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Під час генерації за загальним запитом panda programmer Dream.ai видав нерелевантні результати:
Загалом створити одиничне зображення за запитом, якщо немає підписки на Midjourney — реально. А ось повноцінну NFT-колекцію відмалювати не вийде.
Плюси і мінуси для створення NFT-колекцій
Плюси:
- Безкоштовна версія.
- Є можливість генерувати 4 зображення відразу.
- Зрозумілий інтерфейс.
Мінуси:
- Ігнорування запиту.
- Нестабільність генерації.
- Низька якість генерації.
- Витрати часу.
- Непрогнозований результат.
- Обмеження кількості символів у prompt.
- Відсутність збільшення та варіацій.
Gencraft
Тестуючи цю платформу ми таки знайшли рішення, яке може хоча б претендувати на створення NFT-колекції. Крім власне AI, користувачам доступна бібліотека з генераціями, щоб переглянути prompt вподобаного результату. Усі генерації зручно зберігаються в креативах:
Важливо: Gencraft забороняє комерційне використання робіт, згенерованих у безплатному тарифі, а також встановлює обмеження на 10 безплатних генерацій на день.
Під час написання prompt можна вибрати стиль генерації зображення, а сам результат має не гірший вигляд, ніж у двох попередніх сервісів. Щоправда, з prompt панди-прибиральника AI не впорався і видавав зламані швабри:
Prompt: Cute panda in green apron in full growth stands straight. On the head is a scarf. The panda holds a broom in its paws. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Виявилося, що AI не генерує емоції, які прописуються в prompt і не дотримується інших вимог. Так, під час тестування базового prompt панди-програміста AI не сприймав уточнення з приводу пози, але зреагував на зміну кольору худі з чорного на червоний:
І ще один приклад ігнорування — у підказці ми прописали рожеві вуха, бежевий фартух, в одній лапі палітра для фарб, в іншій лапі пензель, але отримали:
Prompt: A cute panda with pink ears in full growth stands straight. Dressed in a brown apron, she holds a palette for paints and a brush for painting in her hands. The emotion of contemplation. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Основна складність у тому, що Gencraft генерує зображення в різних стилях і погано справляється з анатомією, тому створення більш-менш схожих персонажів без ламаних кінцівок і предметів вимагає багато часу.
Ми все ж спробували створити колекцію, але отримали персонажів, які відрізняються за стилістикою, зовнішнім виглядом і форматом фону. Також багато анатомічних проблем, особливо з лапами та кігтями:
Плюси та мінуси для створення NFT-колекцій
Плюси:
- Безкоштовних 10 генерацій/день.
- Можна вибрати стиль генерації.
- Зручне зберігання генерацій.
- Потижнева оплата.
- Можливість генерувати відео за описом.
Мінуси:
- Вотермарка в безкоштовному тарифі.
- Середня якість генерації.
- Не можна продавати роботи, згенеровані в безкоштовній версії.
- Ігнорування складної деталізації.
- Артефакти.
- Витрати часу.
- Непрогнозований результат.
- Обмеження prompt за символами.
- Відсутність збільшення і варіацій.
Nightcafe
Про Nightcafe ми дізналися з добірок «супер-круті AI для NFT» і включили його до списку для економії вашого часу. Ми вибрали 3 популярні моделі й перевірили результат на базовому prompt. Просто подивимося і підемо далі:
Плюси та мінуси для створення NFT-колекцій
Плюси:
- Безкоштовні генерації.
- Генерація 4 зображень.
- Можна вибрати модель.
Мінуси:
- Низька якість генерування.
- Ігнорування деталізації промпта.
- Витрати часу.
- Непрогнозований результат.
DALL-E
DALL-E — сервіс для генерації зображень від OpenAI. Розробники кажуть, що DALL-E розуміє контекст і може надавати зображення, які виходять за рамки очікуваного. І під час тестування базового prompt ми вийшли за ці рамки:
Prompt: A cute panda in a black hoodie holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Ми переглянули бібліотеку вже згенерованих зображень і вирішили поліпшити наш prompt. Але, схоже, вийшли за рамки очікуваного ще більше:
Prompt: 3D professional render of a cute panda in a black hoodie. Panda holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. White clean background. A high resolution. Without bad anatomy.
З 3D у DALL-E явні проблеми, тож спробували створити флет-ілюстрацію і трохи змінили prompt:
Prompt: Cartoon of a cute panda in a black hoodie. Panda holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution.
Але під час спроби створити варіації початкового зображення знову зіткнулися з непередбачуваними та різними за стилістикою результатами:
Під час тестування зміни атрибутів персонажа колір худі справді змінився, але тількитому, що згенерувалося нове зображення:
Prompt: Cartoon of an angry panda in a red hoodie. Panda holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution.
Ми також протестували prompt із деталізацією стилістики та кілька загальних підказок. Результат знову вийшов за рамки очікуваного:
Prompt: Manga cartoon style of a cute panda in a police suit. Panda in full growth. A full-length panda is placed in the center of the image. There is an empty space next to it. The camera is right in front of the panda. white clean background. a high resolution.
Плоскі ілюстрації за якістю генерації кращі, але створити повноцінну колекцію в DALL-E також неможливо. Крім того, цей AI обрізає частини тіла, зміщує персонажа відносно центру і не реагує на вимоги щодо позиціювання.
Плюси та мінуси для створення NFT-колекцій
Плюси:
- Зручний інтерфейс.
- Генерація 4 варіантів.
- Відсутність обмежень обсягів prompt.
- Варіації готового результату.
- Історія генерацій.
- Швидкість генерації.
Мінуси:
- Відсутність пробного періоду.
- Низька якість генерації.
- Ігнорування деталізації.
- Обрізання персонажів.
- Низька якість варіацій.
- Неякісно відтворює 3D персонажів.
AI NFT Generator
AI NFT Generator спеціально адаптований під генерацію NFT-колекцій з подальшим запуском. Це не дуже популярний сервіс, але його алгоритми та сфера роботи за описом підходять нам найбільше. Принаймні в теорії.
На практиці ж одразу біда — протестували стиль флет ілюстрацій, але отримали об’ємних персонажів:
Prompt: A cute panda in a black hoodie holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution. Simple flat style.
Зі зміною кольору та емоції AI впорався на 5/10. Є варіанти, де виконано більшість умов, проте згенерувалися й дуже дивні. Наприклад, 2 панди одразу або з п’ятьма лапами:
Prompt: An angry panda in a red hoodie holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Як і попередні нейромережі, ця не запам’ятовує вподобану генерацію, а робить нову. Ми все ж спробували згенерувати колекцію, адже порівняно з іншими протестованими AI результат не такий вже й поганий, але під час створення нових персонажів зіткнулися з ігноруванням багатошарової AI деталізації та видачею нерелевантних результатів:
Prompt: Cute panda in full length detailed police uniform. The camera is right in front of the panda. white simple background. high resolution. 3d style.
Ще одна проблема в тому, що в рамках колекції в зображеннях повинна дотримуватися певна ідея і стиль, щоб сформувати цілісне сприйняття концепції. Але і з цим завданням AI NFT Generator не впорався:
Щоправда, невелика модифікація prompt допомогла отримати більш-менш схожих персонажів і створити цілісну за стилістикою NFT-колекцію:
Prompt: A cute panda in a black hoodie holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Плюси та мінуси для створення NFT-колекцій
Плюси:
- Зручний простий інтерфейс.
- Генерація 8 варіантів.
- Безкоштовні генерації без обмежень.
- Відсутність обмежень для prompt.
- Адаптація під створення NFT-колекцій.
- Можливість з платформи викласти на продаж.
- Швидкість генерації.
- Якість генерації.
Мінуси:
- Маленький розмір зображення 512х512.
- Відсутність збільшення і варіацій.
- Історія зникає після оновлення сторінки.
- Не створює однотонний фон.
- Недопрацьований алгоритм генерації.
- Проблеми з анатомією.
- Невиконання деталізованих запитів.
Порівняльна таблиця генеративних AI
Вгорі було багато тексту і ще більше зображень, тож якщо ви вже заплуталися або просто пропустили огляди сервісів, пропонуємо порівняльну оцінку протестованих AI в одній таблиці:
Критерій | Midjourney | Artbreeder | Dream.ai | Gencraft | Nightcafe | DALL-E | AI NFT Generator |
---|---|---|---|---|---|---|---|
Інтерфейс /зручність використання | ⭐️⭐️⭐️⭐️ | ⭐️⭐️ | ⭐️⭐️⭐️⭐ | ⭐️⭐️⭐️⭐⭐ | ⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ |
Швидкість генерації | ⭐️⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐ | ⭐️⭐️⭐️⭐ | ⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️⭐️ |
Якість генерації одного NFT | ⭐️⭐️⭐️⭐ | ⭐️ | ⭐️⭐️ | ⭐️⭐️⭐️ | ⭐️ | ⭐️ | ⭐️⭐️⭐️⭐️ |
Якість генерації NFT-колекції | ⭐️⭐️⭐️ | ⭐️ | ⭐️ | ⭐️⭐️ | ⭐️ | ⭐️ | ⭐️⭐️⭐️ |
Швидкість створення NFT-колекції | ⭐️⭐️⭐️ | ⭐️ | ⭐️ | ⭐️⭐️ | ⭐️ | ⭐️ | ⭐️⭐️ |
Заміна частини зображення | ⭐️⭐️ | ⭐️ | ⭐️ | ⭐️⭐️ | ⭐️ | ⭐️ | ⭐️⭐️ |
Загальна оцінка | 8/10 | 4/10 | 3/10 | 6/10 | 1/10 | 2/10 | 6/10 |
Деякі з критеріїв оцінки за визначенням суб’єктивні, але під кожним зображенням є підказка, тож ви можете самостійно перевірити сервіси та скласти свій рейтинг.
4 найкращі AI для генерації NFT
Створення атрибутивних NFT — завдання специфічне, тому ймовірно загальні платформи з ним погано справляються. Але як щодо нішевих AI-генераторів? Щоб перевірити, чи є реально оптимізовані під генерацію NFT-колекцій нейромережі, ми розглянули кілька спеціалізованих сервісів:
AutoMinter NFT Generator
В AutoMinter NFT Generator є 2 варіанти створення колекції:
- за prompt,
- за шарами.
Ми спробували запустити генерування за підказкою, але навіть через 10 хвилин очікування і численних оновлень сторінки результат отримати не вдалося. І за загальних, і за деталізованих запитів результат був один і той самий:
Згенерувати колекцію за шарами можливо, але це не зовсім те, чого очікуєш від AI: потрібно вручну додати шари — тло, тіло, очі тощо з уже намальованими елементами в png. Важливо, щоб вони одразу були правильно позиціоновані:
Далі згенеровану NFT-колекцію потрібно апрувнути, щоб AutoMinter NFT Generator підготував її для мінта. Усе просто, не дуже якісно й елемент AI тут по суті не працює.
HotPot AI
Є великий вибір стилів для генерації за запитом, тож швидко можна отримати референси для колекції. Ми протестували наш базовий промпт із таким результатом:
Prompt: A cute panda in a black hoodie holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
Appypie NFT Generator
Генеративний ШІ. Дозволяє отримати зображення за підказкою, а також вибрати вже заготовлені шаблони під NFT. Але, схоже, що картинки генеруються на основі DALL-E, а отже, під час спроби створити колекцію ви зіткнетеся з уже розглянутими вище проблемами. Ось результат за нашим стандартним промптом:
Prompt: A cute panda in a black hoodie holds a laptop in his hands. Panda in full growth. The camera is right in front of the panda. white clean background. a high resolution. 3D style.
NFT-Inator
AI, який може автоматично генерувати персонажів з уже готових шарів. Для використання сервісу потрібно розбити зображення на атрибути й вивантажити кожен окремим файлом. Після цього ви потрапляєте в редактор, де можна комбінувати ці самі атрибути для створення NFT у ручному або автоматичному режимі:
Після створення, колекцію можна експортувати для продажу. Цей інструмент не генерує саме зображення, але допоможе заощадити час, адже не потрібно буде відмальовувати 10000 NFT з різними атрибутами вручну.
Висновок
Ми протестували 7 генеративних AI для створення NFT-колекції з використанням prompt різної деталізації. Отримані результати показують, що наявні нейромережі погано адаптовані під цю задачу і мають загальні проблеми:
- генерація в різних стилях;
- деформація персонажів і предметів;
- нерелевантне відтворення деталізації в prompt;
- неконтрольованість отриманого результату;
- неадекватне відтворення емоцій.
Але, якщо порівнювати результати протестованих сервісів, то краще із завданням впоралися Midjourney, Gencraft і AI NFT Generator. Вони надали найбільш релевантні результати за якістю та відповідністю задуму. Саме в них ми змогли зібрати хоч якісь колекції персонажів.
Що стосується нішевих NFT-генераторів, то вони заточені не стільки під створення зображень, скільки під автоматичне комбінування вже намальованих елементів. Це корисна функція, але для неї потрібні готові вихідні коди. Ймовірно, є сенс комбінувати загальні AI-генератори зображень з NFT-генераторами для отримання оптимального результату.