Надрукуй і отримаєш: шість ШІ-генераторів зображень за текстом

09.05.2024
38 хв
1529
6
Надрукуй і отримаєш: шість ШІ-генераторів зображень за текстом. Головний колаж статті.

У світі сучасної графіки та візуалізації штучний інтелект (ШІ) став не просто потужним інструментом, а справжнім творчим партнером. З його допомогою народжуються дивовижні картинки, трансформуються сцени і оживають світи, які до цього існували лише в уяві.

Створення фантастичних всесвітів, ретуш і поліпшення фотографій, розфарбовування чорно-білих знімків і втілення креативних дизайнерських ідей — лише частина з того, на що вже спроможні алгоритми.

Incrypted з’ясував, на що здатні ШІ-інструменти під час роботи із зображеннями і які з них ви можете спробувати просто зараз.

Генерація зображень за текстом

У 2024 році рівень технологій дає змогу всім, у кого є смартфон із підключенням до інтернету, задіяти штучний інтелект для маніпуляції із зображеннями.

Безліч якісних, побудованих на різних алгоритмах інструментів дає змогу копіювати стилі художників, перетворювати ескізи на фотореалістичні ілюстрації, «оживляти» портрети і створювати нові зображення. Для різних завдань використовуються відмінні або схожі підходи і технології.

Одними з найпопулярніших ШІ-інструментів є генератори картинок за текстом.

Такі системи дають можливість створювати зображення на основі підказки природною мовою.

Запити можуть складатися з величезної кількості слів, додавання або видалення яких здатне кардинально змінити результат.

Більшість популярних ШІ-систем має обмеження на створення контенту: вони не зображатимуть наготу, насильство, реалістичні обличчя або політичних діячів.

Деякі генератори картинок за текстом може спробувати будь-хто. Серед них: DALL-E 3, Stable Diffusion і Dream by WOMBO.

DALL-E 3

Технологія є останньою версією генератора зображень за текстом від OpenAI. Це значне оновлення порівняно з DALL-E 2 — як у користувацькому досвіді, так і в здібностях створення контенту.

За даними компанії, система розуміє значно більше нюансів для створення деталізованих картинок.

«DALL-E 3 являє собою крок уперед у здатності генерувати зображення, які точно відповідають наданому тексту», ― ідеться на сайті OpenAI.

Нововведенням також є те, що DALL-E 3 більше не виділена в окремий додаток. Розробники інтегрували технологію в чат-бот ChatGPT і зробили її платною — генератором можуть скористатися власники підписок Plus, Team і Enterprise. Також він доступний розробникам через API.

Поки що DALL-E 3 має аналогічне до моделі GPT-4 обмеження: користувачеві доступно лише 40 запитів кожні три години. Теоретично, за добу можна створити кілька сотень зображень.

Технологія також доступна безкоштовно в сервісі Designer через чат-бот Microsoft Copilot.

Dream by WOMBO

Користувач може генерувати зображення безкоштовно.

Однак сервіс пропонує Premium-підписку з розширеними можливостями на кшталт додаткових стилів створюваних картинок. Її ціна становить $9,99 на місяць або $89,99 на рік. Крім того, можна одноразово заплатити $169,99.

Dream by WOMBO доступний у браузері. Також користувачі можуть генерувати картинки в мобільному застосунку на Android і iOS.

Для створення зображення необхідно придумати підказку довжиною до 350 символів. Потім потрібно вибрати стиль.

Роздільна здатність готових зображень ― 960 на 1568 пікселів. Їх можна завантажити або опублікувати в стрічці на сайті сервісу після реєстрації.

DreamStudio

Це веб-сервіс, створений компанією Stability AI. Він дає змогу генерувати картинки за допомогою ШІ-моделі Stable Diffusion.

У DreamStudio користувач може вибрати стиль зображень, співвідношення сторін картинок і кількість результатів для одного запиту. Крім того, можна завантажити вихідну ілюстрацію.

Довжина підказки необмежена. Також є можливість додати негативний промт ― ключові слова або фрази, які можна вказати для уникнення певних елементів, стилів або об’єктів у створених зображеннях.

Після реєстрації користувачеві безкоштовно надають 25 кредитів. За необхідності їх можна докупити: 1000 кредитів коштують $10 і дають змогу створити близько 1200 зображень із налаштуваннями за замовчуванням.

Lexica Aperture

Сервіс представив засновник пошуковика для картинок і ШІ-підказок Lexica Шаріф Хамім у грудні 2022 року.

Lexica Aperture дає змогу створювати фотореалістичні ілюстрації за текстовим запитом у книжковій або альбомній орієнтації.

Нейромережа платна, проте після реєстрації надає безкоштовні кредити.

Щоб створити картинку, користувачеві необхідно придумати текстовий запит будь-якої довжини. Також є поле для введення негативного промта.

Готове зображення можна розширити або створити його варіації.

Deep Dream Generator

Сервіс дає змогу створювати та редагувати зображення.

Щоб скористатися генератором, потрібно увійти в систему через простий веб-інтерфейс. Потім потрібно натиснути на кнопку Generate вгорі сторінки.

Користувачеві необхідно придумати підказку або вибрати «рандомний запит». Також можна завантажити зображення, додати модифікації на кшталт стилю відомого художника або ефекту і ввести негативний промт. 

Результат можна відредагувати за допомогою ШІ у вкладці AI Editor.

Сервіс має обмеження на безкоштовне використання. Під час реєстрації акаунта нараховують 20 одиниць енергії, які згорають під час генерації картинок. Її можна докупити: найдешевший план коштує $9 на місяць, а найдорожчий ― $99 на місяць.

Deep Dream Generator працює досить швидко, проте поки що не дотягує до рівня DALL-E 3 або Stable Diffusion. Це стосується інтерпретації слів і створених малюнків.

Canva Magic Media

У жовтні 2023 року сервіс для графічного дизайну Canva представив ШІ-генератор зображень за текстом Magic Media.

Це простий у застосуванні інструмент. Щоб використати його в новому проєкті, необхідно натиснути на кнопку Magic Studio під час входу в систему. Генератор зображень також можна задіяти, перебуваючи у файлі документа: спершу вибравши Elements, а потім ― Generate my own AI image.

У бічному меню проекту автоматично відкриється додаток Magic Media. Він запропонує вікно для підказки і кілька попередньо встановлених стилів.

Також у верхній частині меню є вкладки для ШІ-генерації графіки та відео за текстом.

Після введення запиту, який має складатися з більш ніж п’яти слів, Magic Media створює чотири квадратних зображення. З готової ілюстрації можна створити ролик.

Якщо користувач не вибере попередньо встановлений стиль або не вкаже його в підказці, система, найімовірніше, намалює мультяшну картинку, а не реалістичну.

Також ШІ створює перебільшені риси облич людей і віддає перевагу мінімалістичності, а не деталізованості.

Canva не позначає готові зображення водяним знаком.

На старті Magic Media пропонує користувачам 50 безкоштовних кредитів на створення картинок і 5 ― на генерацію відео. Оновлення до преміум-плану Pro надає 500 кредитів на зображення, які скидаються щомісяця.

Висновок

Усього за рік генератори зображень на базі штучного інтелекту пройшли шлях від закритих бета-версій до інструментів, які можна знайти буквально всюди.

Те, що почалося з DALL-E 2, переросло у величезний творчий рух. ШІ-генератори витворів мистецтва, що існують кілька років, активно набирають популярність, а нові цікаві інструменти запускаються щотижня.

Зібраний Incrypted список далеко неповний. Однак він дасть змогу випробувати деякі популярні технології безкоштовно і створити досить високоякісні цікаві зображення.

Як вам стаття?

6
0

статті на цю ж тему

Топ-10 криптоконференцій в Україні та...
avatar Denis Solomyanyuk
14.05.2024
Стрім із засновниками 1inch: про Fusion 2.0,...
avatar Andrew Makarov
14.05.2024
Огляд DePIN-протоколу Grass: дані для ШІ та...
avatar Ivan Babiuk
11.05.2024