Напечатай и получишь: шесть ИИ-генераторов изображений по тексту

09.05.2024
38 мин
1529
10
Напечатай и получишь: шесть ИИ-генераторов изображений по тексту. Заглавный коллаж статьи.

В мире современной графики и визуализации искусственный интеллект (ИИ) стал не просто мощным инструментом, а настоящим творческим партнером. С его помощью рождаются удивительные картинки, преображаются сцены и оживают миры, до этого существовавшие лишь в воображении.

Создание фантастических вселенных, ретушь и улучшение фотографий, раскраска черно-белых снимков и воплощение креативных дизайнерских идей — лишь часть из того, на что уже способны алгоритмы.

Incrypted выяснил, на что способны ИИ-инструменты при работе с изображениями и какие из них вы можете попробовать прямо сейчас.

Генерация изображений по тексту

В 2024 году уровень технологий позволяет всем, у кого есть смартфон с подключением к интернету, задействовать искусственный интеллект для манипуляции с изображениями.

Множество качественных, построенных на разных алгоритмах инструментов позволяет копировать стили художников, превращать эскизы в фотореалистичные иллюстрации, «оживлять» портреты и создавать новые изображения. Для разных задач используются отличные или похожие подходы и технологии.

Одними из самых популярных ИИ-инструментов являются генераторы картинок по тексту.

Такие системы дают возможность создавать изображения на основе подсказки на естественном языке.

Запросы могут состоять из огромного количества слов, добавление или удаление которых способно кардинально изменить результат.

Большинство популярных ИИ-систем имеет ограничения на создание контента: они не будут изображать наготу, насилие, реалистичные лица или политических деятелей.

Некоторые генераторы картинок по тексту может попробовать любой желающий. Среди них: DALL-E 3, Stable Diffusion и Dream by WOMBO.

DALL-E 3

Технология является последней версией генератора изображений по тексту от OpenAI. Это значительное обновление по сравнению с DALL-E 2 — как в пользовательском опыте, так и в способностях создания контента.

По данным компании, система понимает значительно больше нюансов для создания детализированных картинок.

«DALL-E 3 представляет собой шаг вперед в способности генерировать изображения, точно соответствующие предоставленному тексту», ― говорится на сайте OpenAI.

Нововведением также является то, что DALL-E 3 больше не выделена в отдельное приложение. Разработчики интегрировали технологию в чат-бот ChatGPT и сделали ее платной — генератором могут воспользоваться владельцы подписок Plus, Team и Enterprise. Также он доступен разработчикам через API.

Пока DALL-E 3 имеет аналогичное модель GPT-4 ограничение: пользователю доступно только 40 запросов каждые три часа. Теоретически, за сутки можно создать несколько сотен изображений.

Технология также доступна бесплатно в сервисе Designer через чат-бот Microsoft Copilot.

Dream by WOMBO

Пользователь может генерировать изображения бесплатно.

Однако сервис предлагает Premium-подписку с расширенными возможностями вроде дополнительных стилей создаваемых картинок. Ее цена составляет $9,99 в месяц или $89,99 в год. Кроме того, можно единоразово заплатить $169,99.

Dream by WOMBO доступен в браузере. Также пользователи могут генерировать картинки в мобильном приложении на Android и iOS.

Для создания изображения необходимо придумать подсказку длинной до 350 символов. Затем нужно выбрать стиль.

Разрешение готовых изображений ― 960 на 1568 пикселей. Их можно скачать или опубликовать в ленте на сайте сервиса после регистрации.

DreamStudio

Это веб-сервис, созданный компанией Stability AI. Он позволяет генерировать картинки с помощью ИИ-модели Stable Diffusion.

В DreamStudio пользователь может выбрать стиль изображений, соотношение сторон картинок и количество результатов для одного запроса. Кроме того, можно загрузить исходную иллюстрацию.

Длина подсказки неограничена. Также есть возможность добавить негативный промт ― ключевые слова или фразы, которые можно указать для избежания определенных элементов, стилей или объектов в созданных изображениях.

После регистрации пользователю бесплатно предоставляют 25 кредитов. При необходимости их можно докупить: 1000 кредитов стоят $10 и позволяют создать около 1200 изображений с настройками по умолчанию.

Lexica Aperture

Сервис представил основатель поисковика для картинок и ИИ-подсказок Lexica Шариф Хамим в декабре 2022 года.

Lexica Aperture позволяет создавать фотореалистичные иллюстрации по текстовому запросу в книжной или альбомной ориентации.

Нейросеть платная, однако после регистрации предоставляет бесплатные кредиты.

Чтобы создать картинку, пользователю необходимо придумать текстовый запрос любой длины. Также есть поле для ввода негативного промта.

Готовое изображение можно расширить или создать его вариации.

Deep Dream Generator

Сервис позволяет создавать и редактировать изображения.

Чтобы воспользоваться генератором, требуется войти в систему через простой веб-интерфейс. Затем нужно нажать на кнопку Generate вверху страницы.

Пользователю необходимо придумать подсказку или выбрать «рандомный запрос». Также можно загрузить изображение, добавить модификации вроде стиля известного художника или эффекта и ввести негативный промт. 

Результат можно отредактировать с помощью ИИ во вкладке AI Editor.

Сервис имеет ограничения на бесплатное использование. При регистрации аккаунта начисляют 20 единиц энергии, которые сгорают при генерации картинок. Ее можно докупить: самый дешевый план стоит $9 в месяц, а самый дорогой ― $99 в месяц.

Deep Dream Generator работает достаточно быстро, однако пока не дотягивает до уровня DALL-E 3 или Stable Diffusion. Это касается интерпретации слов и созданных рисунков.

Canva Magic Media

В октябре 2023 года сервис для графического дизайна Canva представил ИИ-генератор изображений по тексту Magic Media.

Это простой в применении инструмент. Чтобы использовать его в новом проекте, необходимо нажать на кнопку Magic Studio при входе в систему. Генератор изображений также можно задействовать, находясь в файле документа: сперва выбрав Elements, а затем ― Generate my own AI image.

В боковом меню проекта автоматически откроется приложение Magic Media. Оно предложит окно для подсказки и несколько предустановленных стилей.

Также в верхней части меню есть вкладки для ИИ-генерации графики и видео по тексту.

После ввода запроса, который должен состоять из более чем пяти слов, Magic Media создает четыре квадратных изображения. Из готовой иллюстрации можно создать ролик.

Если пользователь не выберет предустановленный стиль или не укажет его в подсказке, система, вероятнее, нарисует мультяшную картинку, а не реалистичную.

Также ИИ создает преувеличенные черты лиц людей и отдает предпочтение минималистичности, а не детализированности.

Canva не отмечает готовые изображения водяным знаком.

На старте Magic Media предлагает пользователям 50 бесплатных кредитов на создание картинок и 5 ― на генерацию видео. Обновление до премиум-плана Pro предоставляет 500 кредитов на изображения, которые сбрасываются ежемесячно.

Вывод

Всего за год генераторы изображений на базе искусственного интеллекта прошли путь от закрытых бета-версий до инструментов, которые можно найти буквально повсюду. 

То, что началось с DALL-E 2, переросло в огромное творческое движение. ИИ-генераторы произведений искусства, существующие несколько лет, активно набирают популярность, а новые интересные инструменты запускаются каждую неделю.

Собранный Incrypted список далеко неполный. Однако он позволит опробовать некоторые популярные технологии бесплатно и создать достаточно высококачественные интересные изображения.

Как вам статья?

10
0

статьи на эту же тему

Топ-10 криптоконференций в Украине и...
avatar Denis Solomyanyuk
14.05.2024
Стрим с основателями 1inch: про Fusion 2.0,...
avatar Andrew Makarov
14.05.2024
Обзор DePIN-протокола Grass: данные для ИИ...
avatar Ivan Babiuk
11.05.2024