Литературный код: способны ли алгоритмы заменить писателей?
В ноябре 2022 года лаборатория искусственного интеллекта (ИИ) OpenAI представила чат-бота ChatGPT. Ему можно задать вопрос, ввести запрос или подсказку и получить «почти человеческий» текстовый ответ. Алгоритм способен разговаривать на различные темы и понимать контекст, признавать ошибки, шутить и спорить.
Спустя всего два месяца после запуска количество пользователей ChatGPT достигло 100 млн. Это сделало его самым быстрорастущим сервисом в истории и стало катализатором разработки множества аналогов другими компаниями. Бум чат-ботов вызвал обеспокоенность среди писателей.
Деятели искусства встревожены способностями ИИ сканировать интернет и использовать хранящиеся там знания и произведения, включая защищенный авторским правом контент. Также их беспокоит умение генеративного искусственного интеллекта с помощью этих данных имитировать творческое письмо, которое выглядит как оригинальное.
Но способен ли ИИ создать полноценную книгу и заменить авторов? Команда Incrypted разобралась в этом вопросе.
Использование ИИ для написания книг
В сети можно найти множество произведений, сгенерированных с помощью ИИ.
По данным Reuters за февраль 2023 года, на Amazon Kindle Direct Publishing (KDP) обнаружили более 200 книг, в которых ChatGPT указан автором или соавтором. Среди них: руководство How to Write and Create Content Using ChatGPT, The Power of Homework и сборник стихов Echoes of the Universe.
Согласно изданию, особенности технологии и факт сокрытия некоторыми авторами ее использования не позволяют оценить реальное количество ИИ-произведений. Но число книг, созданных с помощью различных инструментов с искусственным интеллектом, растет ежедневно.
Сотрудник финтех-компании Brex Аммаар Реши использовал ChatGPT для создания детской книги Alice and Sparkle. Она содержит 14 страниц и 13 иллюстраций, сгенерированных Midjourney, и повествует о желающей узнать мир технологий девочке Алисе и ее роботе-помощнике Спаркле.
По словам Реши, работа заняла 72 часа. Результат автор загрузил на книжную платформу KDP.
Изначально энтузиаст планировал создать произведение только для ребенка друзей, но после публикации новости в Instagram получил множество запросов на его покупку. По словам автора, он продал 70 экземпляров и подарил около 45.
Однако в X (ранее Twitter) Реши подвергся критике со стороны подписчиков и книжных иллюстраторов. Они заявили, что энтузиаст не заслуживает получать деньги за произведение, так как «не вложил в него много труда». Также пользователи указали на «шаблонность» истории и множество дефектов на созданных ИИ изображениях.
Фантаст Тим Буше задействовал чат-ботов ChatGPT и Anthropic Claude, а также генератор изображений Midjourney для написания серии книг AI Lore.
За девять месяцев автор создал 97 книг, содержащих от 2000 до 5000 слов и включающих от 40 до 140 иллюстраций. По словам Буше, он продал 574 копий и заработал почти $2000.
Созданные генеративным искусственным интеллектом произведения часто публикуются на книжной платформе Amazon .
В августе 2023 года американская писательница Джейн Фридман выяснила, что под ее именем продаются книги, которые она не создавала. По словам авторки, эти произведения сгенерированы с помощью искусственного интеллекта.
«Это выглядит как нарушение, потому что это действительно низкокачественный материал с моим именем», — заявила она.
Фридман пишет книги об издательской индустрии. Поддельные произведения под именем авторки на ту же тему. Среди них: How to Write and Publish an eBook Quickly and Make Money, A Step-by-Step Guide to Crafting Compelling eBooks, Building a Thriving Author Platform и Maximizing Profitability.
Фридман узнала о подделках благодаря читателю. Он приобрел одну из якобы новых книг авторки на Amazon, но после прочтения заподозрил в ней имитацию и сообщил об этом писательнице.
«После просмотра первых страниц этих работ и биографии стало очевидно, что они, частично или полностью, созданы искусственным интеллектом. Я веду блог с 2009 года — много моего контента общедоступно для обучения ИИ-моделей», — отметила Фридман.
Авторка написала в компанию с просьбой удалить книги, но получила отказ, поскольку не зарегистрировала свое имя как торговую марку. Однако позже работы пропали с сайта. По мнению писательницы, причиной стала огласка проблемы в соцсетях.
Также на KDP обнаружили несколько книг о грибах, включая руководства по их сбору и приготовлению, которые, вероятно, сгенерировали чат-боты. Анализ фирмы Originality.ai по проверке контента на использование ИИ показал 100% вероятность задействования алгоритмов при написании этих материалов.
Кроме того, в последние месяцы появилось множество путеводителей для путешественников, потенциально составленных генеративными ИИ-инструментами. По словам читателей, эти книги наполнены «расплывчатыми описаниями, повторяющимся текстом и отсутствием маршрутов».
За счет фиктивных отзывов и меньшей стоимости, по сравнению с работами известных авторов, такие руководства находятся в верхних строчках результатов поиска платформы.
Из-за подобного контента в сентябре 2023 года техгигант ввел требование к авторам информировать компанию, когда их работы создаются с помощью искусственного интеллекта. В Amazon также добавили в рекомендации раздел с метками «сгенерированный ИИ контент» и «материал, созданный с использованием ИИ».
В первом случае подразумевается «текст, изображения или перевод, произведенные с помощью инструмента на базе искусственного интеллекта», даже когда впоследствии результат существенно меняют. Во втором случае — контент, созданный авторами и продавцами, которые использовали ИИ для «редактирования, уточнения, проверки ошибок или иного улучшения».
Через неделю после введения этих правил компания также запретила авторам публиковать более трех книг в день из-за роста числа продаваемых материалов, предположительно созданных искусственным интеллектом.
«Amazon активно следит за стремительным развитием генеративного ИИ и его влиянием на чтение, письмо и публикацию» — говорится в сообщении техгиганта.
В компании добавили, что изменения затронут «очень немногих» издателей.
По словам старшего преподавателя издательского дела в Университете Оксфорд Брукс Мириам Джонсон, установленные ограничения, вероятно, не изменят правила игры в управлении притоком ИИ-контента на платформе.
«Это немного повлияет на цифры, но те, кто зарабатывает деньги на созданных с помощью алгоритмов книгах и публикует более трех произведений в день, найдут обходной путь», — заявила она.
ИИ-инструменты для создания текста
Существует множество инструментов на базе искусственного интеллекта, но лишь немногие из них подходят для создания книг, будь то художественных или научно-популярных.
Генерация контента с помощью ИИ является спорным вопросом, однако способные на это системы могут помочь писателям на определенном этапе творческого процесса. Например, при мозговом штурме, исследовании, формировании персонажей, редактировании материала или создании черновиков.
Среди текстовых генераторов, доступных в Украине, можно выделить ChatGPT, Anthropic Claude 2, Microsoft Copilot (ранее чат Bing) и Google Bard.
ChatGPT
По словам генерального директора OpenAI Сэма Альтмана, ChatGPT применяют 100 млн человек в неделю.
Чтобы воспользоваться чат-ботом, необходимо зарегистрироваться на сайте OpenAI.
Система использует текстовую модель GPT-3.5. Она поддерживает множество языков, включая английский, испанский, итальянский, китайский, немецкий, русский, украинский, французский и японский. На них алгоритм может отвечать на вопросы, генерировать контент на заданную тему и выполнять другие задачи.
В январе 2023 года пользователям стала доступна премиум-версия ChatGPT за $20 в месяц. Она базируется на более мощной нейросети GPT-4.
В сентябре компания представила новую версию чат-бота, способную обрабатывать не только текст, но также картинки и естественную речь. Изначально доступ к технологии получили владельцы подписки Enterprise. Остальные пользователи смогут опробовать продукт «вскоре после этого».
ChatGPT относительно гибкая и универсальная технология. Необходимо только научиться правильно создавать подсказки.
Среди недостатков модели можно выделить ограниченность базы знаний в вопросах актуальности информации. Также иногда нейросеть пишет правдоподобно звучащие, но неправильные или бессмысленные ответы.
Кроме того, чат-бот способен проявлять предвзятость, использовать оскорбительные выражения и генерировать неуместный контент.
Однако, несмотря на ограничения, ChatGPT остается предпочтительным инструментом для многих писателей за счет своей универсальности и адаптируемости.
В качестве эксперимента мы попросили чат-бота помочь в создании книги ужасов. ChatGPT предупредил, что может только дать советы по структуре или другим аспектам написания, но не сгенерировать произведение полностью.
На просьбу написать первую главу книги на заданную тему, бот выдал семь абзацев. Часть получила название «Тень в Аллее».
После этого мы попросили алгоритм придумать название произведения. ChatGPT предложил выбрать один из 10 заголовков или использовать их «как вдохновение».
Claude 2
Это чат-бот, разработанный компаний Anthropic и представленный в июле 2023 года.
Алгоритм может обрабатывать подсказки длинной до 100 000 токенов, что примерно соответствует 75 000 слов.
По данным стартапа, модель способна принимать на вход и анализировать сотни страниц документов или целые книги, отвечая на вопросы, которые требуют «синтеза знаний», по многим частям текста. Также пользователи могут разговаривать с ботом часами или днями до того, как он «забудет» содержание диалогов.
«Мы слышали от наших пользователей, что с Claude легко общаться, он четко объясняет свои мысли, с меньшей вероятностью выдает вредные результаты и обладает более длительной памятью», — говорится в сообщении Anthropic.
Алгоритм хорошо справляется с написанием прозы. За счет огромного контекстного окна система способна анализировать черновики романов, создавать маркетинговые материалы или предоставлять длинные рекомендации.
Однако Claude 2 менее точно соответствует подсказкам и следует структуре текста, чем ChatGPT. Например, при обработке краткого изложения главы произведения алгоритм может отойти от темы и сгенерировать не подходящий по смыслу отрывок.
Бот доступен пользователям из 95 стран, включая Украину. Бесплатная версия включает некоторые ограничения вроде количества отправляемых алгоритму сообщений.
Платная подписка стоит $20 в месяц. Она увеличивает количество возможных обращений к модели и обеспечивает приоритетный доступ в периоды высокой посещаемости сервиса.
Когда мы попросили Claude 2 о помощи в написании книги, он предоставил несколько советов.
Мы использовали тот же запрос, что вводили для ChatGPT, и получили следующий результат.
Вместе с подборкой возможных заголовков для произведения бот также предоставил объяснения по каждому из названий.
Copilot
7 февраля 2023 года компания Microsoft анонсировала обновленный поисковик Bing с интегрированным ChatGPT.
В ноябре 2023 года компания провела ребрендинг чат-бота, назвав его Copilot.
Сервис бесплатный и поддерживает работу на многих языках, включая английский, испанский, немецкий, украинский и японский.
Алгоритм умеет находить информацию в интернете, писать прозу, стихи, песни, программный код, а также рассказывать шутки. Так как сервис использует адаптированную для поиска технологию OpenAI, он может предоставлять актуальные данные.
Чат Copilot поддерживает любые темы, однако имеет ограничение на 30 сообщений в пределах одного разговора.
В процессе переписки ИИ предлагает до трех вариантов возможного продолжения беседы. Однако пользователь может ввести и собственный запрос.
На просьбу помочь написать книгу ужасов Copilot предложил обсудить детали и предоставить больше информации.
Мы также попросили его написать первую главу книги на уже известную тему. В своем варианте рассказа ИИ использовал словосочетания из подсказки.
По запросу Copilot предложил пять вариантов заголовков для книги.
Bard
Представленный в феврале 2023 года чат-бот Bard от Google использует информацию из интернета для предоставления «свежих и качественных ответов».
Как и аналогичные сервисы, система предлагает пользователям текстовое поле, где можно ввести запрос. При этом алгоритм предупреждает, что ответы могут оказаться неточными или оскорбительными и не отражают позицию техгиганта.
На просьбу сгенерировать книгу Bard ответил, что «поможет с любыми аспектами процесса написания, от разработки идеи до редактирования и публикации». Бот запросил детальную информацию о произведении, включая его жанр, целевую аудиторию и основные темы.
По запросу алгоритм сгенерировал первую главу на заданную тему. Текст оказался непоследовательным и с некоторыми сюжетными ошибками.
Дополнительно Bard предоставил ряд советов для следующий глав, которые помогут сделать книгу «более интересной и захватывающей».
Бот предложил три заголовка для произведения. Также он перечислил «важные факты», которые следует учесть при выборе названия книги.
Генераторы изображений по тексту
Помимо чат-ботов писателю могут стать полезны ИИ-генераторы изображений по тексту для создания иллюстраций или обложек.
Такие системы работают по принципу «напечатай и получишь». Пользователю достаточно придумать любой запрос на естественном языке и алгоритм создаст картинку.
Подсказка имеет ключевую роль в генерации контента и может включать десятки предложений. Добавление или удаление даже одного слова способно кардинально изменить результат.
Благодаря популярности технологии и существованию множества изобразительных стилей в интернете можно найти специальные маркетплейсы с запросами.
Большинство популярных ИИ-генераторов имеют ограничения на создание контента: они не способны изображать наготу, насилие, реалистичные лица или политических деятелей. Некоторые сервисы также запрещают копировать стили известных художников.
Ввиду популярности технологии в интернете доступно множество генераторов картинок по тексту. Среди них: DALL-E 3, Bing Image Creator и Dream by WOMBO.
DALL-E 3
В сентябре 2023 года OpenAI представила третью версию популярного алгоритма для создания изображений DALL-E 3.
В отличие от предшественников новая модель способна корректно генерировать сложные детали вроде текста, рук и лица. Нейросеть может обрабатывать длинные и подробные запросы, а также поддерживать альбомное и портретное соотношения сторон.
DALL-E 3 доступна владельцам подписки ChatGPT Plus и ChatGPT Enterprise. Однако технологию можно бесплатно протестировать через Copilot.
Bing Image Creator
Microsoft запустила сервис в марте 2023 года. По данным компании, с тех пор с его помощью создали более 1 млрд изображений.
Инструмент использует нейросеть DALL-E 3. Сервис доступен на отдельном сайте и в Copilot.
Система предоставляет пользователям 100 бустеров, предназначенных для ускорения генерации картинок. За каждый запрос списывается один токен.
По исчерпанию бустеров компания предлагает получить их за баллы системы вознаграждения Microsoft Rewards.
Чтобы избежать использования инструмента для создания токсичного контента, компания внедрила собственные механизмы защиты в дополнение к методам OpenAI.
Dream by WOMBO
Веб-сервис позволяет создавать изображения бесплатно и без регистрации, но есть Premium-версия. Также пользователям доступны приложения на Android и iOS.
Чтобы сгенерировать картинку, нужно ввести текстовый запрос длинной до 350 символов и выбрать стиль визуализации.
Заменят ли чат-боты писателей?
Популярность ChatGPT и других чат-ботов стала одной из причин забастовки Гильдии сценаристов Америки (WGA). По словам представителей профсоюза, ИИ допустимо применять только для помощи в исследованиях или облегчения работы над идеями сценария, а не с целью заменить людей.
Также в сентябре 2023 года группа писателей, среди которых Джонатан Франзен, Джоди Пиколт и Джордж Р. Р. Мартин, подали в суд на OpenAI из-за использования их книг при обучении ИИ.
Согласно иску, доход авторов зависит от созданных ими произведений. Однако технологии ответчика ставят под угрозу способность писателей-фантастов зарабатывать на жизнь, говорится в документе.
«Большие языковые модели позволяют всем желающим автоматически и бесплатно (или очень дешево) генерировать текст, за создание которого в противном случае они платили бы писателям», — заявили истцы.
Большая языковая модель (LLM) — это система, состоящая из нейронной сети со множеством параметров (обычно миллиардами весовых коэффициентов и более), натренированной на огромном массиве неразмеченного текста с использованием метода обучения без учителя.
Опыт писателей и проведенные нами эксперименты с ChatGPT и другими алгоритмами доказывают, что литературное мастерство ИИ все еще находится на достаточно низком уровне. Нейросети склонны к клише. Они выдают неоригинальный, неубедительный, а иногда и несвязный текст.
Однако такие системы обладают огромным потенциалом и неизвестно, что может произойти в будущем.
Писатели постоянно расширяют свое воображение, придумывают идеи, прорабатывают сюжетные линии, создают правдоподобных персонажей, преодолевают творческие трудности и работают над произведением в течение длительного периода времени.
Большинство авторов самостоятельно пишут книги. Хотя они поддаются влиянию других деятелей искусства, но не похожи на чат-ботов, обученных на сотнях тысяч романов с целью имитировать человеческое творчество.
Однако стремительная разработка LLM обязывает общество рассматривать различные сценарии развития событий. Алгоритмы уже способны отвечать на заданные вопросы, поддерживать беседу и генерировать связный текст. Также они могут помочь авторам при поиске вдохновения.
Технология продолжит развиваться и основным направлением станет повышение качества языка. Достижения в областях искусственного интеллекта и машинного обучения способствуют созданию более убедительного и реалистичного контента.
Это не значит, что следует отказаться от использования чат-ботов и генераторов изображений. Но необходимо регулировать их применение и уметь различать контент, созданный людьми и алгоритмами.