Нидерландские исследователи создали ИИ-детектор сарказма

17.05.2024
37 мин
256
0
Нидерландские исследователи создали ИИ-детектор сарказма. Заглавный коллаж новости.
  • Исследователи из Гронингенского университета создали ИИ-алгоритм, способный распознавать сарказм.
  • Для его обучения разработчики использовали датасет с отрывками из американских ситкомов, включая «Друзья» и «Теория большого взрыва».
  • После тренировки точность модели составила 75%.

Исследователи из Гронингенского университета разработали мультимодальный ИИ-алгоритм для обнаружения сарказма. Работу представили на совместном заседании Американского акустического общества и Канадской акустической ассоциации, пишет The Guardian.

«Мы способны надежно распознавать сарказм и стремимся развивать эту технологию. Мы хотим посмотреть, как далеко можем зайти», — заявил один из разработчиков модели Мэтт Колер.

По его словам, сарказм пронизывает человеческий дискурс больше, чем люди способны представить. Его понимание имеет решающее значение для беспрепятственного общения людей и машин, добавил Колер.

При создании детектора исследователи обнаружили, что ИИ нужны многочисленные сигналы, позволяющие отличить сарказм от искренности.

Специалисты обучили нейросеть на мультимодальных данных ― аудиоклипах, тексте и аннотированном эмоциональном контенте. Они использовали отрывки из американских ситкомов, включая «Друзья» и «Теория большого взрыва». Их взяли из размеченного датасета MUStARD.

 

Одной из сцен, на которой тренировался ИИ, была попытка Леонарда сбежать из запертого помещения в сериале «Теории большого взрыва». Другая изображала Росса из «Друзей», предлагающего Рэйчел помочь Джоуи и Чендлеру собрать мебель.

Исследователи извлекли из речи акустические параметры, включая высоту тона, скорость и энергию. Затем с помощью автоматического распознавания сказанного они перевели ее в текст для анализа настроений.

«Мы присвоили каждому сегменту речи смайлы, отражающие его эмоциональное содержание. Интегрируя эти мультимодальные сигналы в алгоритм машинного обучения, наш подход использует совокупные преимущества слуховой и текстовой информации вместе со смайликами для всестороннего анализа», ― объяснили специалисты.

После тренировки ИИ научился обнаруживать сарказм в немаркированных репликах из ситкомов почти в 75% случаев. Затем разработчики использовали синтетические данные для повышения точности модели, но это исследование еще не опубликовано.

По словам авторов, алгоритм можно улучшить за счет добавления в датасет визуальных подсказок вроде движения бровей и ухмылок.

«Получится ли у нас на 100% точная система? Этого не могут достичь даже люди», ― отметил один из исследователей.

Напомним, недавно OpenAI представила ИИ-модель GPT-4o, способную выражать эмоции.

Как вам статья?

0
0

статьи на эту же тему

McDonald’s отключит ИИ-систему заказов на...
avatar Pavel Kot
20.06.2024
Amazon вложит $9,4 млрд в расширение...
avatar Pavel Kot
19.06.2024
Pantera Capital выделит $200 млн на инвестиции...
avatar Nazar Pyrih
19.06.2024
Войти
или