ЗМІ: Apple і Nvidia використовували YouTube для навчання ШІ без згоди авторів

19.07.2024
30 хв
440
0
ЗМІ: Apple і Nvidia використовували YouTube для навчання ШІ без згоди авторів. Головний колаж новини.
  • ЗМІ дізналися про копіювання матеріалів YouTube для навчання ШІ-моделей.
  • Такі компанії, як Apple, Nvidia, Anthropic і Salesforce, використовували дані відеороликів без згоди авторів.
  • Набір даних, що переважно складається із субтитрів до відео, є частиною глобальної збірки інформації Pile.

Великі технологічні компанії, серед яких Apple, Nvidia, Anthropic і Salesforce, використовували «десятки тисяч відео» з YouTube для навчання ШІ-моделей. Ці дії відбувалися без згоди авторів відео, йдеться у звіті, опублікованому Proof News.

За твердженням ЗМІ, деякі компанії могли порушити правила YouTube, що забороняють збір і копіювання матеріалів платформи без дозволу авторів. Журналістське дослідження показало, що фірми використовували субтитри в 173 536 відеороликах, узятих із понад 48 000 YouTube-каналів.

Набір даних під назвою YouTube Subtitles містив трансляції та записи з освітніх каналів, зокрема Khan Academy, MIT і Harvard. Крім того, для навчання ШІ-моделей використовували відеоролики популярних блогерів: MrBeast (289 млн передплатників), Jacksepticeye (майже 31 млн передплатників), Marques Brownlee (19 млн передплатників) і деяких інших.

«Ніхто не приходив до мене і не просив дозволу на копіювання інформації. Це мій заробіток, і я вкладаю час, ресурси і гроші у створення контенту», — заявив ведучий The David Pakman Show Девід Пакман.

Аудиторія Пакмана перевищує 2 млн осіб, а його ролики набирають сотні тисяч переглядів. Тим часом, майже 160 авторських записів Пакмана включили в навчальний набір даних для ШІ, стверджує джерело.

Генеральний директор потокового сервісу Nebula Дейв Віскус назвав дії Apple та інших компаній крадіжкою. За його словами, використання сторонніх матеріалів без згоди авторів демонструє неповагу до їхньої творчості.

«Ми розчаровані тим, що наш ретельно підготовлений освітній контент був використаний без нашої згоди», — заявила генеральна директорка компанії Complexly Джулі Волш Сміт.

Представники EleutherAI розробника наборів даних для ШІ не відповіли на прохання журналістів Proof News прокоментувати результати звіту. Згідно з дослідженням, опублікованим командою EleutherAI, набір даних є частиною збірника, випущеного некомерційною організацією Pile.

Крім матеріалів з YouTube, він охоплює матеріали Європейського парламенту, англомовної версії Wikipedia і електронні листи співробітників Enron, опубліковані в рамках федерального розслідування щодо фірми.

Майже всі компанії підтвердили використання набору даних Pile у своїй роботі. Зокрема, Apple застосовувала отриману інформацію для навчання ШІ та моделі OpenELM.

«Правила YouTube поширюються на пряме використання матеріалів платформи, а не на набір даних The Pile. Що стосується можливих порушень умов обслуговування, рекомендуємо звернутися до авторів The Pile», — йдеться в заяві Anthropic.

Раніше ми повідомляли, що Anthropic профінансує створення бенчмарка для оцінки ШІ. Крім того, компанія представила нову версію чат-бота під назвою Claude і заявила про намір залучити $750 млн інвестицій.

Ще одна організація Salesforce також підтвердила використання матеріалів Pile в «академічних і дослідницьких цілях». Представники фірми підкреслили, що набір даних Pile є загальнодоступним.

Компанії, які займаються питаннями вивчення ШІ, конкурують одна з одною. Вони ведуть боротьбу за отримання більш якісних даних, вважає науковий співробітник CyberBRICS Джай Віпра. Це пояснює, чому фірми намагаються тримати свої джерела інформації в таємниці, додав він.

Нагадаємо, у червні 2024 року ШІ-стартап OpenAI і журнал TIME уклали угоду про співпрацю. У межах спільної роботи компанія отримає доступ до матеріалів видання за понад 100 років.

Як вам стаття?

0
0

статті на цю ж тему

ChatGPT самостійно написав...
avatar Pavel Kot
16.09.2024
OpenAI представила нову ШІ-модель o1 для...
avatar Serhii Pantyukh
13.09.2024
Експерт: китайські ШІ-моделі...
avatar Serhii Pantyukh
12.09.2024
Увійти
або