Генератори, робомобілі та регулювання: чим запам’ятається 2023 рік для ШІ
У 2023 році ми бачили безліч видатних досягнень у галузі штучного інтелекту (ШІ). Протягом 12 місяців, наповнених революційними технологічними відкриттями та тривалими дебатами про етику, суспільство спостерігало безпрецедентний вплив ШІ на різні галузі, включно зі сферою розваг.
Від передових генераторів тексту до інноваційного гаджета Humane AI Pin і нової пісні легендарних The Beatles — рік, що минає, продемонстрував швидку еволюцію і поширення штучного інтелекту. Він глибоко інтегрувався в життя людей, формуючи технології та впливаючи на культуру і мистецтво.
Пропонуємо згадати найбільш знакові події минулих 12 місяців у сфері штучного інтелекту і визначити, чого очікувати в прийдешньому році.
Тріумф і криза OpenAI
Лабораторія OpenAI презентувала кілька ШІ-технологій, які стрімко набрали популярності серед користувачів.
У березні компанія запустила велику мультимодальну мовну модель GPT-4, здатну приймати на вхід зображення і текст. Її навчили на даних, актуальних до вересня 2021 року.
В OpenAI заявили, що порівняно з попередньою версією новий алгоритм надійніший і креативніший, а також уміє обробляти набагато тонші інструкції.
Пізніше лабораторія представила потужнішу нейромережу GPT-4 Turbo, навчену на актуальних до квітня 2023 року даних. Контекстне вікно алгоритму здатне обробляти до 128 000 токенів, що приблизно відповідає 100 000 слів.
Обидві моделі доступні передплатникам ChatGPT Plus.
Компанія поліпшила чат-бот ChatGPT, додавши пошук за зображеннями, розпізнавання мови та озвучування тексту. Остання функція пропонує п’ять попередньо встановлених «людиноподібних» голосів.
Крім того, лабораторія запустила додаток ChatGPT для iOS. Пізніше він став доступний Android-користувачам.
У 2023 році OpenAI представила генератор зображень за текстом DALL-E 3.
За словами розробників, система розуміє більше нюансів і деталей, ніж попередні моделі, і значно краще справляється зі створенням складних ілюстрацій. Алгоритм перевершує попередників у генерації тексту всередині зображень і деталей людини на кшталт рук і пальців на них.
Крім запуску ШІ-інструментів компанія також оптимізувала їх, дозволивши використовувати в одному місці. ChatGPT тепер пропонує створення зображень через DALL-E, а також перегляд і аналіз даних, завантаження документів і пошук у PDF.
Крім того, у березні лабораторія додала підтримку сторонніх плагінів для перегляду актуальних веб-сторінок і взаємодії з конкретними сайтами.
Пізніше OpenAI повідомила, що «більше не інтегрує нові плагіни». Вона запропонувала всім охочим створити власні версії ChatGPT з кастомними інструкціями, навичками та додатковими знаннями.
Також компанія оголосила про розробку магазину додатків GPT Store. OpenAI планувала розгорнути його в листопаді, проте перенесла запуск на 2024 рік.
Маркетплейс дасть можливість користувачам публікувати власні чат-боти й отримувати дохід.
У листопаді лабораторія провела першу конференцію для розробників DevDay, де розповіла про новинки, досягнення і плани.
Однак у минулому році найбільш характерними стали події навколо керівництва ШІ-лабораторії.
У листопаді стало відомо, що рада директорів OpenAI раптово звільнила Сема Альтмана з посади генерального директора компанії. Причиною стала «недостатня відвертість» останнього.
Через відсторонення Альтмана президент ШІ-лабораторії Грег Брокман також покинув OpenAI.
Тимчасовим CEO призначили Міру Мураті, яка обіймала посаду головного технічного директора.
Через три дні з’ясувалося, що Брокман, Альтман і низка їхніх колег очолять новий дослідницький відділ штучного інтелекту в Microsoft.
Водночас понад 95% співробітників OpenAI заявили про намір покинути лабораторію слідом за колишнім гендиректором. Вони підписали лист, де закликали відновити Альтмана і Брокмана на їхніх посадах. Також співробітники зажадали відправити у відставку раду директорів і призначити нову.
Через два дні OpenAI заявила, що досягла угоди про повернення Альтмана. Крім того, компанія представила новий склад ради директорів.
Брокман також повернувся в ШІ-лабораторію.
Ці події викликали бурхливу реакцію в соцмережах і хвилю мемів.
Лавина генеративного ШІ
Ще в листопаді 2022 року OpenAI задала тренд на генеративний штучний інтелект, випустивши чат-бота ChatGPT. Через рік кількість користувачів сервісу досягла 100 млн осіб на тиждень.
Але це не єдиний генеративний ШІ-інструмент на ринку.
На початку лютого Microsoft анонсувала оновлений пошуковик Bing з інтегрованим ChatGPT.
Пізніше компанія провела ребрендинг чат-бота, назвавши його Copilot.
Алгоритм вміє знаходити актуальну інформацію в інтернеті, вигадувати текст у різних стилях і на задану тему, писати програмний код і жартувати.
У лютому 2023 року корпорація Google представила свій аналог ChatGPT — чат-бота Bard. Він використовує інформацію з інтернету для надання «свіжих і якісних відповідей».
У грудні техгігант презентував новітню нейромережу Gemini, що є наразі найпотужнішою ШІ-моделлю компанії.
За даними Google, алгоритм стане доступний у трьох варіантах: Ultra, Pro і Nano. Перша конфігурація нейромережі орієнтована на найскладніші завдання, де потрібен аналіз великих обсягів мультимодальних даних.
Версія Pro призначена для широкого спектра застосувань, а Nano — для вирішення вузькоспеціалізованих завдань на мобільних пристроях.
Компанія має намір задіяти всі модифікації Gemini у своїх продуктах: пошуку, чат-боті Bard та інших сервісах.
До початку 2024 року Google планує перевести Bard на Gemini Ultra, зробивши його «Bard Advanced» зі значно розширеними можливостями.
Ще одним прикладом є чат-бот Ernie Bot від китайського техгіганта Baidu.
Алгоритм вміє генерувати зображення за текстом і відповідати на різні запитання. Однак нейромережа схильна до дезінформації та відмовляється спілкуватися на делікатні політичні теми, пов’язані з Китаєм.
Наприклад, за даними Reuters, Ernie Bot не стане говорити про голову КНР Сі Цзіньпіна або події на площі Тяньаньмень.
У листопаді підрозділ хмарних сервісів Amazon Web Services представив чат-бота Amazon Q для внутрішніх потреб бізнес-клієнтів. Він дає змогу співробітникам компаній ставити запитання про свій бізнес і отримувати відповіді на основі корпоративних даних.
У грудні сервіс X запустив власного чат-бота зі штучним інтелектом Grok для передплатників Premium+. Він здатний відповідати на будь-які запитання, а також самостійно придумувати цікаві теми для обговорення.
І це тільки мала частина представлених генеративних ШІ-інструментів за останні 12 місяців. Їхня кількість зростає щодня і продовжить збільшуватися, оскільки технологія стала мейнстримом і, ймовірно, збереже свої позиції.
Паніка через штучний інтелект
У 2023 році перша хвиля занепокоєння через штучний інтелект почалася незабаром після новорічних канікул.
Тоді деякі навчальні заклади США та інших країн заборонили студентам використовувати ChatGPT на комп’ютерах установ і через внутрішній WiFi. Це було викликано повсюдним використанням сервісу учнями для написання есе та вирішення домашніх завдань.
Здатність алгоритмів генерувати високоякісний контент стривожила багатьох фахівців різних професій щодо потенційного скорочення робочих місць. Також у суспільстві почало зростати обурення через використання захищених авторським правом даних для навчання нейромереж.
Популярність генеративних технологій стала однією з причин страйку Гільдії сценаристів Америки (WGA). Також це призвело до зростання кількості судових позовів до АІ-розробників з боку художників і письменників.
Незважаючи на побоювання, впровадження штучного інтелекту в бізнес поки що не призвело до масових скорочень і безробіття. Навпаки з’явилося більше вакансій у сфері обслуговування ШІ, нагляду та етичного управління.
Ще однією причиною паніки серед громадськості стало збільшення кількості випадків шахрайства, а також широке поширення дезінформації та діпфейків.
У березні творці генератора зображень за текстом Midjourney випустили п’яту версію інструменту. Розробники поліпшили деталізацію картинок і створення алгоритмом очей, облич, рук і зубів.
Після цього в інтернеті завірусилося зображення Папи Римського Франциска в пуховику від Balenciaga, згенероване ШІ. Багато користувачів повірили в справжність картинки.
Широкий резонанс також мали фейкові фотографії арешту колишнього президента США Дональда Трампа, які поширювали незадовго до пред’явлення йому обвинувачення. Їх теж створили за допомогою Midjourney.
У результаті глава компанії Девід Хольц повідомив про закриття безкоштовного доступу до нейромережі. Він заявив, що у зв’язку з «надзвичайним попитом і зловживаннями» використання алгоритму коштуватиме $10 на місяць.
Через розвиток АІ-технологій і збільшення кількості фейків також стає важче відрізнити реальні кадри військових дій в Україні та секторі Гази від підроблених.
АІ продовжить розвиватися і основним напрямком стане підвищення якості згенерованого контенту. Однак це також призведе до розробки більшої кількості потужних систем виявлення.
Регулювання та нагляд за ШІ
Однією з найбільш значущих політичних новин минулого року стало узгодження владою Євросоюзу Закону про штучний інтелект. Це перші у світі комплексні правила з регулювання систем ШІ.
Затверджений у грудні 2023 року документ містить заборону на застосування технології для розпізнавання людей за расою, статтю або сексуальною орієнтацією. Також він містить нові вимоги прозорості для потужних ШІ-моделей на кшталт GPT-4.
Порушникам правил загрожує штраф до 7% від глобальної виручки.
Заборони на використання певних алгоритмів наберуть чинності через шість місяців з моменту затвердження, вимоги до прозорості — через 12 місяців, а повний звід правил — через два роки.
Документ також включає заходи, покликані полегшити захист авторів від генеративного штучного інтелекту. Крім цього, системи ШІ загального призначення мають стати більш прозорими щодо використання енергії.
Затверджений ЄС Закон про ШІ — найбільш всеосяжне у своєму роді зведення правил для цієї технології, однак сам по собі він не є першим у світі.
Ще в серпні в Китаї набули чинності «тимчасові» заходи з регулювання використання генеративного ШІ. Правила також зачіпають постачальників API, які обслуговують клієнтів із КНР.
Перш за все, документ вимагає від розробників дотримуватися основних соціалістичних цінностей. Він забороняє створювати і поширювати контент, що загрожує національній безпеці країни.
Алгоритми, здатні впливати на громадську думку, необхідно реєструвати у відповідному органі. Постачальники генеративного ШІ повинні отримати адміністративну ліцензію відповідно до закону, хоча в документі не вказано, хто зобов’язаний це робити.
Розробники моделей несуть відповідальність за виявлення і зупинку створення забороненого контенту. Документ зобов’язує їх своєчасно виправляти алгоритми і доповідати про інциденти відповідним органам. Це означає, що запити до генератора зображень або чат-бота потенційно можуть призвести до юридичних проблем для окремих осіб.
Ба більше, регулятори мають право знати особливості роботи ШІ-моделі, включно з інформацією про її навчальні дані, розмір, тип і алгоритми маркування.
Що стосується США, то в жовтні президент Джо Байден підписав виконавчий указ, що встановлює правила і стандарти безпеки для сфери генеративного штучного інтелекту.
Він переслідує вісім цілей:
- створення нових стандартів безпеки та захисту ШІ;
- просування рівності та громадянських прав;
- захист конфіденційності американців;
- підтримка працівників;
- захист споживачів, пацієнтів і студентів;
- просування інновацій та конкуренції;
- забезпечення відповідального та ефективного використання технологій урядом;
- просування лідерства США у сфері штучного інтелекту.
Білий дім доручив низці урядових установ розробити стандарти, спрямовані на запобігання використанню ШІ для створення біологічної, хімічної або радіологічної зброї. Також необхідно впровадити методи аутентифікації контенту і створити передові програми кібербезпеки.
Великі компанії, що розробляють моделі ШІ на кшталт GPT-4, зобов’язані будуть ділитися результатами тестування своїх систем на безпеку.
Указ набув чинності негайно, але не є постійним законом. Він діє тільки за цієї адміністрації. Тим часом Конгрес продовжує обговорювати законодавче регулювання сфери ШІ.
Раніше деякі великі технологічні компанії, включно з Google, Microsoft і OpenAI, добровільно взяли на себе зобов’язання щодо дотримання стандартів безпеки під час розробки штучного інтелекту.
Серед зазначених в угодах обіцянок:
- внутрішнє і зовнішнє тестування ШІ-продуктів перед комерційним випуском;
- використання водяних знаків для ідентифікації ШІ-контенту;
- обмін інформацією про ризики в галузі;
- повідомлення про потенційні помилки у своїх системах ШІ.
Компанії, які підписали угоду, стали учасниками ініціативи, запущеної в липні 2022 року в Білому домі.
Оскільки зобов’язання є добровільними, у разі їх невиконання розробникам не загрожує покарання.
У листопаді 2023 року Велика Британія провела глобальний саміт із безпеки штучного інтелекту. У день відкриття вона опублікувала «Блетчлійську декларацію», яку підписали ЄС і 28 країн, серед яких США і Китай.
Документ містить заклик до ШІ-компаній забезпечувати прозорість і підзвітність, а також нести відповідальність за потенційні ризики. Крім того, він передбачає вироблення спільної політики щодо зниження загальних загроз штучного інтелекту. Це включає розробку метрик оцінки ризиків, інструментів тестування безпеки та наукове співробітництво.
Фіаско роботаксі Cruise
Початок року здавався багатообіцяючим для безпілотних транспортних засобів.
Лідери галузі Cruise і Waymo увійшли в ці 12 місяців з новими інвестиціям від General Motors і Google відповідно. Також їх підштовхували швидкозростаючий інтерес широкої публіки до технології та активні темпи її впровадження з боку міської влади.
У лютому Cruise заявила, що її роботакси проїхали понад 1,6 млн кілометрів вулицями Сан-Франциско (США) без людини за кермом. Безпілотники досягли цієї позначки лише через 15 місяців після першої самостійної поїздки.
За словами виконавчого віце-президента компанії з розробок Мо Елшенаві, виходячи з показників безпеки автомобілів Cruise, стає очевидною серйозність досягнень команди.
«На сьогодні наші роботаксі здійснили десятки тисяч поїздок. У найближчі роки мільйони людей випробують на собі це повністю безпілотне майбутнє», — заявив він.
У 2022 році генеральний директор Cruise Кайл Вогт неодноразово викладав грандіозне бачення про «нульові аварії, трафік і викиди». Однак згідно зі звітом The New York Times, компанія «вибрала пріоритетом швидкість реалізації програми, а не безпеку».
Незважаючи на зростаючу кількість дорожньо-транспортних пригод і аварій, Cruise продовжувала розширювати свою діяльність, особливо в Г’юстоні та Лос-Анджелесі.
У квітні 2023 року робокарам компанії дозволили перевозити співробітників цілодобово і без вихідних по всьому Сан-Франциско. «Досвідчені клієнти» могли скористатися сервісом тільки в денний час.
У серпні Комісія з комунальних послуг Каліфорнії (CPUC) дозволила Cruise і Waymo надавати цілодобові платні послуги перевезень у Сан-Франциско.
Однак не всі підтримали активне розширення роботаксі.
У січні влада Сан-Франциско зажадала від CPUC «уповільнити або зупинити» розгортання безпілотних транспортних засобів у місті. За їхніми словами, вільне розширення, схвалене регуляторами штату, стає «необґрунтованим» тягарем.
Фактично через тиждень після схвалення CPUC цілодобових платних робоперевезень Департамент автотранспорту Каліфорнії (DMV) запустив розслідування зіткнення безпілотника Cruise з пожежною машиною.
Регулятор зажадав у компанії вдвічі скоротити парк безпілотників, поки не закінчиться розгляд.
Також у серпні з’явилися історії про використання робокарів як «готелів для побачень».
2 жовтня в Сан-Франциско сталася аварія за участю автомобіля Cruise, що стала поворотним моментом в історії компанії і безпілотних транспортних засобів.
Водій збив жінку-пішохода, відкинувши її на смугу з рухомим безпілотником. Робокар, незважаючи на екстрене гальмування, наїхав на ногу постраждалої і «протягнув» її приблизно шість метрів, поки не зупинився.
Бригади швидкої допомоги витягли пішохода з-під авто за допомогою рятувальних інструментів і доправили її в лікарню із серйозними травмами.
За даними San Francisco Chronicle, 25 жовтня постраждала все ще перебувала у важкому стані.
Після інциденту Cruise нібито ввів в оману регуляторів щодо моменту гальмування безпілотника. Також компанія відкладала надання слідчим відео інциденту до 19 жовтня.
Через ці дії CPUC розглядає можливість оштрафувати компанію на $1,5 млн. Рішення ухвалять у лютому.
Крім того, аварія з Cruise спричинила низку розслідувань щодо технології.
Через три тижні після події DMV призупинив дію ліцензії компанії на експлуатацію роботаксі в межах штату.
У середині листопада Cruise відкликала всі 950 автомобілів, а за тиждень по тому призупинила поїздки з операторами за кермом у рамках «повної перевірки безпеки».
Крім того, глава компанії Кайл Фогт і директор із продукту Деніел Кан залишили свої посади.
Материнське підприємство General Motors на «сотні мільйонів доларів» скоротило витрати на Cruise. У результаті остання почала масово звільняти співробітників.
Компанія планує скоротити свої амбіції в галузі безпілотного водіння і перезапуститися.
Що стосується інших лідерів галузі, то для Waymo минулий рік виявився досить успішним.
Підтримуване Google підприємство отримало позитивний відгук від провідного світового перестраховика Swiss Re. За даними останнього, безпілотні транспортні засоби Waymo виявилися значно безпечнішими, ніж автомобілі, керовані людьми.
У грудні компанія також опублікувала рецензоване дослідження на ту саму тему. Згідно зі звітом, показник аварій у робокарів майже в сім разів нижчий, ніж у звичайних автомобілів. За понад 1,6 млн км шляху вони потрапляють у ДТП у шість разів рідше, що свідчить про більшу безпеку безпілотних автомобілів.
Крім цього, за останні 12 місяців компанія розширила зону обслуговування роботаксі, додавши Лос-Анджелес і Остін до Сан-Франциско і Фінікса.
Дозвіл CPUC на експлуатацію безпілотників у Сан-Франциско дав змогу Waymo стягувати з пасажирів плату за поїздки і пропонувати послуги не тільки «довіреним тестувальникам».
За даними компанії, попит на використання роботаксі виявився «неймовірно високим». Однак, незважаючи на доволі успішний рік, Waymo провела три раунди скорочень, які зачепили понад 300 співробітників.
Підсумки
2023 рік виявився багатим на цікаві та переломні події. Розмірковуючи про досягнуті за ці 12 місяців досягнення в галузі штучного інтелекту, стає очевидним, що можливості цієї технології стільки ж великі, скільки і складні.
У світі з’явилося безліч корисних ШІ-алгоритмів, що мають прикладне значення. Генератори, робомобілі, автоматизація — все це активно впроваджується в повсякденне життя, роблячи його простішим, якіснішим і захопливішим.
Складно уявити, що на нас чекає у 2024 році.
Очевидно, виникне ще більше потужних систем генеративного штучного інтелекту, а створюваний ними контент вийде на новий рівень якості. Але разом із цим зросте кількість випадків шахрайства, а також широке поширення дезінформації та дипфейків.