Огляд DePIN-протоколу Grass: дані для ШІ та монетизація інтернет-підключення

11.05.2024
15 хв
5842
2
Огляд DePIN-протоколу Grass: дані для ШІ та монетизація інтернет-підключення. Головний колаж статті.

Інформація є ключовим компонентом для навчання та розвитку штучного інтелекту. Великі мовні моделі на кшталт GPT і генеративні нейромережі, як-от Midjourney, потребують референсів для навчання та вдосконалення.

У міру розвитку цього сектора конкуренція за набори даних і доступ до API посилюється, як і обмеження з боку власників веб-ресурсів. Протокол Grass має на меті розв’язати ці проблеми за допомогою блокчейну і доказів з нульовим розголошенням.

Наприкінці квітня проєкт заявив про подолання позначки у 2 млн підключених пристроїв, які згодом мають стати частиною децентралізованого рівня даних для ШІ. Команда Incrypted розібралася, що таке Grass, як він працює і наскільки далекі зараз розробники від наміченої мети.

Что такое протокол Grass?

Grass — це DePIN проєкт у мережі Solana для збору та верифікації інтернет-даних. Розробники Grass планують використовувати блокчейн, щоб розв’язати ключові проблеми веб-скрейпінгу і побудувати прозоріший інформаційний ринок з нагородами для всіх учасників.

Важливо: на момент написання Grass технічно не є блокчейн-проєктом. Функція веб-скрейпінгу і система винагород централізовані та контролюються командою. У майбутньому проєкт має бути розгорнутий на власній L2-мережі.

Протокол задіює пропускну спроможність пристроїв користувачів для пошуку необхідної інформації, а потім обробляє отримані дані та фіксує історію їхнього походження за допомогою доказів з нульовим розголошенням (ZKP), що зберігаються в блокчейні. Самі ж дані на поточній стадії реалізації Grass зберігаються поза мережею безпосередньо клієнтом, який ініціював запит.

По суті, Grass створює мережу, що складається з тисяч пристроїв звичайних користувачів для збору інформації з веб-сайтів з подальшим її передаванням зацікавленим клієнтам, насамперед, для навчання моделей штучного інтелекту;

Важливо: отримання доступу до протоколу для запиту даних регулюється командою і вимагає підписання попередньої угоди. При цьому Grass не розкриває інформацію про клієнтів, тому не можна стверджувати, хто саме і з якою метою проводить веб-скрейпінг з використанням підключених нод.

Это изображение имеет пустой атрибут alt; его имя файла - grass-1.png
Взаємозв’язок між ШІ-моделями та протоколом Grass. Дані: Grass.

Творці Grass зазначають, що це більш справедлива модель ринку даних порівняно з наявною монополією Web2-платформ, які не розподіляють прибутки від наданого для навчання ШІ контенту і в односторонньому порядку контролюють доступ до інформації.

Архітектура протоколу

Grass можна уявити як розподілену мережу, що складається з декількох мільйонів пристроїв (нод) — на момент написання в основному домашніх ПК, але в перспективі і смартфонів;

На вході мережі клієнт, який робить Grass запит на отримання даних із певного джерела. На виході — веб-сервер, що містить необхідну інформацію. Завдання протоколу полягає в тому, щоб спрямувати запит клієнта до конкретної ноди, яка зв’яжеться із сервером для отримання даних (скрейпінгу), а потім зашифрувати їх і відправити назад.

Ключовими учасниками цього механізму є:

  • ноди (nodes) — пристрої користувачів зі встановленим клієнтом Grass, що надають незадіяну пропускну спроможність інтернет-підключення для отримання інформації з веб-сервера та передачі її роутеру;
  • маршрутизатори (routers) — спеціальні координуючі вузли, що відстежують стан підключених нод. Роутери направляють запит конкретній ноді, а потім передають отриману відповідь валідатору;
  • валідатори (validators) — перевіряють запит клієнта і передають його роутеру, а також шифрують і підписують отримані від нього дані. Крім того, валідатори оцінюють відповідь конкретної ноди на основі цілісності даних, своєчасності та інших критеріїв;

Після запуску мережі другого рівня (L2) архітектура Grass стане складнішою за рахунок додавання нових учасників:

  • ZK Processor — отримує від валідатора дані, після чого передає їх у сховище на L2 і генерує ZKP, яке публікується в основній мережі;
  • реєстр даних (Data Ledger) — передбачається, що реєстр даних буде зберігати в L2-мережі всю отриману протоколом інформацію;
  • механізми обробки (edge embedding models) — проєкт планує представити власне рішення для обробки інформації, що дасть змогу надавати очищені та структуровані масиви даних для навчання ШІ як окремий продукт.

Після повноцінної реалізації концепції, викладеної в технічній документації, мережа має мати такий вигляд;

Повна архітектура Grass. Дані: Grass.

Таким чином, запуск L2-мережі — це ключовий етап на шляху Grass від «оракула даних» до «шару даних». Розробники вказують на необхідність такого кроку, оскільки жоден сучасний блокчейн, навіть такий швидкий як Solana, не зможе впоратися з потоком запитів, який планує обробляти Grass.

Чи безпечний Grass?

Команда Grass приділяє особливу увагу питанню безпеки додатка і захисту власників вузлів. Розробники запевняють, що у користувачів немає причин турбуватися про персональні дані та законність дій, оскільки браузерне розширення Grass не має доступу до інформації, що зберігається на пристрої, історії та інших даних браузера. Обробка запитів відбувається у фоновому режимі та відокремлена від вашого сеансу.

Це підтверджується і заявою про конфіденційність в Chrome Web Store, де серед одержуваних персональних даних вказано тільки геолокацію. Однак варто зазначити, що під час встановлення розширення запитує право на зміну даних на всіх відвідуваних веб-сайтах. Ймовірно, це необхідно для фонової роботи каналу, але докладного роз’яснення цьому немає.

Другим аспектом є легальність запитів клієнтів. Wynd Labs, що стоїть за розробкою протоколу, вимагає у клієнтів попереднього підписання користувацької угоди, яка передбачає моніторинг дій командою і повну відповідальність сторони, що запитує. Таким чином, за законність скрейпінгу відповідає розробник і клієнт, але не власник ноди.

У Grass також зазначають, що протокол автоматично обмежує активність окремих IP-адрес, щоб не викликати підозр і санкцій з боку провайдера;

Важливо: Розширення Grass не проходило аудитів безпеки та має закритий вихідний код, тож упевненість у безпеці будується на запевненнях розробників і опосередковано підтверджується 2 млн завантажень на Chrome Web Store. Ймовірно, у разі порушення конфіденційності, ми побачили б скарги та низькі оцінки користувачів.

Які проблеми вирішує Grass

Grass позиціонується як рівень даних для ШІ-інфраструктури, що відповідає за збір, очищення та структуризацію інформації, необхідної для навчання моделей штучного інтелекту;

Проєкт може згладити нерівність між великими лабораторіями та невеликими розробниками у сфері ШІ завдяки забезпеченню доступності даних та усуненню деяких бар’єрів, що виникають у цьому секторі;

Так, Reddit надає вільний доступ до свого API для Google за ексклюзивною угодою, обмежуючи його для сторонніх користувачів. Обмеження щодо боротьби зі скрейпінгом також застосовують Х (Twitter), Meta, Medium та інші Web2-платформи. Варто очікувати, що в міру розвитку ШІ цінність масивів текстових і візуальних даних зростатиме, а їхня доступність — знижуватиметься.

Grass же замінює великі дата-центри для скрейпінгу, які легко виявити і заблокувати, децентралізованою мережею користувацьких пристроїв. Це дає змогу збирати дані через сотні тисяч невеликих каналів із резидентськими IP, на які не поширюються обмеження на доступ до даних. При цьому протокол запитує тільки відкриту інформацію, яка знаходиться у вільному доступі;

Іншою проблемою є «труєння» або навмисне спотворення масиву даних джерелом або постачальником. Це поширена стратегія в так званих «інформаційних війнах», яка використовується для боротьби зі скрейпінгом. Вона передбачає, що в деяких випадках дані, одержувані через відкриті API, «отруюються» через спотворення змісту та ввімкнення «завад», щоб запобігти їхньому промисловому збиранню та ускладнити подальше використання.

Крім того, навчання алгоритмів ускладнюють нерепрезентативні або некоректні вибірки даних. Наприклад, після запуску нових ШІ-моделей на кшталт Gemini в медіа часто з’являються заголовки про те, що сервіс дає відповіді з упередженнями щодо певних расових чи соціальних груп. Це прямий наслідок навчання на невірній інформації.

Боротися з таким «відправленням» або помилками вкрай складно, оскільки через великий обсяг даних просто неможливо перевірити вручну або відстежити зміни, внесені під час структуризації.

Цю проблему Grass розв’язує за допомогою блокчейна і доказів із нульовим розголошенням, що дають змогу верифікувати походження інформації. Після запуску L2-мережі протокол зберігатиме метадані, що підтверджують, який вузол надав відповідь на запит і звідки взято інформацію. Незмінність метаданих забезпечується за допомогою ZKP, які опубліковані в основній мережі Solana.

Таким чином, будь-який незалежний ШІ-розробник зможе за порівняно невелику плату запитувати інформацію з веб-сервера через Grass, або ж купувати вже очищені та структуровані бази даних для навчання своїх моделей. При цьому він також отримає можливість верифікувати походження отриманого вмісту.

Така бізнес-модель робить Grass ідеальним доповненням для інших проєктів, що працюють на перетині блокчейну та штучного інтелекту. Так, у Messari зазначають, що валідатори мережі Bittensor вже використовують Grass для отримання доступу до даних, необхідних для навчання та вдосконалення підмереж;

Екосистема та інтеграції Bittensor. Дані: Messari.

Варто зазначити, що описана вище модель роботи передбачає функціонування Grass як самостійного репозиторію даних, чого розробники планують досягти тільки після запуску L2-мережі. Однак її специфікація і терміни реалізації поки невідомі. А до того моменту зберігання, очищення і структуризація даних лягають на плечі клієнтів.

Подальше розроблення

У жовтні 2023 року Grass опублікувала матеріал з проміжними підсумками розвитку і планами на майбутнє. Для досягнення описаної в технічній документації бізнес-моделі планується реалізувати такі кроки:

  • запуск мобільних додатків — на момент написання клієнт Grass доступний у вигляді розширень для браузерів персональних комп’ютерів, що обмежує потенційну призначену для користувача базу. Тому ще в листопаді 2023 року команда анонсувала запуск Android-додатку, а також планує розробку iOS-сумісного клієнта;
  • відкритий доступ — на етапі бета-тесту приєднатися до мережі можна тільки за реферальним кодом вже зареєстрованого учасника. У майбутньому команда планує прибрати це обмеження, щоб будь-хто міг запустити вузол Grass на своєму пристрої.

Ще однією важливою проблемою залишається централізація протоколу. Функцію перевірки та шифрування запитів і відповідей на момент написання виконує централізований секвенсер. Однак для усунення єдиної точки відмови та централізації в майбутньому його повинен замінити комітет валідаторів із власним механізмом консенсусу.

Таким чином, Grass перебуває на ранньому етапі розроблення, і всі ключові рішення, які мають перетворити проєкт на децентралізований рівень даних, ще належить реалізувати. Зараз протокол скоріше нагадує посередника між зацікавленими в даних клієнтами і власниками ПК, які надають свою пропускну здатність для веб-скрейпінгу. Причому останні все ще не отримують реальні нагороди.

Участь у Grass і можлива роздача токенів

На момент написання Grass перебуває на стадії бета-тесту з обмеженим застосуванням блокчейну і базовим функціоналом. Для стимулювання користувачів протокол використовує поінти, пропонуючи їх як нагороду за:

  • встановлення розширення Grass, реєстрацію і надання пропускної спроможності для веб-скрейпінгу;
  • залучення нових користувачів із подальшим заохоченням у рамках реферальної програми.

Варто зазначити, що ні блог, ні технічна документація Grass не містить жодної інформації про запланований запуск токена і конвертацію поінтів у реальні цифрові активи. Однак активні користувачі можуть продати свої бали на платформі Whales Market. Середня пропозиція за один поінт на момент написання становить $0,002.

За даними Cryptorank, під час двох раундів фінансування Grass вдалося залучити $4,5 млн, що є порівняно невеликою цифрою для блокчейн-проєкту. До цього варто додати 2 млн підключених вузлів, власники яких, імовірно, очікують нагород за свою участь у роботі мережі. Тож проводьте власне дослідження перш ніж взаємодіяти з Grass для отримання аірдропу.

Як вам стаття?

2
0

статті на цю ж тему

Ончейн-аналіз в умовах санкцій:...
avatar Alina Saganska
11.09.2024
Pectra: що змінить наступний хардфорк...
avatar Ivan Babiuk
10.09.2024
«Буллран… затримується» — нове...
avatar Ivan Babiuk
04.09.2024
Увійти
або