Обзор DePIN-протокола Grass: данные для ИИ и монетизация интернет-подключения

11.05.2024
15 мин
5776
36
Обзор DePIN-протокола Grass: данные для ИИ и монетизация интернет-подключения. Заглавный коллаж статьи.

Информация является ключевым компонентом для обучения и развития искусственного интеллекта. Большие языковые модели вроде GPT и генеративные нейросети, например Midjourney, нуждаются в референсах для обучения и совершенствования. 

По мере развития этого сектора конкуренция за наборы данных и доступ к API усиливается, как и ограничения со стороны владельцев веб-ресурсов. Протокол Grass нацелен решить эти проблемы при помощи блокчейна и доказательств с нулевым разглашением. 

В конце апреля проект заявил о преодолении отметки в 2 млн подключенных устройств, которые со временем должны стать частью децентрализованного уровня данных для ИИ. Команда Incrypted разобралась, что такое Grass, как он работает и насколько далеки сейчас разработчики от намеченной цели.

Что такое протокол Grass?

Grass — это DePIN проект в сети Solana для сбора и верификации интернет-данных. Разработчики Grass планируют использовать блокчейн, чтобы решить ключевые проблемы веб-скрейпинга и построить более прозрачный информационный рынок с наградами для всех участников. 

Важно: на момент написания Grass технически не является блокчейн-проектом. Функция веб-скрейпинга и система вознаграждений централизованы и контролируются командой. В будущем проект должен быть развернут на собственной L2-сети.

Протокол задействует пропускную способность устройств пользователей для поиска необходимой информации, а затем обрабатывает полученные данные и фиксирует историю их происхождения при помощи доказательств с нулевым разглашением (ZKP), хранимых в блокчейне. Сами же данные на текущей стадии реализации Grass хранятся вне сети непосредственно клиентом, который инициировал запрос. 

По сути, Grass создает сеть, состоящую из тысяч устройств обычных пользователей для сбора информации с веб-сайтов с последующей ее передачей заинтересованным клиентам, в первую очередь, для обучения моделей искусственного интеллекта. 

Важно: получение доступа к протоколу для запроса данных регулируется командой и требует подписания предварительного соглашения. При этом Grass не раскрывает информацию о клиентах, поэтому нельзя утверждать кто именно и с какой целью проводит веб-скрейпинг с использованием подключенных нод.

Создатели Grass отмечают, что это более справедливая модель рынка данных по сравнению с существующей монополией Web2-платформ, которые не распределяют доходы от предоставляемого для обучения ИИ контента и в одностороннем порядке контролируют доступ к информации. 

Архитектура протокола

Grass можно представить как распределенную сеть, состоящую из нескольких миллионов устройств (нод) — на момент написания в основном домашних ПК, но в перспективе и смартфонов. 

На входе сети клиент, который делает Grass запрос на получение данных из определенного источника. На выходе — веб-сервер, содержащий необходимую информацию. Задача протокола состоит в том, чтобы направить запрос клиента к конкретной ноде, которая свяжется с сервером для получения данных (скрейпинга), а потом зашифровать их и отправить обратно.

Ключевыми участниками этого механизма являются:

  • ноды (nodes) — устройства пользователей с установленным клиентом Grass, которые предоставляют незадействованную пропускную способность интернет-подключения для получения информации с веб-сервера и передачи ее роутеру;
  • маршрутизаторы (routers) — специальные координирующие узлы, отслеживающие состояние подключенных нод. Роутеры направляют запрос конкретной ноде, а потом передают полученный ответ валидатору;
  • валидаторы (validators) — проверяют запрос клиента и передают его роутеру, а также шифруют и подписывают полученные от него данные. Кроме того, валидаторы оценивают ответ конкретной ноды на основе целостности данных, своевременности и других критериев. 

После запуска сети второго уровня (L2) архитектура Grass станет более сложной за счет добавления новых участников:

  • ZK Processor — получает от валидатора данные, после чего передает их в хранилище на L2 и генерирует ZKP, которое публикуется в основной сети;
  • реестр данных (Data Ledger) — предполагается, что реестр данных будет хранить в L2-сети всю полученную протоколом информацию;
  • механизмы обработки (edge embedding models) — проект планирует представить собственное решение для обработки информации, которое позволит предоставлять очищенные и структурированные массивы данных для обучения ИИ в качестве отдельного продукта.

После полноценной реализации концепции, изложенной в технической документации, сеть должна выглядеть следующим образом. 

Полная архитектура Grass. Данные: Данные: Grass.

Таким образом, запуск L2-сети — это ключевой этап на пути Grass от «оракула данных» к «слою данных». Разработчики указывают на необходимость подобного шага, поскольку ни один современный блокчейн, даже такой быстрый как Solana, не сможет справиться с потоком запросов, который планирует обрабатывать Grass.

Безопасен ли Grass?

Команда Grass уделяет особое внимания вопросу безопасности приложения и защите владельцев узлов. Разработчики уверяют, что у пользователей нет причин беспокоиться о персональных данных и законности действий, поскольку браузерное расширение Grass не имеет доступа к хранящейся на устройстве информации, истории и другим данным браузера. Обработка запросов происходит в фоновом режиме и отделена от вашего сеанса.

Это подтверждается и заявлением о конфиденциальности в Chrome Web Store, где среди получаемых персональных данных указана только геолокация. Однако стоит отметить, что при установке расширение запрашивает право на изменение данных на всех посещаемых веб-сайтах. Вероятно, это необходимо для фоновой работы канала, но подробного разъяснения этому нет.

Вторым аспектом является легальность запросов клиентов. Wynd Labs, стоящая за разработкой протокола, требует у клиентов предварительного подписания пользовательского соглашения, предусматривающего мониторинг действий командой и полную ответственность запрашивающей стороны. Таким образом, за законность скрейпинга отвечает разработчик и клиент, но не владелец ноды. 

В Grass также отмечают, что протокол автоматически ограничивает активность отдельных IP-адресов, чтобы не вызвать подозрений и санкций со стороны провайдера. 

Важно: расширение Grass не проходило аудитов безопасности и имеет закрытый исходный код, поэтому уверенность в безопасности строится на заверениях разработчиков и косвенно подтверждается 2 млн загрузок на Chrome Web Store. Вероятно, в случае нарушения конфиденциальности, мы увидели бы жалобы и низкие оценки пользователей.

Какие проблемы решает Grass

Grass позиционируется как уровень данных для ИИ-инфраструктуры, отвечающий за сбор, очистку и структуризацию информации, необходимой для обучения моделей искусственного интеллекта. 

Проект может сгладить неравенство между крупными лабораториями и небольшими разработчиками в сфере ИИ за счет обеспечения доступности данных и устранения некоторых барьеров, возникающих в этом секторе. 

Так, Reddit предоставляет свободный доступ к своему API для Google по эксклюзивному соглашению, ограничивая его для сторонних пользователей. Ограничения по борьбе со скрейпингом также применяют Х (Twitter), Meta, Medium и другие Web2-платформы. Стоит ожидать, что по мере развития ИИ ценность массивов текстовых и визуальных данных будет расти, а их доступность — снижаться. 

Grass же заменяет крупные дата-центры для скрейпинга, которые легко выявить и заблокировать, децентрализованной сетью пользовательских устройств. Это позволяет собирать данные через сотни тысяч небольших каналов с резидентскими IP, на которые не распространяются ограничения на доступ к данным. При этом протокол запрашивает только открытую информацию, которая находится в свободном доступе. 

Другой проблемой является «отравление» или преднамеренное искажение массива данных источником или поставщиком. Это распространенная стратегия в так называемых «информационных войнах» которая используется для борьбы со скрейпингом. Она предусматривает, что в некоторых случаях данные, получаемые через открытые API, «отравляются» через искажение содержания и включение «помех», чтобы предотвратить их промышленный сбор и усложнить дальнейшее использование.

Кроме того, обучение алгоритмов усложняют нерепрезентативные или некорректные выборки данных. Например, после запуска новых ИИ-моделей вроде Gemini в медиа часто появляются заголовки о том, что сервис дает ответы с предубеждениями к определенным расовым или социальным группам. Это прямое следствие обучения на неверной информации.  

Бороться с таким «отправлением» или ошибками крайне сложно, поскольку из-за большого объема данных просто невозможно проверить вручную или отследить изменения, внесенные во время структуризации.  

Эту проблему Grass решает при помощи блокчейна и доказательств с нулевым разглашением, позволяющих верифицировать происхождение информации. После запуска L2-сети протокол будет хранить метаданные, подтверждающие, какой узел предоставил ответ на запрос и откуда взята информация. Неизменность метаданных обеспечивается при помощи ZKP, которые опубликованы в основной сети Solana. 

Таким образом, любой независимый ИИ-разработчик сможет за сравнительно небольшую плату запрашивать информацию с веб-сервера через Grass, либо же покупать уже очищенные и структурированные базы данных для обучения своих моделей. При этом он также получит возможность верифицировать происхождение полученного содержимого. 

Такая бизнес-модель делает Grass идеальным дополнением для других проектов, работающих на пересечения блокчейна и искусственного интеллекта. Так, в Messari отмечают, что валидаторы сети Bittensor уже используют Grass для получения доступа к данным, необходимым для обучения и совершенствования подсетей. 

Экосистема и интеграции Bittensor. Данные: Messari.

Стоит отметить, что описанная выше модель работы предполагает функционирование Grass в качестве самостоятельного репозитория данных, чего разработчики планируют достичь только после запуска L2-сети. Однако ее спецификация и сроки реализации пока неизвестны. А до того момента хранение, очистка и структуризация данных ложатся на плечи клиентов.

Дальнейшая разработка

В октябре 2023 года Grass опубликовала материал с промежуточными итогами развития и планами на будущее. Для достижения описанной в технической документации бизнес-модели планируется реализовать следующие шаги:

  • запуск мобильных приложений — на момент написания клиент Grass доступен в виде расширений для браузеров персональных компьютеров, что ограничивает потенциальную пользовательскую базу. Поэтому еще в ноябре 2023 года команда анонсировала запуск Android-приложения, а также планирует разработку iOS-совместимого клиента;
  • открытый доступ — на этапе бета-теста присоединиться к сети можно только по реферальному коду уже зарегистрированного участника. В будущем команда планирует убрать это ограничение, чтобы любой желающий мог запустить узел Grass на своем устройстве.

Еще одной важной проблемой остается централизация протокола. Функцию проверки и шифрования запросов и ответов на момент написания выполняет централизованный секвенсер. Однако для устранения единой точки отказа и централизации в будущем его должен заменить комитет валидаторов с собственным механизмом консенсуса. 

Таким образом, Grass находится на раннем этапе разработки и все ключевые решения, которые должны превратить проект в децентрализованный уровень данных, еще предстоит реализовать. Сейчас протокол скорее напоминает посредника между заинтересованными в данных клиентами и владельцами ПК, предоставляющими свою пропускную способность для веб-скрейпинга. Причем последние все еще не получают реальные награды.

Участие в Grass и возможная раздача токенов

На момент написания Grass находится на стадии бета-теста с ограниченным применением блокчейна и базовым функционалом. Для стимулирования пользователей протокол использует поинты, предлагая их в качестве награды за:

  • установку расширения Grass, регистрацию и предоставление пропускной способности для веб-скрейпинга;
  • привлечение новых пользователей с последующим поощрением в рамках реферальной программы.

Стоит отметить, что ни блог, ни техническая документация Grass не содержит какой-либо информации о планируемом запуске токена и конвертации поинтов в реальные цифровые активы. Однако активные пользователи могут продать свои баллы на платформе Whales Market. Среднее предложение за один поинт на момент написания составляет $0,002. 

По данным Cryptorank, в ходе двух раундов финансирования Grass удалось привлечь $4,5 млн, что сравнительно небольшая цифра для блокчейн-проекта. К этому стоит добавить 2 млн подключенных узлов, владельцы которых, вероятно, ожидают наград за свое участие в работе сети. Поэтому проводите собственное исследование прежде чем взаимодействовать с Grass для получения аирдропа.

Как вам статья?

37
1

статьи на эту же тему

«Буллран… задерживается» — новое...
avatar Ivan Babiuk
04.09.2024
Как криптовалюты используют в схемах...
avatar Tetiana Dmytrenko
02.09.2024
Альтернативный подход: как...
avatar Ivan Babiuk
30.08.2024
Войти
или