Przegląd protokołu Grass DePIN: dane dla sztucznej inteligencji i monetyzacja aktywności internetowej

15.05.2024
15 min
6022
24
Przegląd protokołu Grass DePIN: dane dla sztucznej inteligencji i monetyzacja aktywności internetowej. Główny kolaż artykułu.

Informacja jest kluczowym elementem uczenia się i rozwijania sztucznej inteligencji. Duże modele językowe, takie jak GPT i generatywne sieci neuronowe, takie jak Midjourney, potrzebują referencji do szkolenia i udoskonalania.

Wraz z rozwojem tego sektora rośnie konkurencja o zbiory danych i dostęp do API, a także ograniczenia ze strony właścicieli zasobów internetowych. Protokół Grass ma na celu rozwiązanie tych kwestii za pomocą łańcucha bloków i dowodów zerowego ujawnienia.

Pod koniec kwietnia projekt ogłosił, że przekroczył próg 2 milionów podłączonych urządzeń, które ostatecznie powinny stać się częścią zdecentralizowanej warstwy danych dla sztucznej inteligencji. Zespół Incrypted przyjrzał się, czym jest Grass, jak działa i jak daleko deweloperzy są teraz od zamierzonego celu.

Czym jest protokół Grass?

Grass to projekt DePIN w sieci Solana służący do gromadzenia i weryfikacji danych internetowych. Twórcy Grass planują wykorzystać blockchain do rozwiązania kluczowych problemów związanych z web scraping internetowych i zbudowania bardziej przejrzystego rynku informacji z nagrodami dla wszystkich uczestników.

Ważne: w chwili pisania tego tekstu Grass nie jest technicznie projektem blockchain. Funkcja skrobania stron internetowych i system nagród są scentralizowane i kontrolowane przez zespół. W przyszłości projekt powinien zostać wdrożony we własnej sieci L2.

Protokół wykorzystuje przepustowość urządzeń użytkowników do wyszukiwania odpowiednich informacji, a następnie przetwarza pobrane dane i rejestruje ich pochodzenie za pomocą dowodów zerowej wiedzy (ZKP) przechowywanych w łańcuchu bloków. W obecnej implementacji Grass same dane są przechowywane offline bezpośrednio przez klienta, który zainicjował żądanie.

Zasadniczo Grass tworzy sieć tysięcy urządzeń zwykłych użytkowników, aby zbierać informacje ze stron internetowych, a następnie przekazywać je zainteresowanym klientom, głównie w celu szkolenia modeli sztucznej inteligencji.

Ważne: uzyskanie dostępu do protokołu w celu żądania danych jest regulowane przez zespół i wymaga podpisania wcześniejszej umowy. Grass nie ujawnia informacji o swoich klientach, więc nie można powiedzieć, kto dokładnie i w jakim celu prowadzi skrobanie stron internetowych za pomocą połączonych węzłów.

Twórcy Grass zauważają, że jest to bardziej sprawiedliwy model rynku danych w porównaniu do obecnego monopolu platform Web2, które nie dystrybuują przychodów z treści dostarczanych do szkolenia AI i jednostronnie kontrolują dostęp do informacji.

Architektura protokołu

Grass można traktować jako rozproszoną sieć kilku milionów urządzeń (węzłów) – w chwili pisania tego tekstu głównie domowych komputerów PC, ale docelowo także smartfonów.

Na wejściu sieci znajduje się klient, który wysyła do Grass żądanie pobrania danych z określonego źródła. Na wyjściu znajduje się serwer WWW zawierający wymagane informacje. Zadaniem protokołu jest skierowanie żądania klienta do określonego węzła, który skontaktuje się z serwerem w celu pobrania danych (scraping), a następnie zaszyfruje je i odeśle z powrotem.

Kluczowymi uczestnikami tego mechanizmu są:

  • węzły – urządzenia użytkowników z zainstalowanym klientem Grass, które udostępniają bezczynne pasmo na łączu internetowym w celu pobrania informacji z serwera WWW i przesłania ich do routera;
  • routery – specjalne węzły koordynujące, które monitorują stan podłączonych węzłów. Routery wysyłają żądanie do określonego węzła, a następnie przekazują otrzymaną odpowiedź do walidatora;
  • walidatory- sprawdzają poprawność żądania klienta i przekazują je do routera, a także szyfrują i podpisują otrzymane od niego dane. Ponadto walidatory oceniają odpowiedź konkretnego węzła na podstawie integralności danych, terminowości i innych kryteriów.

Po uruchomieniu sieci warstwy 2 (L2) architektura Grass stanie się bardziej złożona poprzez dodanie nowych uczestników:

  • ZK Processor – odbiera dane od walidatora, następnie przekazuje je do magazynu w sieci L2 i generuje ZKP, który jest publikowany w sieci rdzeniowej;
  • data Ledger – Data Ledger ma przechowywać w sieci L2 wszystkie informacje otrzymane przez protokół;
  • mechanizmy przetwarzania (edge embedding models) – projekt planuje wprowadzenie własnego rozwiązania do przetwarzania informacji, które pozwoli na dostarczanie oczyszczonych i ustrukturyzowanych zbiorów danych do szkolenia AI jako osobnego produktu.

Po pełnej realizacji koncepcji przedstawionej w dokumentacji technicznej, sieć powinna wyglądać następująco.

Pełna architektura Grass. Dane: Dane: Grass.

Uruchomienie sieci L2 jest zatem kluczowym krokiem w podróży Grass od “wyroczni danych” do “warstwy danych”. Deweloperzy wskazują na konieczność takiego kroku, ponieważ żaden nowoczesny blockchain, nawet tak szybki jak Solana, nie będzie w stanie poradzić sobie z przepływem żądań, które Grass planuje przetwarzać.

Czy Grass jest bezpieczny?

Zespół Grass zwraca szczególną uwagę na kwestię bezpieczeństwa aplikacji i ochrony właścicieli węzłów. Twórcy zapewniają, że użytkownicy nie mają powodów do obaw o dane osobowe i legalność działań, ponieważ rozszerzenie przeglądarki Grass nie ma dostępu do informacji przechowywanych na urządzeniu, historii i innych danych przeglądarki. Przetwarzanie żądań odbywa się w tle i jest oddzielone od sesji użytkownika.

Potwierdza to oświadczenie o ochronie prywatności w Chrome Web Store, gdzie wśród otrzymywanych danych osobowych wymieniona jest tylko geolokalizacja. Warto jednak zauważyć, że po zainstalowaniu rozszerzenie prosi o prawo do zmiany danych na wszystkich odwiedzanych stronach internetowych. Prawdopodobnie jest to konieczne do działania kanału w tle, ale nie ma szczegółowego wyjaśnienia tego.

Drugim aspektem jest legalność żądań klientów. Wynd Labs, które stoi za rozwojem protokołu, wymaga od klientów wcześniejszego podpisania umowy z użytkownikiem, która stanowi, że działania są monitorowane przez zespół i że żądający ponosi pełną odpowiedzialność. Tak więc za legalność skrobania odpowiada deweloper i klient, ale nie właściciel węzła.

Grass zauważa również, że protokół automatycznie ogranicza aktywność poszczególnych adresów IP, aby uniknąć podejrzeń i sankcji ze strony dostawcy usług internetowych.

Co ważne: rozszerzenie Grass nie przeszło audytów bezpieczeństwa i ma zamknięty kod źródłowy, więc zaufanie do jego bezpieczeństwa budowane jest na zapewnieniach twórców i pośrednio potwierdzone przez 2 miliony pobrań w Chrome Web Store. Jest prawdopodobne, że w przypadku naruszenia prywatności widzielibyśmy skargi i niskie oceny użytkowników.

Jakie problemy rozwiązuje Grass

Grass jest pozycjonowany jako warstwa danych dla infrastruktury AI, odpowiedzialna za gromadzenie, czyszczenie i strukturyzowanie informacji potrzebnych do trenowania modeli AI.

Projekt ma potencjał, aby złagodzić różnice między dużymi laboratoriami a małymi deweloperami sztucznej inteligencji, udostępniając dane i usuwając niektóre bariery, które pojawiają się w tym sektorze.

Na przykład Reddit zapewnia Google bezpłatny dostęp do swojego API na podstawie umowy na wyłączność, ograniczając go do użytkowników zewnętrznych. Ograniczenia anty-scrapingowe są również stosowane przez X (Twitter), Meta, Medium i inne platformy Web2. Powinniśmy spodziewać się, że wraz z rozwojem sztucznej inteligencji wzrośnie wartość zbiorów danych tekstowych i wizualnych, a ich dostępność spadnie.

Z drugiej strony Grass zastępuje duże centra danych skrobiących, które są łatwe do zidentyfikowania i zablokowania, zdecentralizowaną siecią urządzeń użytkowników. Pozwala to na gromadzenie danych za pośrednictwem setek tysięcy małych kanałów z rezydentnymi adresami IP, które nie podlegają ograniczeniom dostępu do danych. Jednocześnie protokół żąda tylko otwartych informacji, które są swobodnie dostępne.

Innym problemem jest “zatruwanie” lub celowe zniekształcanie zestawu danych przez źródło lub dostawcę. Jest to powszechna strategia w tak zwanych “wojnach informacyjnych“, która jest wykorzystywana do zwalczania skrobania. W niektórych przypadkach polega ona na “zatruwaniu” danych uzyskanych za pośrednictwem otwartych interfejsów API poprzez zniekształcanie treści i włączanie “ingerencji” w celu uniemożliwienia ich przemysłowego gromadzenia i utrudnienia korzystania z nich.

Ponadto niereprezentatywne lub nieprawidłowe próbki danych komplikują szkolenie algorytmów. Na przykład po uruchomieniu nowych modeli sztucznej inteligencji, takich jak Gemini, w mediach często pojawiają się nagłówki o tym, że usługa udziela odpowiedzi z uprzedzeniami w stosunku do niektórych grup rasowych lub społecznych. Jest to bezpośrednia konsekwencja uczenia się na podstawie nieprawidłowych informacji.

Zwalczanie takich “zgłoszeń” lub błędów jest niezwykle trudne, ponieważ sama ilość danych po prostu uniemożliwia ręczne sprawdzanie lub śledzenie zmian wprowadzonych podczas strukturyzacji.

Ten problem Grass rozwiązuje za pomocą blockchain i dowodów zerowego ujawnienia w celu weryfikacji pochodzenia informacji. Po uruchomieniu sieci L2, protokół będzie przechowywał metadane potwierdzające, który węzeł dostarczył odpowiedź na zapytanie i skąd pochodzą informacje. Niezmienność metadanych jest zapewniona przy użyciu ZKP, które są publikowane w sieci rdzeniowej Solana.

W ten sposób każdy niezależny programista AI będzie mógł za stosunkowo niewielką opłatą wyszukiwać informacje z serwera WWW za pośrednictwem Grass lub kupować już oczyszczone i ustrukturyzowane bazy danych w celu trenowania swoich modeli. Jednocześnie będzie on w stanie zweryfikować pochodzenie uzyskanych treści.

Taki model biznesowy sprawia, że Grass jest idealnym uzupełnieniem dla innych projektów działających na styku blockchain i sztucznej inteligencji. Messari zauważa na przykład, że walidatory sieci Bittensor już używają Grass, aby uzyskać dostęp do danych potrzebnych do szkolenia i ulepszania podsieci.

Ekosystem i integracje Bittensor. Dane: Messari.

Warto zauważyć, że opisany powyżej model działania zakłada funkcjonowanie Grassa jako niezależnego repozytorium danych, co twórcy planują osiągnąć dopiero po uruchomieniu sieci L2. Jej specyfikacja i daty wdrożenia nie są jednak jeszcze znane. Do tego czasu za przechowywanie, czyszczenie i strukturyzację danych odpowiedzialni będą klienci.

Dalszy rozwój

W październiku 2023 r. Grass opublikował materiał z tymczasowymi wynikami rozwoju i planami na przyszłość. Aby osiągnąć model biznesowy opisany w białej księdze, planowane są następujące kroki:

  • uruchomienie aplikacji mobilnych – w chwili pisania tego materiału klient Grass jest dostępny jako rozszerzenia dla przeglądarek komputerów osobistych, co ogranicza potencjalną bazę użytkowników. Dlatego w listopadzie 2023 r. zespół ogłosił uruchomienie aplikacji na Androida, a także planuje opracować klienta kompatybilnego z iOS;
  • otwarty dostęp – na etapie testów beta możliwe jest dołączenie do sieci tylko za pomocą kodu polecającego już zarejestrowanego członka. W przyszłości zespół planuje usunąć to ograniczenie, aby każdy mógł uruchomić węzeł Grass na swoim urządzeniu.

Kolejną ważną kwestią pozostaje centralizacja protokołu. Funkcja weryfikacji i szyfrowania żądań i odpowiedzi jest w chwili pisania tego tekstu obsługiwana przez scentralizowany sekwencer. Aby jednak wyeliminować pojedynczy punkt awarii i centralizację, w przyszłości powinien on zostać zastąpiony przez komitet walidatorów z własnym mechanizmem konsensusu.

Grass znajduje się zatem na wczesnym etapie rozwoju i wszystkie kluczowe decyzje, które powinny przekształcić projekt w zdecentralizowaną warstwę danych, nie zostały jeszcze wdrożone. W chwili obecnej protokół przypomina raczej pośrednika między klientami zainteresowanymi danymi a właścicielami komputerów udostępniającymi swoją przepustowość do skrobania stron internetowych. Co więcej, ci ostatni wciąż nie otrzymują żadnych realnych nagród.

Udział w Grass i możliwa dystrybucja tokenów

W chwili pisania tego tekstu Grass znajduje się w fazie beta z ograniczonym wykorzystaniem łańcucha bloków i podstawową funkcjonalnością. Protokół wykorzystuje punkty do motywowania użytkowników, oferując je jako nagrody za:

  • instalację rozszerzenia Grass, rejestrację i zapewnienie przepustowości do skrobania stron internetowych;
  • przyciąganie nowych użytkowników, a następnie nagradzanie ich poprzez program poleceń.

Warto zauważyć, że ani blog Grass, ani dokumentacja techniczna nie zawierają żadnych informacji na temat planowanego uruchomienia tokena i konwersji punktów na rzeczywiste aktywa cyfrowe. Aktywni użytkownicy mogą jednak sprzedawać swoje punkty na platformie Whales Market. Średnia oferta za punkt w momencie pisania tego tekstu wynosi 0,002 USD.

Według Cryptorank, Grass zdołał zebrać 4,5 miliona dolarów w dwóch rundach finansowania, co jest stosunkowo niewielką kwotą jak na projekt blockchain. Dodajmy do tego 2 miliony podłączonych węzłów, których właściciele prawdopodobnie oczekują nagród za udział w sieci. Warto więc przeprowadzić własne badania przed rozpoczęciem współpracy z Grass w zakresie airdrop.

Co sądzisz o tym artykule?

25
1

artykuły na ten sam temat

Czym jest płynność i jak wpływa na wartość...
avatar Ivan Babiuk
13.10.2024
PvP – nowy esej autorstwa Arthura Hayesa
avatar Ivan Babiuk
08.10.2024
Mam nadzieję, że sztuczna inteligencja nie uczyni nas całkowicie...
avatar Artem Galunov
03.10.2024
Zaloguj się
lub