Самым большим узким местом искусственного интеллекта не является дизайн модели или графические процессоры - это данные. И прямо сейчас эти данные блокируются и портятся. Крупные платформы Web2 (Reddit, X, Google и т. д.) ставят барьеры перед своей информацией за плату или строгими условиями использования. Монополии на данные пришли, и они голодные к маленьким игрокам. В то же время качество открытого веба стремительно падает - информация намеренно отравляется, и порожденные ИИ бессмысленные данные загрязняют корпус. Это настоящий шторм: искусственному интеллекту нужны данные, но колодец охраняется и загрязнен.
*См. полную версию статьи “AI’s Biggest Grassroots Moment” наПортал исследований Four Pillars
Вход @getgrass_io, децентрализованный протокол сбора информации с веб-сайтов, который меняет этот сценарий. Представьте себе миллионы повседневных устройств (в настоящее время ПК, скоро телефоны), действующих как мини-пауки, сканирующие интернет круглосуточно в поисках публичных данных. Grass преобразует необработанный веб-контент в структурированные наборы данных, и делает это с помощью криптоэкономики: пользователи зарабатывают награды за предоставление пропускной способности и вычислительных мощностей. Это похоже на майнинг веб-ресурсов через сообщество, но для информации, а не для биткойнов.
Grass уже работает на полную мощность. Более 3 миллионов узлов по всему миру подключены к сети, и они совместно собирают более 1,500 ТБ данных ежедневно. Используя бесчисленное количество домашних IP-адресов, Grass может собирать данные с сайтов, не вызывая обычных сигналов о скрапинге (больше нет блокировки IP за слишком интенсивный сканирование). Фактически он заменяет гигантские централизованные фермы данных роем индивидуальных «пчел данных» - сложные для отпугивания, легко масштабируемые.
Почему это важно? Потому что это взламывает монополии на данные. Вместо того, чтобы несколько крупных игроков запасали данные или взимали абсурдные сборы, любая стартап-компания или исследователь в области искусственного интеллекта может использовать поток данных Grass. Представьте себе, что вы можете извлекать содержимое Reddit или Twitter для своей модели искусственного интеллекта, не умоляя о доступе к API или тратя миллионы - Grass делает это реальным. Это альтернатива без разрешения для эпохи искусственного интеллекта: если данные - новая нефть, то Grass создает децентрализованную сеть нефтяных вышек, в которой каждый может бурить.
Контроль качества - это другая половина уравнения, и у Grass есть хитрый ответ: доказательства с нулевым разглашением и проверка на цепочке. Каждый собранный кусок данных может быть печатан криптографическим доказательством (ZK-SNARK), подтверждающим его происхождение и целостность, зарегистрированным на собственной блокчейне Grass (суверенный роллап, который они строят для этой цели). Простыми словами: вы получаете квитанцию для каждого веб-фрагмента, которая говорит "это получено из источника X во время Y и не подверглось вмешательству". Это огромный шаг в борьбе с загрязнением данных и мусором. Когда конвейер является проверяемым, вы можете отфильтровать подозрительные или поврежденные данные - или хотя бы проследить проблемы после факта. В мире, где ИИ может случайно обучаться на генерируемом им самим мусоре, наличие печати подлинности для данных меняет игру.
Давайте поговорим о технологическом стеке: Grass начался на Solana (для скорости), но даже Solana не может справиться с объемом здесь. Поэтому команда думает о запуске суверенного роллапа (представьте себе его как свой собственный L2 блокчейн), чтобы обрабатывать высокую пропускную способность с главной цепи, сохраняя доверие на базовом уровне.
Они называют текущее крупное обновление Сион, и оно уже ударяет как грузовой поезд. Теперь Grass обрабатывает более 1 500 ТБ данных в день — не как цель, а как живую метрику. Сион (Фазы 1 и 2) ускорил сеть, разблокировав пропускную способность в петабайтах и обеспечивая реальномасштабный мультирежимный парсинг: не только текст, но и изображения и видео тоже, поступающие в масштабе. По сути, Grass перешел от диеты только текста к шведскому столу веб-данных. Для специалистов по искусственному интеллекту, думающих за пределами текста (привет, модели видения, GPT-4 и т. д.), это большое событие.
Теперь, как Grass стимулирует эту огромную сеть? Вводите токеномику. В настоящее время пользователи зарабатывают "очки Grass" за запуск узлов - в основном это заполнитель для реальной вещи. Правильно $GRASSтокен уже на горизонте, и здесь встречаются криптовалюта и экономика искусственного интеллекта. Утилита токена свяжет весь систему вместе: компании по искусственному интеллекту или исследователи будут тратить $GRASSдля запроса данных (как оплата за вызов API, но децентрализованная), и узловые операторы будут зарабатывать $GRASSдля выполнения этих запросов (сбор и доставка данных). Валидаторы в сети, вероятно, заложат токены, чтобы гарантировать честное поведение и качественную доставку данных (плохие актеры могут быть обрублены, хорошие актеры вознаграждены). Короче говоря, $GRASSсмажет колеса, выстраивая стимулы между потребителями данных и поставщиками.
Крайне важно, что подход Грасса смягчает несколько существенных проблем в области ИИ:
Чтобы быть ясным, трава все еще находится в самом начале. Он находится в бета-версии, некоторые части все еще централизованы (сейчас есть центральный координатор, который позже будет децентрализован), и хранение/очистка данных в настоящее время осуществляется на стороне клиента. Но траектория уже установлена. Сеть взрывается в размерах (в этом году были установлены исторические максимумы по узлам и объему данных), и каждое обновление (например, Sion) приближает его к полноценному, самообеспечивающему протоколу.
Видение смелое: Grass хочет быть слоем данных для децентрализованного искусственного интеллекта. Представьте себе открытый рынок, где любой может получить высококачественные обучающие данные по требованию, с встроенным криптографическим доверием. Нет преград, нет гигантских арендных платежей Reddit или Google, и меньше беспокойств о том, что модели рушатся из-за собственных ошибок. Это огромный источник данных по ИИ, принадлежащий сообществу и обеспеченный криптовалютой.
В мире криптовалют, жаждущем реальной полезности, проект Grass выделяется как проект, объединяющий два мега-тренда (ИИ и DePIN) с реальным продуктом в дикой природе. Он умён по мемам по названию, но серьёзен в выполнении. Если он будет успешен, Grass может преобразить ландшафт ИИ, превращая саму сеть в живой, дышащий источник данных, открытый для всех. Для венчурных капиталистов, строителей и скрытных пользователей Crypto Twitter, следите за этим. Не так часто можно увидеть, как новый уровень интернет-инфраструктуры создается в реальном времени, поддерживаемый токеном и мечтой о свободном потоке информации.
Пригласить больше голосов
Самым большим узким местом искусственного интеллекта не является дизайн модели или графические процессоры - это данные. И прямо сейчас эти данные блокируются и портятся. Крупные платформы Web2 (Reddit, X, Google и т. д.) ставят барьеры перед своей информацией за плату или строгими условиями использования. Монополии на данные пришли, и они голодные к маленьким игрокам. В то же время качество открытого веба стремительно падает - информация намеренно отравляется, и порожденные ИИ бессмысленные данные загрязняют корпус. Это настоящий шторм: искусственному интеллекту нужны данные, но колодец охраняется и загрязнен.
*См. полную версию статьи “AI’s Biggest Grassroots Moment” наПортал исследований Four Pillars
Вход @getgrass_io, децентрализованный протокол сбора информации с веб-сайтов, который меняет этот сценарий. Представьте себе миллионы повседневных устройств (в настоящее время ПК, скоро телефоны), действующих как мини-пауки, сканирующие интернет круглосуточно в поисках публичных данных. Grass преобразует необработанный веб-контент в структурированные наборы данных, и делает это с помощью криптоэкономики: пользователи зарабатывают награды за предоставление пропускной способности и вычислительных мощностей. Это похоже на майнинг веб-ресурсов через сообщество, но для информации, а не для биткойнов.
Grass уже работает на полную мощность. Более 3 миллионов узлов по всему миру подключены к сети, и они совместно собирают более 1,500 ТБ данных ежедневно. Используя бесчисленное количество домашних IP-адресов, Grass может собирать данные с сайтов, не вызывая обычных сигналов о скрапинге (больше нет блокировки IP за слишком интенсивный сканирование). Фактически он заменяет гигантские централизованные фермы данных роем индивидуальных «пчел данных» - сложные для отпугивания, легко масштабируемые.
Почему это важно? Потому что это взламывает монополии на данные. Вместо того, чтобы несколько крупных игроков запасали данные или взимали абсурдные сборы, любая стартап-компания или исследователь в области искусственного интеллекта может использовать поток данных Grass. Представьте себе, что вы можете извлекать содержимое Reddit или Twitter для своей модели искусственного интеллекта, не умоляя о доступе к API или тратя миллионы - Grass делает это реальным. Это альтернатива без разрешения для эпохи искусственного интеллекта: если данные - новая нефть, то Grass создает децентрализованную сеть нефтяных вышек, в которой каждый может бурить.
Контроль качества - это другая половина уравнения, и у Grass есть хитрый ответ: доказательства с нулевым разглашением и проверка на цепочке. Каждый собранный кусок данных может быть печатан криптографическим доказательством (ZK-SNARK), подтверждающим его происхождение и целостность, зарегистрированным на собственной блокчейне Grass (суверенный роллап, который они строят для этой цели). Простыми словами: вы получаете квитанцию для каждого веб-фрагмента, которая говорит "это получено из источника X во время Y и не подверглось вмешательству". Это огромный шаг в борьбе с загрязнением данных и мусором. Когда конвейер является проверяемым, вы можете отфильтровать подозрительные или поврежденные данные - или хотя бы проследить проблемы после факта. В мире, где ИИ может случайно обучаться на генерируемом им самим мусоре, наличие печати подлинности для данных меняет игру.
Давайте поговорим о технологическом стеке: Grass начался на Solana (для скорости), но даже Solana не может справиться с объемом здесь. Поэтому команда думает о запуске суверенного роллапа (представьте себе его как свой собственный L2 блокчейн), чтобы обрабатывать высокую пропускную способность с главной цепи, сохраняя доверие на базовом уровне.
Они называют текущее крупное обновление Сион, и оно уже ударяет как грузовой поезд. Теперь Grass обрабатывает более 1 500 ТБ данных в день — не как цель, а как живую метрику. Сион (Фазы 1 и 2) ускорил сеть, разблокировав пропускную способность в петабайтах и обеспечивая реальномасштабный мультирежимный парсинг: не только текст, но и изображения и видео тоже, поступающие в масштабе. По сути, Grass перешел от диеты только текста к шведскому столу веб-данных. Для специалистов по искусственному интеллекту, думающих за пределами текста (привет, модели видения, GPT-4 и т. д.), это большое событие.
Теперь, как Grass стимулирует эту огромную сеть? Вводите токеномику. В настоящее время пользователи зарабатывают "очки Grass" за запуск узлов - в основном это заполнитель для реальной вещи. Правильно $GRASSтокен уже на горизонте, и здесь встречаются криптовалюта и экономика искусственного интеллекта. Утилита токена свяжет весь систему вместе: компании по искусственному интеллекту или исследователи будут тратить $GRASSдля запроса данных (как оплата за вызов API, но децентрализованная), и узловые операторы будут зарабатывать $GRASSдля выполнения этих запросов (сбор и доставка данных). Валидаторы в сети, вероятно, заложат токены, чтобы гарантировать честное поведение и качественную доставку данных (плохие актеры могут быть обрублены, хорошие актеры вознаграждены). Короче говоря, $GRASSсмажет колеса, выстраивая стимулы между потребителями данных и поставщиками.
Крайне важно, что подход Грасса смягчает несколько существенных проблем в области ИИ:
Чтобы быть ясным, трава все еще находится в самом начале. Он находится в бета-версии, некоторые части все еще централизованы (сейчас есть центральный координатор, который позже будет децентрализован), и хранение/очистка данных в настоящее время осуществляется на стороне клиента. Но траектория уже установлена. Сеть взрывается в размерах (в этом году были установлены исторические максимумы по узлам и объему данных), и каждое обновление (например, Sion) приближает его к полноценному, самообеспечивающему протоколу.
Видение смелое: Grass хочет быть слоем данных для децентрализованного искусственного интеллекта. Представьте себе открытый рынок, где любой может получить высококачественные обучающие данные по требованию, с встроенным криптографическим доверием. Нет преград, нет гигантских арендных платежей Reddit или Google, и меньше беспокойств о том, что модели рушатся из-за собственных ошибок. Это огромный источник данных по ИИ, принадлежащий сообществу и обеспеченный криптовалютой.
В мире криптовалют, жаждущем реальной полезности, проект Grass выделяется как проект, объединяющий два мега-тренда (ИИ и DePIN) с реальным продуктом в дикой природе. Он умён по мемам по названию, но серьёзен в выполнении. Если он будет успешен, Grass может преобразить ландшафт ИИ, превращая саму сеть в живой, дышащий источник данных, открытый для всех. Для венчурных капиталистов, строителей и скрытных пользователей Crypto Twitter, следите за этим. Не так часто можно увидеть, как новый уровень интернет-инфраструктуры создается в реальном времени, поддерживаемый токеном и мечтой о свободном потоке информации.