Ranh giới lớn nhất của trí tuệ nhân tạo không phải là thiết kế mô hình hoặc GPU - mà là dữ liệu. Và ngay bây giờ, dữ liệu đó đang bị khóa và rối. Các nền tảng lớn Web2 (Reddit, X, Google, vv.) đang giữ thông tin của họ sau tường lửa hoặc các điều khoản dịch vụ chặt chẽ. Các độc quyền dữ liệu đã xuất hiện, và chúng đang làm đói những người nhỏ bé. Đồng thời, chất lượng của web mở đang giảm sút - thông tin bị cố ý độc hại, và những nội dung rác được tạo ra bởi trí tuệ nhân tạo đang làm ô nhiễm nguồn dữ liệu. Đó là một cơn bão hoàn hảo: trí tuệ nhân tạo cần dữ liệu, nhưng giếng đã được bảo vệ và ô nhiễm.
*Xem phiên bản đầy đủ của “AI’s Biggest Grassroots Moment” trênCổng thông tin Nghiên cứu Bốn Cột
Nhập @getgrass_io, một giao thức cào dữ liệu web phi tập trung đảo ngược kịch bản này. Hãy tưởng tượng hàng triệu thiết bị hàng ngày (hiện tại là PC, sắp tới là điện thoại) hoạt động như các con trùm web nhỏ, cào dữ liệu trên internet 24/7 để thu thập dữ liệu công cộng. Grass biến nội dung web thô thành các bộ dữ liệu có cấu trúc sẵn sàng cho trí tuệ nhân tạo, và nó thực hiện điều này thông qua kinh tế mã hóa: người dùng kiếm được phần thưởng khi đóng góp băng thông và tính toán. Đó giống như khai thác web do đám đông đóng góp, nhưng cho thông tin thay vì Bitcoin.
Grass đã hoạt động trực tiếp trên quy mô lớn. Hơn 3 triệu nút trên toàn cầu đã được kết nối vào mạng lưới, và chúng cùng nhau thu thập hơn 1,500 TB dữ liệu mỗi ngày. Bằng cách sử dụng vô số địa chỉ IP cư trú, Grass có thể thu thập dữ liệu từ các trang mà không bị kích hoạt cảnh báo chống scrap thông thường (không bị cấm IP vì crawling quá nhiều). Nó về cơ bản thay thế các trang trại dữ liệu tập trung lớn với một đàn “ong dữ liệu” cá nhân - khó giết, dễ mở rộng.
Tại sao điều này quan trọng? Bởi vì nó mở ra sự độc quyền dữ liệu. Thay vì một vài nhà hoạt động lớn tích trữ dữ liệu hoặc thu phí vô lý, bất kỳ startup AI hoặc nhà nghiên cứu nào đều có thể tiếp cận luồng dữ liệu của Grass. Hãy tưởng tượng việc trích dữ liệu từ Reddit hoặc Twitter cho mô hình AI của bạn mà không cần xin truy cập API hoặc chi hàng triệu đô la - Grass làm cho điều đó trở nên khả thi. Đó là sự lựa chọn không cần sự cho phép cho thời đại AI: nếu dữ liệu là dầu mới, Grass đang xây dựng một mạng lưới giàn khoan dầu phi tập trung nơi mà bất kỳ ai cũng có thể khoan.
Kiểm soát chất lượng là nửa còn lại của phương trình, và Grass có một câu trả lời thông minh: chứng minh không cần biết và xác minh trên chuỗi. Mỗi mảnh dữ liệu thu thập được có thể được đóng dấu bằng một chứng minh mật mã (một ZK-SNARK) chứng nhận nguồn gốc và tính toàn vẹn của nó, được ghi nhận trên chuỗi khối riêng của Grass (một sovereign rollup mà họ đang xây dựng cho mục đích này). Bằng cách đơn giản: bạn nhận được một biên nhận cho mỗi đoạn trích web mà nói rằng “điều này đến từ Nguồn X vào thời gian Y và chưa bị sửa đổi.” Điều này rất quan trọng trong việc chống lại việc làm ô nhiễm và rác rưởi dữ liệu. Khi đường ống có thể xác minh, bạn có thể lọc ra dữ liệu nghi ngờ hoặc bị hỏng - hoặc ít nhất là theo dõi vấn đề sau sự việc. Trong một thế giới mà trí tuệ nhân tạo có thể vô tình được huấn luyện trên rác rưởi được tạo ra bởi trí tuệ nhân tạo, việc có một tem chân thực cho dữ liệu làm thay đổi trò chơi.
Hãy nói về ngăn xếp công nghệ: Grass bắt đầu trên Solana (để tăng tốc), nhưng ngay cả Solana cũng không thể xử lý được khối lượng ở đây. Vì vậy, nhóm đang nghĩ đến việc triển khai một sovereign rollup (hãy nghĩ về nó như một chuỗi khối L2 của riêng họ) để xử lý lưu lượng lớn từ chuỗi chính, trong khi vẫn neo tin cậy trên một lớp cơ sở.
Họ gọi bản nâng cấp lớn hiện tại là Sion, và nó đã đang tác động mạnh mẽ như một tàu hàng. Bây giờ, Grass xử lý hơn 1.500 TB dữ liệu mỗi ngày - không phải là một mục tiêu, mà là một chỉ số thực tế. Sion (Các giai đoạn 1 & 2) đã tăng tốc mạng, mở khóa thông lượng tỷ byte và cho phép thu thập đa dạng thời gian thực: không chỉ là văn bản, mà còn hình ảnh và video, đều được truyền tải một cách quy mô. Đơn giản, Grass đã nâng cấp từ một chế độ ăn chỉ toàn văn bản thành một bữa tiệc dữ liệu web không giới hạn. Đối với các chuyên gia AI suy nghĩ vượt xa văn bản (xin chào các mô hình tầm nhìn, GPT-4, v.v.), điều đó là một vấn đề lớn.
Bây giờ, Grass làm thế nào để khuyến khích mạng lưới phức tạp này? Hãy tham gia vào tokenomics. Hiện tại, người dùng kiếm được điểm “Grass” khi vận hành các nút - về cơ bản là một bộ đệm cho thứ thật sự. Một cách $GRASSToken đang ở phía trước, và đây là nơi mà tiền điện tử gặp gỡ nền kinh tế AI. Tiện ích của token sẽ kết nối toàn bộ hệ thống: Các công ty hoặc nhà nghiên cứu AI sẽ chi tiêu $GRASSđể yêu cầu dữ liệu (như thanh toán mỗi lần gọi API, nhưng phi tập trung), và các nhà điều hành nút sẽ kiếm được $GRASSđể đáp ứng những yêu cầu đó (lấy và giao dữ liệu). Những người xác minh trong mạng lưới có thể sẽ đặt cược token để đảm bảo hành vi trung thực và việc giao dữ liệu chất lượng cao (những tác nhân xấu có thể bị cắt giảm, những tác nhân tốt được thưởng). Đơn giản, $GRASSsẽ bôi trơn bánh xe, cân bằng động lực giữa người tiêu dùng dữ liệu và người cung cấp.
Quan trọng, phương pháp của Grass giảm nhẹ một số vấn đề tồn tại trong trí tuệ nhân tạo:
Để rõ ràng, Grass vẫn đang ở giai đoạn đầu của nó. Nó đang ở phiên bản beta, một số phần vẫn tập trung (hiện có một người phối hợp trung tâm, sau này sẽ phân cấp), và lưu trữ/dọn dẹp dữ liệu hiện tại là phía máy khách. Nhưng quỹ đạo đã được đặt. Mạng lưới đang phát triển với kích thước lớn (đạt mức cao nhất từ trước đến nay về số nút và dung lượng dữ liệu trong năm nay), và mỗi bản nâng cấp (như Sion) đẩy nó gần hơn tới một giao thức hoàn chỉnh, tự duy trì.
Tầm nhìn là mạnh mẽ: Grass muốn trở thành lớp dữ liệu cho trí tuệ nhân tạo phi tập trung. Hãy tưởng tượng một thị trường mở, nơi mà bất kỳ ai cũng có thể có nguồn dữ liệu đào tạo chất lượng cao theo yêu cầu, với sự tin cậy mật mã được tích hợp. Không có người bảo vệ cổng, không có tiền thuê khổng lồ trả cho Reddit hoặc Google, và ít lo lắng hơn về việc các mô hình sụp đổ do tự ăn đuôi của chúng. Đó là một cống rốn dữ liệu trí tuệ nhân tạo thuộc sở hữu của cộng đồng và được bảo vệ bằng tiền điện tử.
Trong một thế giới tiền điện tử đang khát khao tiện ích thực sự, Grass nổi bật với dự án kết hợp hai xu hướng siêu lớn (Trí tuệ nhân tạo & DePIN) với một sản phẩm thực tế trong tự nhiên. Tên dự án có vẻ biết đến với meme nhưng thực thi một cách nghiêm túc. Nếu thành công, Grass có thể biến đổi cảnh quan AI - biến chính bản thân web thành một nguồn dữ liệu sống, hô hấp mà mọi người có thể truy cập. Đối với các nhà đầu tư, nhà xây dựng và những người ẩn danh trên Crypto Twitter, hãy chú ý đến dự án này. Không thường xuyên bạn thấy một tầng lớp mới của cơ sở hạ tầng internet đang được xây dựng trong thời gian thực, được thúc đẩy bởi một token và một ước mơ về thông tin tự do lưu thông.
Partilhar
Conteúdos
Ranh giới lớn nhất của trí tuệ nhân tạo không phải là thiết kế mô hình hoặc GPU - mà là dữ liệu. Và ngay bây giờ, dữ liệu đó đang bị khóa và rối. Các nền tảng lớn Web2 (Reddit, X, Google, vv.) đang giữ thông tin của họ sau tường lửa hoặc các điều khoản dịch vụ chặt chẽ. Các độc quyền dữ liệu đã xuất hiện, và chúng đang làm đói những người nhỏ bé. Đồng thời, chất lượng của web mở đang giảm sút - thông tin bị cố ý độc hại, và những nội dung rác được tạo ra bởi trí tuệ nhân tạo đang làm ô nhiễm nguồn dữ liệu. Đó là một cơn bão hoàn hảo: trí tuệ nhân tạo cần dữ liệu, nhưng giếng đã được bảo vệ và ô nhiễm.
*Xem phiên bản đầy đủ của “AI’s Biggest Grassroots Moment” trênCổng thông tin Nghiên cứu Bốn Cột
Nhập @getgrass_io, một giao thức cào dữ liệu web phi tập trung đảo ngược kịch bản này. Hãy tưởng tượng hàng triệu thiết bị hàng ngày (hiện tại là PC, sắp tới là điện thoại) hoạt động như các con trùm web nhỏ, cào dữ liệu trên internet 24/7 để thu thập dữ liệu công cộng. Grass biến nội dung web thô thành các bộ dữ liệu có cấu trúc sẵn sàng cho trí tuệ nhân tạo, và nó thực hiện điều này thông qua kinh tế mã hóa: người dùng kiếm được phần thưởng khi đóng góp băng thông và tính toán. Đó giống như khai thác web do đám đông đóng góp, nhưng cho thông tin thay vì Bitcoin.
Grass đã hoạt động trực tiếp trên quy mô lớn. Hơn 3 triệu nút trên toàn cầu đã được kết nối vào mạng lưới, và chúng cùng nhau thu thập hơn 1,500 TB dữ liệu mỗi ngày. Bằng cách sử dụng vô số địa chỉ IP cư trú, Grass có thể thu thập dữ liệu từ các trang mà không bị kích hoạt cảnh báo chống scrap thông thường (không bị cấm IP vì crawling quá nhiều). Nó về cơ bản thay thế các trang trại dữ liệu tập trung lớn với một đàn “ong dữ liệu” cá nhân - khó giết, dễ mở rộng.
Tại sao điều này quan trọng? Bởi vì nó mở ra sự độc quyền dữ liệu. Thay vì một vài nhà hoạt động lớn tích trữ dữ liệu hoặc thu phí vô lý, bất kỳ startup AI hoặc nhà nghiên cứu nào đều có thể tiếp cận luồng dữ liệu của Grass. Hãy tưởng tượng việc trích dữ liệu từ Reddit hoặc Twitter cho mô hình AI của bạn mà không cần xin truy cập API hoặc chi hàng triệu đô la - Grass làm cho điều đó trở nên khả thi. Đó là sự lựa chọn không cần sự cho phép cho thời đại AI: nếu dữ liệu là dầu mới, Grass đang xây dựng một mạng lưới giàn khoan dầu phi tập trung nơi mà bất kỳ ai cũng có thể khoan.
Kiểm soát chất lượng là nửa còn lại của phương trình, và Grass có một câu trả lời thông minh: chứng minh không cần biết và xác minh trên chuỗi. Mỗi mảnh dữ liệu thu thập được có thể được đóng dấu bằng một chứng minh mật mã (một ZK-SNARK) chứng nhận nguồn gốc và tính toàn vẹn của nó, được ghi nhận trên chuỗi khối riêng của Grass (một sovereign rollup mà họ đang xây dựng cho mục đích này). Bằng cách đơn giản: bạn nhận được một biên nhận cho mỗi đoạn trích web mà nói rằng “điều này đến từ Nguồn X vào thời gian Y và chưa bị sửa đổi.” Điều này rất quan trọng trong việc chống lại việc làm ô nhiễm và rác rưởi dữ liệu. Khi đường ống có thể xác minh, bạn có thể lọc ra dữ liệu nghi ngờ hoặc bị hỏng - hoặc ít nhất là theo dõi vấn đề sau sự việc. Trong một thế giới mà trí tuệ nhân tạo có thể vô tình được huấn luyện trên rác rưởi được tạo ra bởi trí tuệ nhân tạo, việc có một tem chân thực cho dữ liệu làm thay đổi trò chơi.
Hãy nói về ngăn xếp công nghệ: Grass bắt đầu trên Solana (để tăng tốc), nhưng ngay cả Solana cũng không thể xử lý được khối lượng ở đây. Vì vậy, nhóm đang nghĩ đến việc triển khai một sovereign rollup (hãy nghĩ về nó như một chuỗi khối L2 của riêng họ) để xử lý lưu lượng lớn từ chuỗi chính, trong khi vẫn neo tin cậy trên một lớp cơ sở.
Họ gọi bản nâng cấp lớn hiện tại là Sion, và nó đã đang tác động mạnh mẽ như một tàu hàng. Bây giờ, Grass xử lý hơn 1.500 TB dữ liệu mỗi ngày - không phải là một mục tiêu, mà là một chỉ số thực tế. Sion (Các giai đoạn 1 & 2) đã tăng tốc mạng, mở khóa thông lượng tỷ byte và cho phép thu thập đa dạng thời gian thực: không chỉ là văn bản, mà còn hình ảnh và video, đều được truyền tải một cách quy mô. Đơn giản, Grass đã nâng cấp từ một chế độ ăn chỉ toàn văn bản thành một bữa tiệc dữ liệu web không giới hạn. Đối với các chuyên gia AI suy nghĩ vượt xa văn bản (xin chào các mô hình tầm nhìn, GPT-4, v.v.), điều đó là một vấn đề lớn.
Bây giờ, Grass làm thế nào để khuyến khích mạng lưới phức tạp này? Hãy tham gia vào tokenomics. Hiện tại, người dùng kiếm được điểm “Grass” khi vận hành các nút - về cơ bản là một bộ đệm cho thứ thật sự. Một cách $GRASSToken đang ở phía trước, và đây là nơi mà tiền điện tử gặp gỡ nền kinh tế AI. Tiện ích của token sẽ kết nối toàn bộ hệ thống: Các công ty hoặc nhà nghiên cứu AI sẽ chi tiêu $GRASSđể yêu cầu dữ liệu (như thanh toán mỗi lần gọi API, nhưng phi tập trung), và các nhà điều hành nút sẽ kiếm được $GRASSđể đáp ứng những yêu cầu đó (lấy và giao dữ liệu). Những người xác minh trong mạng lưới có thể sẽ đặt cược token để đảm bảo hành vi trung thực và việc giao dữ liệu chất lượng cao (những tác nhân xấu có thể bị cắt giảm, những tác nhân tốt được thưởng). Đơn giản, $GRASSsẽ bôi trơn bánh xe, cân bằng động lực giữa người tiêu dùng dữ liệu và người cung cấp.
Quan trọng, phương pháp của Grass giảm nhẹ một số vấn đề tồn tại trong trí tuệ nhân tạo:
Để rõ ràng, Grass vẫn đang ở giai đoạn đầu của nó. Nó đang ở phiên bản beta, một số phần vẫn tập trung (hiện có một người phối hợp trung tâm, sau này sẽ phân cấp), và lưu trữ/dọn dẹp dữ liệu hiện tại là phía máy khách. Nhưng quỹ đạo đã được đặt. Mạng lưới đang phát triển với kích thước lớn (đạt mức cao nhất từ trước đến nay về số nút và dung lượng dữ liệu trong năm nay), và mỗi bản nâng cấp (như Sion) đẩy nó gần hơn tới một giao thức hoàn chỉnh, tự duy trì.
Tầm nhìn là mạnh mẽ: Grass muốn trở thành lớp dữ liệu cho trí tuệ nhân tạo phi tập trung. Hãy tưởng tượng một thị trường mở, nơi mà bất kỳ ai cũng có thể có nguồn dữ liệu đào tạo chất lượng cao theo yêu cầu, với sự tin cậy mật mã được tích hợp. Không có người bảo vệ cổng, không có tiền thuê khổng lồ trả cho Reddit hoặc Google, và ít lo lắng hơn về việc các mô hình sụp đổ do tự ăn đuôi của chúng. Đó là một cống rốn dữ liệu trí tuệ nhân tạo thuộc sở hữu của cộng đồng và được bảo vệ bằng tiền điện tử.
Trong một thế giới tiền điện tử đang khát khao tiện ích thực sự, Grass nổi bật với dự án kết hợp hai xu hướng siêu lớn (Trí tuệ nhân tạo & DePIN) với một sản phẩm thực tế trong tự nhiên. Tên dự án có vẻ biết đến với meme nhưng thực thi một cách nghiêm túc. Nếu thành công, Grass có thể biến đổi cảnh quan AI - biến chính bản thân web thành một nguồn dữ liệu sống, hô hấp mà mọi người có thể truy cập. Đối với các nhà đầu tư, nhà xây dựng và những người ẩn danh trên Crypto Twitter, hãy chú ý đến dự án này. Không thường xuyên bạn thấy một tầng lớp mới của cơ sở hạ tầng internet đang được xây dựng trong thời gian thực, được thúc đẩy bởi một token và một ước mơ về thông tin tự do lưu thông.