Cỏ - Cuộc cách mạng dữ liệu

12/9/2024, 8:38:47 AM
Trung cấp
Công nghệAI
Grass cung cấp cho các mô hình và ứng dụng AI quyền truy cập vào toàn bộ Internet dưới dạng bộ dữ liệu, được thu thập thông qua một mạng lưới các nút trên khắp thế giới, những người đang đóng góp băng thông Internet nhàn rỗi của họ. Họ có lực kéo ban đầu mạnh mẽ với hơn 2.5 triệu người dùng.

Tóm tắt điều hành

Trí tuệ nhân tạo sinh sản là sáng tạo quan trọng nhất trong thời gian gần đây và ngày càng trở nên quan trọng hơn khi thời gian tiến triển. Trí tuệ nhân tạo sinh sản về cơ bản là sản phẩm của ba yếu tố:

Algorithms + Data + Compute = Intelligence

Điều này có nghĩa là Dữ liệu và Tính toán sẽ trở thành hai tài sản quan trọng nhất trên thế giới và việc truy cập vào chúng sẽ vô cùng quan trọng.

Mô hình AI sinh sản đòi hỏi dữ liệu. Dữ liệu mà các mô hình AI sinh sản quan trọng nhất hoạt động trên đó là giá trị của Internet, đó là một xấp xỉ cho tổng số kiến thức của con người.

Crypto là về việc cung cấp quyền truy cập vào tài nguyên kỹ thuật số mới trên toàn thế giới và biến những thứ trước đây không phải là tài sản thành tài sản thông qua token. Grass làm điều này cho Dữ liệu.

Grass cung cấp cho các mô hình và ứng dụng AI quyền truy cập vào toàn bộ Internet dưới dạng tập dữ liệu, trực tiếp, được thu thập thông qua một mạng lưới các nút trên khắp thế giới, những người đang đóng góp băng thông Internet nhàn rỗi của họ. Họ có lực kéo ban đầu mạnh mẽ với hơn 2.5 triệu người dùng. [1]

Tiềm năng thị trường dài hạn cho Grass rất lớn và liên quan đến kích thước thị trường trí tuệ nhân tạo và sự phát triển trong tương lai của nó. Trong quá khứ, việc thu thập các bộ dữ liệu quy mô này chỉ được giao cho các công ty công nghệ lớn nhất. Grass mang đến kinh tế mới cho dữ liệu, giảm chi phí. Điều này làm cho việc truy cập dữ liệu trở nên dễ dàng hơn không chỉ dành cho các công ty lớn và giàu có, mà còn dành cho các doanh nghiệp trí tuệ nhân tạo nhỏ hơn.

Vấn đề

Huấn luyện và điều chỉnh mô hình AI đòi hỏi lượng dữ liệu lớn. Lịch sử, một phần lớn dữ liệu đó đã được thu thập thông qua việc tạo mô hình AI lấy dữ liệu từ các trang web. Quá trình này gặp nhiều thách thức:

  • Web scraping là một quá trình đắt đỏ. Chỉ có một số tổ chức lớn có khả năng thực hiện việc cào dữ liệu trên toàn bộ web định kỳ. Điều này khiến cho các nhà phát triển trí tuệ nhân tạo nhỏ không thể tiếp cận được dữ liệu.
  • Chặn IP. Đã có một trò chơi mèo và chuột giữa những dịch vụ cào dữ liệu và những người tạo nội dung. Khá dễ dàng để chặn địa chỉ IP để ngăn chặn cào dữ liệu, làm cho việc đạt được mục tiêu cào dữ liệu và thu thập dữ liệu cần thiết cho việc huấn luyện AI và điều chỉnh tinh chỉnh trở nên khó khăn.
  • Lãng phí tài nguyên. Scraping web là một công việc có thể mang lại lợi ích cho nhiều khách hàng. Các thiết bị, băng thông và sức mạnh tính toán cần thiết cho việc này là không hiệu quả nếu chỉ do một khách hàng thực hiện.
  • Độ mới của dữ liệu. Nó cồng kềnh và tốn kém để quét toàn bộ Internet. Điều này làm cho hầu hết người dùng không thực tế để quét thường xuyên, điều này làm cho dữ liệu ít mới / gần đây hơn, ảnh hưởng đến chất lượng của các mô hình AI.

Giải pháp của Grass

Grass nhằm giải quyết những vấn đề này bằng cách tạo ra một mạng lưới liên minh của các công cụ lấy dữ liệu web. Mỗi cá nhân tham gia vào mạng lưới Grass đóng góp một phần băng thông Internet không sử dụng để cung cấp một lượng nhỏ dữ liệu lấy từ địa chỉ IP của họ. Grass sau đó tổ chức dữ liệu từ mỗi nút này để tạo thành một tập dữ liệu kết hợp hữu ích cho việc huấn luyện và điều chỉnh AI. Đây là một cách tinh vi và phù hợp để sử dụng các mạng phân tán được cung cấp bởi tiền điện tử.

Còn những trường hợp kinh doanh khác cho Internet không sử dụng như:

  • Thu thập dữ liệu địa phương/địa lý, như quảng cáo
  • Thực hiện nghiên cứu học thuật
  • Kiểm tra giá cả địa phương

Hôm nay, Grass thu thập dữ liệu bằng việc sử dụng phần cứng hiện có (laptop, máy tính để bàn, v.v.). Trong tương lai, Grass dự định cung cấp một thiết bị thu thập dữ liệu, đó là một thiết bị phần cứng tùy chỉnh chỉ dành riêng cho việc thu thập dữ liệu, tạo ra hiệu suất cao nhờ việc tối ưu hóa cho công việc cụ thể đó.

Lợi ích của cỏ

Có nhiều lợi ích khi sử dụng mạng phân tán để thu thập dữ liệu:

  • Truy cập dữ liệu web được phân quyền hóa trở nên rẻ hơn khi quy mô mở rộng. Thay vì một khách hàng duy nhất thu thập dữ liệu cho nhu cầu riêng của họ, Grass thu thập dữ liệu thay mặt cho nhiều khách hàng. Dữ liệu này có thể được bán lại nhiều lần, tạo ra quy mô kinh tế trên dữ liệu, làm giảm chi phí kinh tế của việc cào dữ liệu và làm cho thị trường trở nên hiệu quả hơn. Trong quy mô, Grass có thể trở thành giải pháp thu thập dữ liệu hiệu quả về chi phí nhất cho khách hàng, tạo ra hiệu ứng mạng kinh tế xung quanh giao thức của họ. Điều này có nghĩa là việc thu thập dữ liệu hiện đã có sẵn cho bất kỳ ai, không chỉ là một vài công ty lớn có tài nguyên để cào dữ liệu web.
  • Việc chặn IP trở nên không khả thi. Bằng cách phân phối cạo, việc phát hiện và ngăn chặn việc cạo trở nên khó khăn hơn nhiều, vì mỗi nút chỉ thực hiện một lượng thu thập dữ liệu tương đối nhỏ và khó phân biệt với lưu lượng truy cập Internet thông thường. Điều này dẫn đến các bộ dữ liệu đầy đủ hơn để đào tạo.
  • Băng thông internet được sử dụng hiệu quả hơn. Khi Grass thực sự là một cách tiêu dùng cộng tác trên băng thông internet không sử dụng, nó hiệu quả hơn việc cung cấp băng thông mới chỉ để gỡ rác.
  • Dữ liệu chính xác và mới hơn. Việc lấy dữ liệu thường xuyên trở nên hiệu quả về chi phí hơn so với việc một khách hàng điển hình có thể thực hiện. Điều này dẫn đến dữ liệu ít cũ hơn. Điều này quan trọng vì các mô hình AI kết quả sẽ được cập nhật hơn.

Thách thức: Người tạo nội dung kiếm tiền từ dữ liệu của họ

Một trong những điều khó khăn khi thu thập dữ liệu là các nhà sản xuất nội dung. Điều này bao gồm các trang web như NY Times và Reddit, người đã bắt đầu thực hiện việc thương mại hóa dữ liệu của họ bằng cách cấp phép cho bên thứ ba để huấn luyện mô hình trí tuệ nhân tạo. Họ tự nhiên bảo vệ dữ liệu trên trang web của mình vì dữ liệu đó đại diện cho nguồn thu nhập cực kỳ lợi nhuận đối với họ. Thực sự, Reddit đã cấm API của nhà phát triển của họ được sử dụng cho việc học máy để bảo vệ mô hình kinh doanh của họ trong việc cấp phép dữ liệu của họ cho người tạo mô hình trí tuệ nhân tạo (xem điều khoản dịch vụở đây).

Tương lai sẽ mang đến điều gì cho những người tạo nội dung? Nhìn vào việc tạo ra nội dung do người dùng tạo ra (UGC), như Reddit, có một lập luận rằng người dùng sở hữu dữ liệu của họ (thay vì nền tảng), vì nội dung được tạo ra bởi người dùng và nên thuộc sở hữu của họ. Lập luận này vẫn chưa được khai thác đầy đủ từ quan điểm pháp lý. Việc theo dõi vấn đề này trong tương lai sẽ rất thú vị. Tuy nhiên, nếu người dùng thực sự sở hữu dữ liệu mà họ đóng góp, thì Grass có thể biểu thị một con đường giả định để giúp người dùng tiếp thị dữ liệu mà họ đã đóng góp. Ví dụ, Grass có thể thưởng cho những người đóng góp của Reddit chính họ vì đã tự nguyện đóng góp dữ liệu mà họ đã tạo ra trên Reddit.

Đối với những nhà sáng tác nội dung được trả tiền như NY Times, nội dung được tạo ra bởi các nhà văn được trả tiền, và do đó không có lý lẽ cho dữ liệu sở hữu của người dùng. Do đó, Grass có thể đơn giản là loại trừ những trang web đó khỏi việc được cào. Như một phương án khác, Grass có thể mở rộng đến mức trở thành khách hàng của những trang web đó và trả các khoản phí cấp phép. Cách mà điều này có thể hoạt động trong trường hợp giả thuyết là khách hàng của Grass có thể trả tiền cho dữ liệu, và sau đó Grass có thể chia sẻ doanh thu lại cho nhà sáng tạo nội dung, từ đó cho phép tạo mô hình trí tuệ nhân tạo với ngân sách linh hoạt. Hoặc Grass có thể đạt được quy mô đủ lớn để đàm phán thỏa thuận cấp phép hàng loạt thay mặt cho tất cả khách hàng của nó.

Grass’ Launch

Grass đã có một lần ra mắt rất ấn tượng vào đầu năm nay:

  • Cỏ đã có phát tán rộng nhất trong lịch sử của Solana.[2]
  • Hơn 2 triệu víkhẳng địnhairdrop, gây áp lực lên mạng Solana.
  • Trên toàn cầu có hơn 2,5 triệu người dùng tổng cộng của Grass.[3]
  • Grass có khả năng và dữ liệu để huấn luyện mô hình ChatGPT 3.5 của OpenAI sẵn sàng.
  • Là một bản minh họa cho nền tảng của họ, Grass đã công khai mã nguồn một tập dữ liệu gồm 600 triệu bài viết và bình luận từ năm 2024 trên Reddit (xem tại đâycho thông báo vàđâycho bộ dữ liệu).

Vào lúc viết bài này, token Grass có Hành động giá tích cựcpost-launch (+115%), điều này không phổ biến vì hầu hết các token giảm trong vài ngày/tuần sau khi niêm yết. Điều này có thể là phản ánh của cách tiếp cận thông minh đối với phân phối airdrop, cũng như niềm tin vào tương lai và tiềm năng của Grass. Tổng cộng đây là một bước khởi đầu tuyệt vời cho mạng lưới và chúng tôi tin rằng nó mở đường cho nhiều năm thịnh vượng sắp tới.

Hiệu suất Token của Grass kể từ khi ra mắt vào ngày 28 tháng 10 năm 2024

Nguồn: TradingView.

Bắt đầu đóng gópkết nối túi tiền Solana chưa sử dụng của bạn và kiếm token Grass.

Muốn sử dụng bộ dữ liệu của Grass cho doanh nghiệp, nghiên cứu hoặc dự án của bạn? Liên hệ với nhóm tại discover@grassfoundation.io.

Chú thích

[1] Nguồn: https://www.getgrass.io/.
[2] Nguồn:https://www.google.com/url?q=https://www.theblock.co/post/323805/grass-becomes-most-distributed-solana-airdrop-as-nearly-1-5-million-addresses-claim-tokens&sa=D&source=docs&ust=1732646335082707&usg=AOvVaw0oVvhJL661rmE1ABmJqOyP.
[3] Nguồn: https://www.getgrass.io/.

Thông báo từ chối trách nhiệm:

  1. Bài viết này được sao chép từ [[](https://blog.hack.vc/grass-a-data-revolution/)[Hack VC](https://blog.hack.vc/author/hack-vc/)\], Tất cả bản quyền thuộc về tác giả gốc [Ed Roman]. Nếu có ý kiến ​​phản đối với việc tái bản này, vui lòng liên hệ với gate.Cổng Họcđội ngũ, và họ sẽ xử lý ngay lập tức.
  2. Tuyên bố từ chối trách nhiệm: Quan điểm và ý kiến được thể hiện trong bài viết này chỉ thuộc về tác giả và không thành tư tưởng đầu tư nào.
  3. Bản dịch của bài viết sang các ngôn ngữ khác được thực hiện bởi nhóm Gate Learn. Trừ khi được đề cập, việc sao chép, phân phối hoặc đạo văn các bài báo đã dịch đều bị cấm.

Mời người khác bỏ phiếu

Lịch Tiền điện tử

Cập nhật dự án
Etherex sẽ ra mắt Token REX vào ngày 6 tháng 8.
REX
22.27%
2025-08-06
Ngày Phát Triển và Quản Trị Hiếm ở Las Vegas
Cardano sẽ tổ chức Ngày Phát triển & Quản trị Rare tại Las Vegas, từ ngày 6 đến 7 tháng 8, với các buổi hội thảo, hackathon và thảo luận bàn tròn tập trung vào các chủ đề phát triển kỹ thuật và quản trị.
ADA
-3.44%
2025-08-06
Blockchain.Rio ở Rio De Janeiro
Stellar sẽ tham gia hội nghị Blockchain.Rio, dự kiến diễn ra tại Rio de Janeiro, từ ngày 5 đến 7 tháng 8. Chương trình sẽ bao gồm các bài phát biểu chính và các cuộc thảo luận nhóm có sự tham gia của đại diện hệ sinh thái Stellar phối hợp với các đối tác Cheesecake Labs và NearX.
XLM
-3.18%
2025-08-06
Hội thảo web
Circle đã công bố một hội thảo trực tuyến Executive Insights có tiêu đề "Kỷ Nguyên GENIUS Act Bắt Đầu", dự kiến diễn ra vào ngày 7 tháng 8 năm 2025, lúc 14:00 UTC. Phiên họp sẽ khám phá những tác động của GENIUS Act vừa được thông qua - khung quy định liên bang đầu tiên cho các stablecoin thanh toán tại Hoa Kỳ. Dante Disparte và Corey Then của Circle sẽ lãnh đạo cuộc thảo luận về cách mà luật pháp ảnh hưởng đến đổi mới tài sản kỹ thuật số, sự rõ ràng về quy định, và vị thế lãnh đạo của Hoa Kỳ trong cơ sở hạ tầng tài chính toàn cầu.
USDC
-0.03%
2025-08-06
AMA trên X
Ankr sẽ tổ chức một AMA trên X vào ngày 7 tháng 8 lúc 16:00 UTC, tập trung vào công việc của DogeOS trong việc xây dựng lớp ứng dụng cho DOGE.
ANKR
-3.23%
2025-08-06

Bài viết liên quan

Tất cả những điều bạn cần biết về GT-Giao thức
Người mới bắt đầu

Tất cả những điều bạn cần biết về GT-Giao thức

GT Protocol là một trong những sản phẩm AI được quảng cáo nhiều nhất của năm 2024, sử dụng công nghệ AI tiên tiến để tạo ra các công cụ giao dịch AI độc đáo. Nó có thể được sử dụng cho quản lý danh mục AI, giao dịch AI và các phương pháp đầu tư trong thị trường CeFi, DeFi và NFT, giúp mọi người dễ dàng khám phá và đầu tư vào các cơ hội Web3 khác nhau. Nó đã thu hút hàng trăm triệu người dùng tham gia.
9/25/2024, 7:10:21 AM
FDV là gì trong tiền điện tử?
Trung cấp

FDV là gì trong tiền điện tử?

Bài viết này giải thích ý nghĩa của vốn hóa thị trường pha loãng đầy đủ trong tiền điện tử và thảo luận về các bước tính toán định giá pha loãng đầy đủ, tầm quan trọng của FDV và những rủi ro khi dựa vào FDV trong tiền điện tử.
10/25/2024, 1:37:13 AM
Tương lai của KAIA sau khi thay đổi thương hiệu: So sánh về bố cục và cơ hội của hệ sinh thái TON
Trung cấp

Tương lai của KAIA sau khi thay đổi thương hiệu: So sánh về bố cục và cơ hội của hệ sinh thái TON

Bài viết này cung cấp một phân tích chuyên sâu về hướng phát triển của dự án Web3 Đông Á mới nổi KAIA sau khi cải tổ thương hiệu, tập trung vào định vị khác biệt và tiềm năng cạnh tranh so với hệ sinh thái TON. Thông qua so sánh đa chiều về định vị thị trường, cơ sở người dùng và kiến trúc công nghệ, bài viết cung cấp cho độc giả sự hiểu biết toàn diện về cả KAIA và hệ sinh thái TON, cung cấp cái nhìn sâu sắc về các cơ hội phát triển hệ sinh thái Web3 trong tương lai.
11/19/2024, 3:52:19 AM
Sentient: Kết hợp những mô hình AI Mở và Đóng tốt nhất
Trung cấp

Sentient: Kết hợp những mô hình AI Mở và Đóng tốt nhất

Mô tả Meta: Sentient là một nền tảng cho các mô hình Clopen AI, kết hợp tốt nhất của cả các mô hình mở và đóng. Nền tảng này có hai thành phần chính: OML và Sentient Protocol.
11/18/2024, 4:12:26 AM
Tars AI là gì? Khám phá Tương lai của AI và tích hợp Web3
Nâng cao

Tars AI là gì? Khám phá Tương lai của AI và tích hợp Web3

Tìm hiểu cách Tars AI kết nối khoảng cách giữa AI và Web3, cung cấp các giải pháp có khả năng mở rộng và các công cụ đổi mới cho các ứng dụng phi tập trung. Tìm hiểu về các tính năng chính, lợi ích và cách nó hoạt động.
9/22/2024, 1:16:18 PM
Nghiên cứu Gate: Sự kiện Web3 và các phát triển công nghệ Tiền điện tử (22-27 tháng 2 năm 2025)
Nâng cao

Nghiên cứu Gate: Sự kiện Web3 và các phát triển công nghệ Tiền điện tử (22-27 tháng 2 năm 2025)

Gate Research (22-27/2/2025): Ngày 21/2/Gate.io Launchpool giới thiệu Rivalz Network (RIZ). Cùng ngày, Bybit đã trải qua một vụ vi phạm bảo mật lớn với khoảng 1,5 tỷ đô la ETH bị đánh cắp. Vào ngày 24 tháng 2, Infini phải đối mặt với việc chuyển tiền bất thường do lỗi hoạt động nội bộ, nhưng người dùng đã bồi thường đầy đủ để bảo vệ tài sản của họ. Vào ngày 25 tháng 2, bản nâng cấp Pectra của Ethereum đã gặp phải rào cản trên testnet Holesky, không đạt được xác nhận cuối cùng, điều này có khả năng trì hoãn việc triển khai mainnet. Ngày 26/2, SEC chính thức kết thúc cuộc điều tra về Uniswap. Cũng trong ngày 26/2, Ondo Finance đã công bố tích hợp với mạng lưới Mastercard.
2/27/2025, 10:58:17 AM
Bắt đầu giao dịch
Đăng ký và giao dịch để nhận phần thưởng USDTEST trị giá
$100
$5500