ข้อจำกัดที่สำคัญที่สุดของ AI ไม่ใช่การออกแบบโมเดลหรือ GPU - มันคือข้อมูล และขณะนี้ข้อมูลเหล่านั้นกำลังถูกล็อคและถูกสกปรก แพลตฟอร์ม Web2 ใหญ่ (Reddit, X, Google, ฯลฯ) กำลังรักษาข้อมูลของพวกเขาไว้หลังจาก paywalls หรือ TOS ที่เข้มงวด การมีอำนาจในข้อมูลเริ่มเกิดขึ้นและพวกเขากำลังทำให้คนเล็กๆ หิวโหย At ในขณะเดียวกัน คุณภาพของเว็บเปิดเริ่มตกต่ำ - ข้อมูลถูกปนเปื้อนอย่างตั้งใจและข้อมูลที่สร้างโดย AI กำลังปล่อยให้ศูนย์กลางเสียเสียงมลพิษ นี่คือพายุสมบูรณ์: AI ต้องการข้อมูล แต่บ่อน้ำถูกควบคุมและปนเปื้อน
*ดูเวอร์ชันเต็มของ “ช่วงเวลาสำคัญของ AI” ที่พอร์ทัลวิจัย Four Pillars
ป้อน @getgrass_io, โปรโตคอลการสร้างเว็บสแครปที่คว่ำสคริปต์นี้ เชื่อว่ามีล้านเครื่องมือประจำวัน (PC ตอนนี้ โทรศัพท์เร็ว ๆ นี้) ทำหน้าที่เหมือนเป็น web crawlers เล็ก ๆ สแกนข้อมูลบนอินเทอร์เน็ต 24/7 สำหรับข้อมูลสาธารณะ กราสแปลงข้อมูลเว็บเนื้อหาดิบเป็นชุดข้อมูล AI-ready และทำได้ผ่านทางเศรษฐศาสตร์คริปโต: ผู้ใช้ได้รับรางวัลจากการมีส่วนร่วมในแบนด์วิดท์และคอมพิวเตอร์ มันเหมือนกับการขุดข้อมูลเว็บแบบ crowdsourced แต่เป็นเพื่อข้อมูลแทน Bitcoin
หญ้ามีอยู่แล้วในระดับ โหนดกว่า 3 ล้านโหนดทั่วโลกถูกเสียบเข้ากับเครือข่ายและพวกเขากําลังขูดข้อมูลมากกว่า 1,500 TB ทุกวัน ด้วยการใช้ IP ที่อยู่อาศัยนับไม่ถ้วน Grass สามารถรวบรวมข้อมูลจากเว็บไซต์ได้โดยไม่ต้องสะดุดสัญญาณเตือนป้องกันการขูดตามปกติ (ไม่ต้องแบน IP สําหรับการรวบรวมข้อมูลมากเกินไป) โดยทั่วไปจะแทนที่ฟาร์มข้อมูลแบบรวมศูนย์ขนาดยักษ์ด้วยฝูง "ผึ้งข้อมูล" แต่ละตัว - ยากที่จะตบและปรับขนาดได้ง่าย
ทำไมสิ่งนี้สำคัญ? เพราะมันช่วยให้การครอกทราบข้อมูลได้ง่ายขึ้น แทนที่บริษัทใหญ่ๆ จะสะสมข้อมูลหรือเรียกค่าบริการอย่างหลอกลวง บริษัท Startup AI หรือนักวิจัยใดก็สามารถเชื่อมต่อกับกรีนเพื่อดึงข้อมูล จินตนาการว่าการดึงข้อมูล Reddit หรือ Twitter สำหรับต้นแบบ AI ของคุณโดยไม่ต้องขอสิทธิ์การเข้าถึง API หรือจ่ายเงินล้านบาท - กรีนทำให้เป็นไปได้นั่นเอง นี่คือทางเลือกที่ไม่ต้องขออนุญาตสำหรับยุค AI: ถ้าข้อมูลคือน้ำมันใหม่ กรีนกำลังสร้างเครือข่ายที่กระจายที่ใครก็สามารถเจาะบ่อได้
Quality control is the other half of the equation, and Grass has a clever answer: zero-knowledge proofs and on-chain verification. Every piece of data scraped can be stamped with a cryptographic proof (a ZK-SNARK) attesting to its origin and integrity, logged on Grass’s own blockchain (a sovereign rollup they’re building for this purpose). In plain English: you get a receipt for each web snippet that says “this came from Source X at time Y and hasn’t been tampered with.” This is huge for fighting data poisoning and junk. When the pipeline is verifiable, you can filter out suspicious or corrupted data – or at least trace issues after the fact. In a world where AI might accidentally train on AI-generated garbage, having an authenticity stamp for data is a game-changer.
พูดถึงเทคสแต็ก: Grass เริ่มต้นที่ Solana (เพื่อความเร็ว) แต่แม้ว่า Solana จะไม่สามารถจัดการปริมาณได้ที่นี่ ดังนั้นทีมคิดว่าจะเปิดตัวระบบ Sovereign Rollup (คิดเป็น L2 blockchain ของตัวเอง) เพื่อจัดการกับการถ่ายเอกสารของ Main Chain ในขณะที่ยังยึดความไว้วางใจบนชั้นฐาน
พวกเขาเรียกการอัพเกรดครั้งใหญ่ในปัจจุบันว่า Sion และมันก็ชนเหมือนรถไฟบรรทุกสินค้าแล้ว ตอนนี้ Grass จัดการข้อมูลมากกว่า 1,500 TB ต่อวัน ไม่ใช่เป้าหมาย แต่เป็นเมตริกแบบสด Sion (Phases 1 & 2) เพิ่มพลังให้กับเครือข่ายปลดล็อกปริมาณงานระดับเพตะไบต์และเปิดใช้งานการขูดหลายรูปแบบแบบเรียลไทม์: ไม่ใช่แค่ข้อความ แต่เป็นรูปภาพและวิดีโอด้วย โดยทั่วไป Grass ยกระดับจากอาหารแบบข้อความเท่านั้นเป็นบุฟเฟ่ต์ข้อมูลเว็บที่คุณสามารถกินได้ไม่อั้น สําหรับคน AI ที่คิดนอกเหนือไปจากข้อความ (โมเดล hello vision, GPT-4 ฯลฯ ) นั่นเป็นเรื่องใหญ่
ตอนนี้ Grass สะกดกรรมการสร้างสรรค์เครือข่ายที่กว้างขวางนี้อย่างไร? เข้าสู่โทเค็นอิคส์ ตอนนี้ผู้ใช้ได้รับ "คะแนน Grass" สำหรับการเรียกใช้โหนด - พื้นที่ว่างสำหรับสิ่งจริง สิ่งที่เหมาะสม $GRASSโทเค็นอยู่บนขอบของท้องฟ้า และนี่คือที่ที่คริปโตพบกับเศรษฐมานี้ AI สิ่งประโยชน์ของโทเค็นจะเชื่อมโยงระบบทั้งหมดเข้าด้วยกัน: บริษัท AI หรือนักวิจัยจะใช้จ่าย $GRASSเพื่อขอข้อมูล (เช่น การชำระค่าบริการต่อครั้งของ API แต่มีการกระจาย) และผู้ดำเนินงานโหนดจะได้รับรายได้ $GRASSเพื่อทำคำขอเหล่านั้น (การสแกนและส่งข้อมูล) นักตรวจสอบในเครือข่ายจะมีโอกาสวางเงินประกันเพื่อให้การกระทำที่ซื่อสัตย์และการส่งข้อมูลที่มีคุณภาพสูง (ผู้กระทำที่ไม่ดีอาจถูกตัดสินใจ ผู้กระทำที่ดีจะได้รับรางวัล) สรุป $GRASSจะเสริมความราบรื่นระหว่างฝ่ายบริโภคข้อมูลและผู้ให้บริการ
อย่างสำคัญ วิธีการของ Grass ช่วยลดปัญหาด้านอนุญาติบางประการใน AI:
เพื่อให้เข้าใจว่า หญ้ายังอยู่ในช่วงเริ่มต้น มันอยู่ในระหว่างการทดลองใช้ (มีบางส่วนที่ยังเป็นกลาง (ตอนนี้มีผู้ประสานส่วนกลาง จะถูกกระจายภายหลัง) และการจัดเก็บข้อมูล / ทำความสะอาดเป็นส่วนลูกค้าในขณะนี้ แต่แนวโน้มถูกต้องแล้ว เครือข่ายกำลังขยายตัวอย่างมาก (มีจำนวนโหนดและข้อมูลที่มากที่สุดในปีนี้) และการอัพเกรดแต่ละรายการ (เช่น Sion) ทำให้มันเข้าใกล้เป็นโปรโตคอลที่เป็นอย่างเต็มรูปแบบ ที่สามารถดูแลตนเองได้
วิสัยทัศน์ยิ่งใหญ่: Grass ต้องการเป็นชั้นข้อมูลสำหรับ AI แบบกระจาย จินตนาการถึงตลาดเปิดที่ใครก็สามารถหาข้อมูลการฝึกอบรมคุณภาพสูงตามที่ต้องการได้ด้วยการเชื่อถือทางด้านการเข้ารหัส ไม่มีผู้ควบคุม ไม่ต้องจ่ายค่าเช่าให้ Reddit หรือ Google และไม่ต้องกังวลเกี่ยวกับการรุนแรงของโมเดลจากการกินหางของตัวเอง มันเป็นเส้นน้ำข้อมูล AI ที่เป็นเจ้าของโดยชุมชนและมีการรักษาความปลอดภัยโดยการใช้เทคโนโลยีเข้ารหัส
ในโลกคริปโตที่กระหน่ำและต้องการการใช้งานจริง ๆ Grass ยืนออกมาเป็นโครงการที่ผสมผสานทั้ง AI และ DePIN พร้อมผลิตภัณฑ์จริงในโลก เขามีความเก๊กๆ ตามชื่อแต่จริงจังในการดำเนินการ หากสำเร็จ Grass สามารถเปลี่ยนแปลงภูมิทัศน์ AI - ทำให้เว็บเองกลายเป็นแหล่งข้อมูลที่มีชีวิตชีวาและเปิดให้ทุกคนเข้าถึง สำหรับ VCs, ผู้สร้าง และคนที่ดู Crypto Twitter ให้สังเกตดูโครงการนี้ มันไม่ได้เห็นบ่อยที่จะเห็นชั้นสร้างพื้นฐานของอินเทอร์เน็ตในเวลาจริง โดยใช้โทเคนและความฝันของข้อมูลที่ไหลเรื่อย
分享
ข้อจำกัดที่สำคัญที่สุดของ AI ไม่ใช่การออกแบบโมเดลหรือ GPU - มันคือข้อมูล และขณะนี้ข้อมูลเหล่านั้นกำลังถูกล็อคและถูกสกปรก แพลตฟอร์ม Web2 ใหญ่ (Reddit, X, Google, ฯลฯ) กำลังรักษาข้อมูลของพวกเขาไว้หลังจาก paywalls หรือ TOS ที่เข้มงวด การมีอำนาจในข้อมูลเริ่มเกิดขึ้นและพวกเขากำลังทำให้คนเล็กๆ หิวโหย At ในขณะเดียวกัน คุณภาพของเว็บเปิดเริ่มตกต่ำ - ข้อมูลถูกปนเปื้อนอย่างตั้งใจและข้อมูลที่สร้างโดย AI กำลังปล่อยให้ศูนย์กลางเสียเสียงมลพิษ นี่คือพายุสมบูรณ์: AI ต้องการข้อมูล แต่บ่อน้ำถูกควบคุมและปนเปื้อน
*ดูเวอร์ชันเต็มของ “ช่วงเวลาสำคัญของ AI” ที่พอร์ทัลวิจัย Four Pillars
ป้อน @getgrass_io, โปรโตคอลการสร้างเว็บสแครปที่คว่ำสคริปต์นี้ เชื่อว่ามีล้านเครื่องมือประจำวัน (PC ตอนนี้ โทรศัพท์เร็ว ๆ นี้) ทำหน้าที่เหมือนเป็น web crawlers เล็ก ๆ สแกนข้อมูลบนอินเทอร์เน็ต 24/7 สำหรับข้อมูลสาธารณะ กราสแปลงข้อมูลเว็บเนื้อหาดิบเป็นชุดข้อมูล AI-ready และทำได้ผ่านทางเศรษฐศาสตร์คริปโต: ผู้ใช้ได้รับรางวัลจากการมีส่วนร่วมในแบนด์วิดท์และคอมพิวเตอร์ มันเหมือนกับการขุดข้อมูลเว็บแบบ crowdsourced แต่เป็นเพื่อข้อมูลแทน Bitcoin
หญ้ามีอยู่แล้วในระดับ โหนดกว่า 3 ล้านโหนดทั่วโลกถูกเสียบเข้ากับเครือข่ายและพวกเขากําลังขูดข้อมูลมากกว่า 1,500 TB ทุกวัน ด้วยการใช้ IP ที่อยู่อาศัยนับไม่ถ้วน Grass สามารถรวบรวมข้อมูลจากเว็บไซต์ได้โดยไม่ต้องสะดุดสัญญาณเตือนป้องกันการขูดตามปกติ (ไม่ต้องแบน IP สําหรับการรวบรวมข้อมูลมากเกินไป) โดยทั่วไปจะแทนที่ฟาร์มข้อมูลแบบรวมศูนย์ขนาดยักษ์ด้วยฝูง "ผึ้งข้อมูล" แต่ละตัว - ยากที่จะตบและปรับขนาดได้ง่าย
ทำไมสิ่งนี้สำคัญ? เพราะมันช่วยให้การครอกทราบข้อมูลได้ง่ายขึ้น แทนที่บริษัทใหญ่ๆ จะสะสมข้อมูลหรือเรียกค่าบริการอย่างหลอกลวง บริษัท Startup AI หรือนักวิจัยใดก็สามารถเชื่อมต่อกับกรีนเพื่อดึงข้อมูล จินตนาการว่าการดึงข้อมูล Reddit หรือ Twitter สำหรับต้นแบบ AI ของคุณโดยไม่ต้องขอสิทธิ์การเข้าถึง API หรือจ่ายเงินล้านบาท - กรีนทำให้เป็นไปได้นั่นเอง นี่คือทางเลือกที่ไม่ต้องขออนุญาตสำหรับยุค AI: ถ้าข้อมูลคือน้ำมันใหม่ กรีนกำลังสร้างเครือข่ายที่กระจายที่ใครก็สามารถเจาะบ่อได้
Quality control is the other half of the equation, and Grass has a clever answer: zero-knowledge proofs and on-chain verification. Every piece of data scraped can be stamped with a cryptographic proof (a ZK-SNARK) attesting to its origin and integrity, logged on Grass’s own blockchain (a sovereign rollup they’re building for this purpose). In plain English: you get a receipt for each web snippet that says “this came from Source X at time Y and hasn’t been tampered with.” This is huge for fighting data poisoning and junk. When the pipeline is verifiable, you can filter out suspicious or corrupted data – or at least trace issues after the fact. In a world where AI might accidentally train on AI-generated garbage, having an authenticity stamp for data is a game-changer.
พูดถึงเทคสแต็ก: Grass เริ่มต้นที่ Solana (เพื่อความเร็ว) แต่แม้ว่า Solana จะไม่สามารถจัดการปริมาณได้ที่นี่ ดังนั้นทีมคิดว่าจะเปิดตัวระบบ Sovereign Rollup (คิดเป็น L2 blockchain ของตัวเอง) เพื่อจัดการกับการถ่ายเอกสารของ Main Chain ในขณะที่ยังยึดความไว้วางใจบนชั้นฐาน
พวกเขาเรียกการอัพเกรดครั้งใหญ่ในปัจจุบันว่า Sion และมันก็ชนเหมือนรถไฟบรรทุกสินค้าแล้ว ตอนนี้ Grass จัดการข้อมูลมากกว่า 1,500 TB ต่อวัน ไม่ใช่เป้าหมาย แต่เป็นเมตริกแบบสด Sion (Phases 1 & 2) เพิ่มพลังให้กับเครือข่ายปลดล็อกปริมาณงานระดับเพตะไบต์และเปิดใช้งานการขูดหลายรูปแบบแบบเรียลไทม์: ไม่ใช่แค่ข้อความ แต่เป็นรูปภาพและวิดีโอด้วย โดยทั่วไป Grass ยกระดับจากอาหารแบบข้อความเท่านั้นเป็นบุฟเฟ่ต์ข้อมูลเว็บที่คุณสามารถกินได้ไม่อั้น สําหรับคน AI ที่คิดนอกเหนือไปจากข้อความ (โมเดล hello vision, GPT-4 ฯลฯ ) นั่นเป็นเรื่องใหญ่
ตอนนี้ Grass สะกดกรรมการสร้างสรรค์เครือข่ายที่กว้างขวางนี้อย่างไร? เข้าสู่โทเค็นอิคส์ ตอนนี้ผู้ใช้ได้รับ "คะแนน Grass" สำหรับการเรียกใช้โหนด - พื้นที่ว่างสำหรับสิ่งจริง สิ่งที่เหมาะสม $GRASSโทเค็นอยู่บนขอบของท้องฟ้า และนี่คือที่ที่คริปโตพบกับเศรษฐมานี้ AI สิ่งประโยชน์ของโทเค็นจะเชื่อมโยงระบบทั้งหมดเข้าด้วยกัน: บริษัท AI หรือนักวิจัยจะใช้จ่าย $GRASSเพื่อขอข้อมูล (เช่น การชำระค่าบริการต่อครั้งของ API แต่มีการกระจาย) และผู้ดำเนินงานโหนดจะได้รับรายได้ $GRASSเพื่อทำคำขอเหล่านั้น (การสแกนและส่งข้อมูล) นักตรวจสอบในเครือข่ายจะมีโอกาสวางเงินประกันเพื่อให้การกระทำที่ซื่อสัตย์และการส่งข้อมูลที่มีคุณภาพสูง (ผู้กระทำที่ไม่ดีอาจถูกตัดสินใจ ผู้กระทำที่ดีจะได้รับรางวัล) สรุป $GRASSจะเสริมความราบรื่นระหว่างฝ่ายบริโภคข้อมูลและผู้ให้บริการ
อย่างสำคัญ วิธีการของ Grass ช่วยลดปัญหาด้านอนุญาติบางประการใน AI:
เพื่อให้เข้าใจว่า หญ้ายังอยู่ในช่วงเริ่มต้น มันอยู่ในระหว่างการทดลองใช้ (มีบางส่วนที่ยังเป็นกลาง (ตอนนี้มีผู้ประสานส่วนกลาง จะถูกกระจายภายหลัง) และการจัดเก็บข้อมูล / ทำความสะอาดเป็นส่วนลูกค้าในขณะนี้ แต่แนวโน้มถูกต้องแล้ว เครือข่ายกำลังขยายตัวอย่างมาก (มีจำนวนโหนดและข้อมูลที่มากที่สุดในปีนี้) และการอัพเกรดแต่ละรายการ (เช่น Sion) ทำให้มันเข้าใกล้เป็นโปรโตคอลที่เป็นอย่างเต็มรูปแบบ ที่สามารถดูแลตนเองได้
วิสัยทัศน์ยิ่งใหญ่: Grass ต้องการเป็นชั้นข้อมูลสำหรับ AI แบบกระจาย จินตนาการถึงตลาดเปิดที่ใครก็สามารถหาข้อมูลการฝึกอบรมคุณภาพสูงตามที่ต้องการได้ด้วยการเชื่อถือทางด้านการเข้ารหัส ไม่มีผู้ควบคุม ไม่ต้องจ่ายค่าเช่าให้ Reddit หรือ Google และไม่ต้องกังวลเกี่ยวกับการรุนแรงของโมเดลจากการกินหางของตัวเอง มันเป็นเส้นน้ำข้อมูล AI ที่เป็นเจ้าของโดยชุมชนและมีการรักษาความปลอดภัยโดยการใช้เทคโนโลยีเข้ารหัส
ในโลกคริปโตที่กระหน่ำและต้องการการใช้งานจริง ๆ Grass ยืนออกมาเป็นโครงการที่ผสมผสานทั้ง AI และ DePIN พร้อมผลิตภัณฑ์จริงในโลก เขามีความเก๊กๆ ตามชื่อแต่จริงจังในการดำเนินการ หากสำเร็จ Grass สามารถเปลี่ยนแปลงภูมิทัศน์ AI - ทำให้เว็บเองกลายเป็นแหล่งข้อมูลที่มีชีวิตชีวาและเปิดให้ทุกคนเข้าถึง สำหรับ VCs, ผู้สร้าง และคนที่ดู Crypto Twitter ให้สังเกตดูโครงการนี้ มันไม่ได้เห็นบ่อยที่จะเห็นชั้นสร้างพื้นฐานของอินเทอร์เน็ตในเวลาจริง โดยใช้โทเคนและความฝันของข้อมูลที่ไหลเรื่อย