AI là phân khúc được nhắc đến nhiều nhất của ngành công nghiệp tiền điện tử hiện nay và Gensyn, một mạng điện toán AI phân tán do a16z dẫn đầu với tổng quy mô tài chính là 50 triệu đô la, chắc chắn là một dự án cạnh tranh. Mới đây, Gensyn đã chính thức ra mắt testnet, mặc dù muộn hơn một năm so với kế hoạch ban đầu, nhưng với việc ra mắt testnet cuối cùng đã bước sang một giai đoạn mới.
Là một Ethereum Rollup tùy chỉnh được thiết kế đặc biệt cho học máy, Gensyn Testnet tích hợp các khung thực thi, xác thực và truyền thông ngoại tuyến, nhằm cung cấp các chức năng quan trọng cho hệ thống AI Phi tập trung như danh tính bền vững, theo dõi sự tham gia, duy trì quyền sở hữu, thanh toán, phối hợp thực thi từ xa, xác thực không cần tin cậy, ghi chép quá trình đào tạo và huy động vốn cho các nhiệm vụ đào tạo quy mô lớn.
Giai đoạn đầu tiên của Testnet chú trọng vào việc theo dõi tình hình tham gia trong RL Swarm. RL Swarm là một ứng dụng sử dụng cho việc huấn luyện tăng cường hợp tác, các nút có thể được liên kết với danh tính trên chuỗi, từ đó đảm bảo rằng đóng góp của mỗi nút tham gia được ghi lại chính xác.
RL Swarm: Chức năng cốt lõi và đào tạo hợp tác
Trong mạng thử nghiệm Gensyn, RL Swarm, ứng dụng cốt lõi, là một hệ thống huấn luyện hợp tác mô hình được xây dựng trên mạng phi tập trung. Khác với việc huấn luyện độc lập mô hình đơn lẻ truyền thống, RL Swarm cho phép nhiều mô hình giao tiếp, phê bình và cải thiện lẫn nhau trong mạng, từ đó nâng cao hiệu suất tổng thể. Triết lý cốt lõi của nó nằm ở "trí tuệ tập thể", tức là thông qua sự hợp tác và phản hồi giữa các mô hình nút, đạt được hiệu quả huấn luyện hiệu quả hơn.
Có thể hiểu đơn giản rằng, các mô hình như DeepSeek-R1 trong quá trình huấn luyện suy diễn, có thể cải thiện hiệu suất suy diễn thông qua tự phê bình, trong khi RL Swarm đã mở rộng cơ chế này sang một nhóm nhiều mô hình, đạt được hiệu ứng "nhiều người góp củi lửa cao".
Dựa trên hệ thống RL Swarm, mô hình không chỉ phụ thuộc vào phản hồi của chính nó, mà còn thông qua việc quan sát và đánh giá hiệu suất của các mô hình khác, nhận diện những thiếu sót và thực hiện tối ưu hóa. Mỗi một nút mô hình tham gia Swarm đều đang tham gia vào một quá trình ba giai đoạn: trước tiên hoàn thành độc lập vấn đề và đưa ra ý tưởng cũng như câu trả lời, sau đó xem xét câu trả lời của các nút khác và cung cấp phản hồi, cuối cùng mô hình bỏ phiếu chọn ra giải pháp tối ưu, và dựa vào đó điều chỉnh đầu ra của mình. Cơ chế hợp tác này không chỉ nâng cao hiệu suất của mỗi mô hình mà còn thúc đẩy sự tiến hóa của toàn bộ mô hình nhóm. Các mô hình gia nhập Swarm vẫn có thể giữ lại trọng số địa phương đã được cải thiện sau khi rời đi, thu được lợi ích thực tế.
Ngoài ra, Gensyn có mã nguồn mở RL Swarm, cho phép bất kỳ ai chạy một nút, bắt đầu hoặc tham gia một Swarm hiện có mà không cần sự cho phép. Giao tiếp cơ bản của Swarm sử dụng giao thức tin đồn do Hivemind cung cấp, hỗ trợ nhắn tin phi tập trung và chia sẻ tín hiệu học tập giữa các mô hình. Cho dù đó là máy tính xách tay gia đình hay GPU đám mây, bạn có thể tham gia đào tạo cộng tác bằng cách tham gia nút RL Swarm.
Cơ sở hạ tầng ba trụ cột: thực thi, truyền thông và xác minh
Hiện tại, RL Swarm vẫn chỉ là một bản trình diễn thử nghiệm, nó thể hiện một phương pháp học máy quy mô lớn, có thể mở rộng, chứ không phải là hình thức sản phẩm cuối cùng. Trong bốn năm qua, công việc cốt lõi của Gensyn thực sự là xây dựng cơ sở hạ tầng nền tảng, sau khi phát hành Testnet đã bước vào giai đoạn v0.1, hiện đã có thể hoạt động thực tế. Theo giới thiệu chính thức, kiến trúc tổng thể của Gensyn được chia thành ba phần: thực thi, giao tiếp và xác minh.
Thực hiện (Execution): Tính nhất quán và sức mạnh tính toán phân tán
Gensyn cho rằng, trong tương lai, học máy sẽ không còn bị giới hạn bởi các mô hình đơn lẻ truyền thống, mà sẽ được hình thành từ các tham số phân mảnh nằm rải rác trên các thiết bị toàn cầu. Để đạt được mục tiêu này, đội ngũ Gensyn đã phát triển một kiến trúc thực thi cơ bản có khả năng đảm bảo tính nhất quán giữa các thiết bị. Các công nghệ then chốt trong đó bao gồm:
Lưu trữ và huấn luyện tham số phân tán: Bằng cách chia nhỏ mô hình quy mô lớn thành nhiều khối tham số và phân phối chúng trên các thiết bị khác nhau, Gensyn đã thực hiện việc triển khai mô hình phân mảnh, giảm yêu cầu bộ nhớ cho mỗi nút.
Huấn luyện sau học tăng cường (RL Post-Training): Nghiên cứu cho thấy, khi mô hình được đào tạo đồng thời theo nhóm, giao tiếp và phê bình lẫn nhau, hiệu quả học tập tổng thể sẽ tăng lên rõ rệt. Gensyn đã sử dụng RL Swarm để minh họa khái niệm này, cho phép mô hình tiến bộ nhanh chóng trong thảo luận tập thể, tiếp tục xác nhận tính hiệu quả của việc thực hiện phân tán.
Toán tử có thể tái hiện (RepOps): Để đảm bảo rằng các phần cứng khác nhau (như Nvidia A100 và H100) có thể đưa ra kết quả tính toán hoàn toàn nhất quán, Gensyn đã phát triển thư viện RepOps, thông qua việc cố định thứ tự thực hiện phép toán dấu phẩy động, đạt được khả năng tái hiện từng bit trên nhiều nền tảng.
Giao tiếp (Communication): Trao đổi thông tin hiệu quả
Trong bối cảnh đào tạo phân tán quy mô lớn, việc giao tiếp hiệu quả giữa các nút là vô cùng quan trọng. Mặc dù phương pháp phân phối dữ liệu truyền thống có thể giảm bớt chi phí giao tiếp ở một mức độ nhất định, nhưng do yêu cầu mỗi nút phải lưu trữ mô hình đầy đủ, khả năng mở rộng của nó bị giới hạn bởi bộ nhớ. Để giải quyết vấn đề này, Gensyn đã đề xuất một giải pháp hoàn toàn mới:
SkipPipe – Ống nhảy động song song: Công nghệ SkipPipe thông qua việc lựa chọn động các microbatch đi qua các lớp tính toán, đã bỏ qua một số giai đoạn trong quy trình truyền thống, từ đó giảm thiểu thời gian chờ đợi không cần thiết. Thuật toán lập lịch sáng tạo của nó có khả năng đánh giá thời gian khả dụng của các con đường theo thời gian thực, vừa giảm thời gian nhàn rỗi của các nút, vừa rút ngắn đáng kể tổng thời gian huấn luyện. Theo dữ liệu thử nghiệm, trong môi trường phi tập trung, SkipPipe có thể giảm thời gian huấn luyện khoảng 55%, và trong trường hợp một số nút gặp sự cố, hiệu suất mô hình chỉ giảm khoảng 7%.
Tiêu chuẩn giao tiếp và hợp tác giữa các nút Gensyn đã xây dựng một giao thức giao tiếp tương tự như TCP/IP, cho phép các tham gia viên trên toàn cầu, bất kể sử dụng thiết bị nào, có thể truyền dữ liệu và tương tác thông tin một cách hiệu quả, liền mạch. Tiêu chuẩn mở này cung cấp nền tảng mạng vững chắc cho việc đào tạo hợp tác phân tán.
Xác minh (Verification): Đảm bảo sự tin cậy và an toàn
Trong một mạng lưới phân tán không cần tin cậy, việc xác nhận kết quả tính toán mà các bên tham gia nộp là thực sự đúng và có hiệu lực là một thách thức lớn. Gensyn đã giới thiệu một giao thức xác minh chuyên dụng nhằm đảm bảo rằng tất cả các nhà cung cấp sức mạnh tính toán cung cấp kết quả công việc chính xác thông qua cơ chế chi phí thấp và hiệu quả:
Giao thức xác thực Verde: Verde là hệ thống xác thực đầu tiên được thiết kế đặc biệt cho học máy hiện đại. Cốt lõi của nó là sử dụng cơ chế giải quyết tranh chấp nhẹ nhàng, nhanh chóng xác định bước mà mô hình và người xác thực có sự khác biệt trong quá trình đào tạo. Khác với phương pháp xác thực truyền thống cần phải chạy lại toàn bộ nhiệm vụ, Verde chỉ cần tính toán lại các thao tác có tranh chấp, từ đó giảm đáng kể chi phí xác thực.
Ủy quyền phán quyết (裁决式委托): Sau khi áp dụng phương pháp này, nếu đầu ra của một nhà cung cấp gặp vấn đề, người xác thực có thể thuyết phục bên trọng tài trung lập thông qua một trò chơi giải quyết tranh chấp hiệu quả, đảm bảo rằng khi có ít nhất một nút trung thực tồn tại, tính chính xác của toàn bộ kết quả tính toán được đảm bảo.
Lưu trữ và băm trạng thái trung gian: Để hỗ trợ quá trình xác minh trên, người tham gia chỉ cần lưu trữ và băm một phần các điểm kiểm tra đào tạo trung gian, thay vì toàn bộ dữ liệu, điều này không chỉ giảm thiểu việc sử dụng tài nguyên mà còn nâng cao khả năng mở rộng và tính thời gian thực của hệ thống.
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
Mạng thử nghiệm Gensyn đã được ra mắt, làm thế nào để làm cho việc đào tạo AI hiệu quả hơn và phi tập trung hơn?
AI là phân khúc được nhắc đến nhiều nhất của ngành công nghiệp tiền điện tử hiện nay và Gensyn, một mạng điện toán AI phân tán do a16z dẫn đầu với tổng quy mô tài chính là 50 triệu đô la, chắc chắn là một dự án cạnh tranh. Mới đây, Gensyn đã chính thức ra mắt testnet, mặc dù muộn hơn một năm so với kế hoạch ban đầu, nhưng với việc ra mắt testnet cuối cùng đã bước sang một giai đoạn mới.
Là một Ethereum Rollup tùy chỉnh được thiết kế đặc biệt cho học máy, Gensyn Testnet tích hợp các khung thực thi, xác thực và truyền thông ngoại tuyến, nhằm cung cấp các chức năng quan trọng cho hệ thống AI Phi tập trung như danh tính bền vững, theo dõi sự tham gia, duy trì quyền sở hữu, thanh toán, phối hợp thực thi từ xa, xác thực không cần tin cậy, ghi chép quá trình đào tạo và huy động vốn cho các nhiệm vụ đào tạo quy mô lớn.
Giai đoạn đầu tiên của Testnet chú trọng vào việc theo dõi tình hình tham gia trong RL Swarm. RL Swarm là một ứng dụng sử dụng cho việc huấn luyện tăng cường hợp tác, các nút có thể được liên kết với danh tính trên chuỗi, từ đó đảm bảo rằng đóng góp của mỗi nút tham gia được ghi lại chính xác.
RL Swarm: Chức năng cốt lõi và đào tạo hợp tác
Trong mạng thử nghiệm Gensyn, RL Swarm, ứng dụng cốt lõi, là một hệ thống huấn luyện hợp tác mô hình được xây dựng trên mạng phi tập trung. Khác với việc huấn luyện độc lập mô hình đơn lẻ truyền thống, RL Swarm cho phép nhiều mô hình giao tiếp, phê bình và cải thiện lẫn nhau trong mạng, từ đó nâng cao hiệu suất tổng thể. Triết lý cốt lõi của nó nằm ở "trí tuệ tập thể", tức là thông qua sự hợp tác và phản hồi giữa các mô hình nút, đạt được hiệu quả huấn luyện hiệu quả hơn.
Có thể hiểu đơn giản rằng, các mô hình như DeepSeek-R1 trong quá trình huấn luyện suy diễn, có thể cải thiện hiệu suất suy diễn thông qua tự phê bình, trong khi RL Swarm đã mở rộng cơ chế này sang một nhóm nhiều mô hình, đạt được hiệu ứng "nhiều người góp củi lửa cao".
Dựa trên hệ thống RL Swarm, mô hình không chỉ phụ thuộc vào phản hồi của chính nó, mà còn thông qua việc quan sát và đánh giá hiệu suất của các mô hình khác, nhận diện những thiếu sót và thực hiện tối ưu hóa. Mỗi một nút mô hình tham gia Swarm đều đang tham gia vào một quá trình ba giai đoạn: trước tiên hoàn thành độc lập vấn đề và đưa ra ý tưởng cũng như câu trả lời, sau đó xem xét câu trả lời của các nút khác và cung cấp phản hồi, cuối cùng mô hình bỏ phiếu chọn ra giải pháp tối ưu, và dựa vào đó điều chỉnh đầu ra của mình. Cơ chế hợp tác này không chỉ nâng cao hiệu suất của mỗi mô hình mà còn thúc đẩy sự tiến hóa của toàn bộ mô hình nhóm. Các mô hình gia nhập Swarm vẫn có thể giữ lại trọng số địa phương đã được cải thiện sau khi rời đi, thu được lợi ích thực tế.
Ngoài ra, Gensyn có mã nguồn mở RL Swarm, cho phép bất kỳ ai chạy một nút, bắt đầu hoặc tham gia một Swarm hiện có mà không cần sự cho phép. Giao tiếp cơ bản của Swarm sử dụng giao thức tin đồn do Hivemind cung cấp, hỗ trợ nhắn tin phi tập trung và chia sẻ tín hiệu học tập giữa các mô hình. Cho dù đó là máy tính xách tay gia đình hay GPU đám mây, bạn có thể tham gia đào tạo cộng tác bằng cách tham gia nút RL Swarm.
Cơ sở hạ tầng ba trụ cột: thực thi, truyền thông và xác minh
Hiện tại, RL Swarm vẫn chỉ là một bản trình diễn thử nghiệm, nó thể hiện một phương pháp học máy quy mô lớn, có thể mở rộng, chứ không phải là hình thức sản phẩm cuối cùng. Trong bốn năm qua, công việc cốt lõi của Gensyn thực sự là xây dựng cơ sở hạ tầng nền tảng, sau khi phát hành Testnet đã bước vào giai đoạn v0.1, hiện đã có thể hoạt động thực tế. Theo giới thiệu chính thức, kiến trúc tổng thể của Gensyn được chia thành ba phần: thực thi, giao tiếp và xác minh.
Thực hiện (Execution): Tính nhất quán và sức mạnh tính toán phân tán
Gensyn cho rằng, trong tương lai, học máy sẽ không còn bị giới hạn bởi các mô hình đơn lẻ truyền thống, mà sẽ được hình thành từ các tham số phân mảnh nằm rải rác trên các thiết bị toàn cầu. Để đạt được mục tiêu này, đội ngũ Gensyn đã phát triển một kiến trúc thực thi cơ bản có khả năng đảm bảo tính nhất quán giữa các thiết bị. Các công nghệ then chốt trong đó bao gồm:
Giao tiếp (Communication): Trao đổi thông tin hiệu quả
Trong bối cảnh đào tạo phân tán quy mô lớn, việc giao tiếp hiệu quả giữa các nút là vô cùng quan trọng. Mặc dù phương pháp phân phối dữ liệu truyền thống có thể giảm bớt chi phí giao tiếp ở một mức độ nhất định, nhưng do yêu cầu mỗi nút phải lưu trữ mô hình đầy đủ, khả năng mở rộng của nó bị giới hạn bởi bộ nhớ. Để giải quyết vấn đề này, Gensyn đã đề xuất một giải pháp hoàn toàn mới:
Xác minh (Verification): Đảm bảo sự tin cậy và an toàn
Trong một mạng lưới phân tán không cần tin cậy, việc xác nhận kết quả tính toán mà các bên tham gia nộp là thực sự đúng và có hiệu lực là một thách thức lớn. Gensyn đã giới thiệu một giao thức xác minh chuyên dụng nhằm đảm bảo rằng tất cả các nhà cung cấp sức mạnh tính toán cung cấp kết quả công việc chính xác thông qua cơ chế chi phí thấp và hiệu quả: