Phỏng vấn | Các công ty công nghệ lớn đang đào tạo AI trên dữ liệu rác: Trực giác

Các mô hình AI đang trở nên mạnh mẽ hơn, nhưng dữ liệu mà chúng được đào tạo đang trở nên tồi tệ hơn, nói nhà sáng lập Intuition Billy Luedtke. Tóm tắt

  • AI chỉ tốt như dữ liệu mà chúng ta cung cấp, nói Billy Luedtke, người sáng lập Intuition
  • Chúng ta đang ở trong một kỷ nguyên “vào lộn ra lộn”, khi AI trở nên tự hồi quy.
  • Các mô hình phi tập trung có lợi thế về công nghệ và trải nghiệm người dùng

Khi các hệ thống AI trở nên phổ biến hơn, người dùng ngày càng gặp phải những hạn chế khó khắc phục. Trong khi các mô hình cải thiện, dữ liệu cơ bản mà các mô hình này được đào tạo vẫn không thay đổi. Hơn nữa, đệ quy, hay các mô hình AI được đào tạo trên dữ liệu được tạo ra bởi các AI khác, có thể thực sự làm tình hình tồi tệ hơn.

Để nói về tương lai của AI, crypto.news đã trò chuyện với Billy Luedtke, người sáng lập Intuition, một giao thức phi tập trung tập trung vào việc mang lại sự xác thực có thể kiểm chứng, danh tiếng và quyền sở hữu dữ liệu cho AI. Luedtke giải thích lý do tại sao các tập dữ liệu hiện tại cho AI về cơ bản là sai lầm và những gì có thể được thực hiện để khắc phục điều đó.

Crypto.news: Mọi người hiện nay đang tập trung vào hạ tầng AI — GPU, năng lượng, trung tâm dữ liệu. Liệu mọi người có đang đánh giá thấp tầm quan trọng của lớp tin cậy trong AI không? Tại sao nó lại quan trọng?

Billy Luedtke: 100%. Mọi người chắc chắn đang đánh giá thấp điều này — và nó quan trọng vì nhiều lý do.

Trước tiên, chúng ta đang bước vào cái mà tôi gọi là thời đại “nhập vào, xuất ra”. AI chỉ tốt bằng dữ liệu mà nó tiêu thụ. Nhưng dữ liệu đó — đặc biệt là từ web mở — chủ yếu bị ô nhiễm. Nó không sạch. Nó không phản ánh ý định của con người. Nhiều dữ liệu trong số đó đến từ hành vi gamified trên mạng: thích, đánh giá, thủ thuật tương tác — tất cả đều được lọc qua các thuật toán tối ưu hóa sự chú ý.

Vì vậy, khi AI thu thập thông tin từ internet, những gì nó thấy không phải là một bức tranh toàn cảnh về chúng ta. Nó thấy mọi người đang chơi với nền tảng. Tôi không hành xử giống như trên Twitter như trong đời thực. Không ai trong số chúng ta làm vậy. Chúng ta đang tối ưu hóa cho thuật toán — không phải thể hiện suy nghĩ chân thực.

Nó cũng là một quá trình đệ quy. Các nền tảng đào tạo chúng ta, và chúng ta lại cung cấp thêm những hành vi méo mó. Điều đó tạo ra một vòng lặp phản hồi — một vòng xoáy — làm biến dạng nhận thức của AI về nhân loại hơn nữa. Chúng ta không dạy nó những gì chúng ta nghĩ; chúng ta đang dạy nó những gì chúng ta nghĩ sẽ nhận được lượt thích.

Người dùng trung bình không tìm kiếm trên Google, so sánh các nguồn, hoặc suy nghĩ một cách phản biện. Họ chỉ hỏi ChatGPT hoặc một mô hình khác và chấp nhận câu trả lời mà không suy nghĩ.

Điều đó thật nguy hiểm. Nếu mô hình không minh bạch — như một chiếc hộp đen — và công ty kiểm soát nó cũng kiểm soát thông tin mà bạn được xem hoặc không được xem, thì đó là kiểm soát hoàn toàn câu chuyện. Nó tập trung, không có trách nhiệm, và cực kỳ mạnh mẽ.

Hãy tưởng tượng rằng bạn hỏi Grok về podcast hay nhất, và câu trả lời là người đã trả cho Elon nhiều nhất. Đó không phải là trí tuệ — đó chỉ là quảng cáo dưới hình thức khác.

CN: Vậy chúng ta sửa chữa điều đó như thế nào? Chúng ta xây dựng hệ thống ưu tiên sự thật và giá trị thay vì sự tương tác như thế nào?

BL: Chúng ta cần thay đổi động lực. Những hệ thống này nên phục vụ con người — không phải các tổ chức, không phải các cổ đông, không phải các nhà quảng cáo. Điều đó có nghĩa là xây dựng một lớp mới cho internet: các nguyên tắc danh tính và uy tín. Đó là những gì chúng tôi đang làm tại Intuition.

Chúng ta cần sự xác thực có thể kiểm chứng: ai đã nói gì, khi nào và trong bối cảnh nào. Và chúng ta cần một danh tiếng phân cấp, có thể di chuyển được, giúp xác định mức độ tin cậy của bất kỳ nguồn dữ liệu nào — không dựa trên cảm giác, mà dựa trên hồ sơ bối cảnh thực tế.

Reddit là một ví dụ hoàn hảo. Đây là một trong những nguồn dữ liệu huấn luyện lớn nhất cho các mô hình. Nhưng nếu một người dùng nói mỉa mai, “Chỉ cần k*** bản thân đi,” điều đó có thể bị lấy và xuất hiện trong gợi ý của mô hình cho ai đó hỏi về lời khuyên y tế.

Thật kinh khủng — và đó là điều xảy ra khi các mô hình không có bối cảnh, sự ghi nhận hoặc trọng số uy tín. Chúng ta cần biết: Người này có đáng tin cậy trong y học không? Họ có uy tín trong tài chính không? Đây có phải là một nguồn đáng tin cậy, hay chỉ là một bình luận ngẫu nhiên khác?

CN: Khi bạn nói về sự phân bổ và uy tín, dữ liệu này cần được lưu trữ ở đâu đó. Bạn nghĩ thế nào về điều đó về mặt hạ tầng — đặc biệt là với những vấn đề như bản quyền và bồi thường?

BL: Đó chính là điều chúng tôi đang giải quyết tại Intuition. Khi bạn có các nguyên tố thuộc tính có thể xác minh, bạn biết ai đã tạo ra dữ liệu gì. Điều đó cho phép sở hữu kiến thức được mã hóa bằng token — và với điều đó, là bồi thường.

Vì vậy, thay vì dữ liệu của bạn sống trên máy chủ của Google hoặc API của OpenAI, nó sống trên một đồ thị tri thức phi tập trung. Mọi người sở hữu những gì họ đóng góp. Khi dữ liệu của bạn được truy cập hoặc sử dụng trong một đầu ra AI, bạn sẽ nhận được một phần giá trị mà nó tạo ra.

Điều đó quan trọng vì ngay bây giờ chúng ta là những người nô lệ kỹ thuật số. Chúng ta chi tiêu những nguồn lực quý giá nhất của mình — thời gian, sự chú ý và sự sáng tạo — để tạo ra dữ liệu mà người khác kiếm tiền. YouTube không có giá trị chỉ vì nó lưu trữ video; nó có giá trị vì mọi người quản lý nó. Nếu không có lượt thích, bình luận hoặc đăng ký, YouTube sẽ vô giá trị.

Vì vậy, chúng tôi muốn một thế giới mà mọi người đều có thể kiếm tiền từ giá trị họ tạo ra — ngay cả khi bạn không phải là một người có ảnh hưởng hoặc hướng ngoại. Nếu bạn thường xuyên phát hiện ra những nghệ sĩ mới sớm hơn, ví dụ, gu của bạn có giá trị. Bạn nên có khả năng xây dựng một danh tiếng xung quanh điều đó và kiếm tiền từ nó.

CN: Nhưng ngay cả khi chúng ta có sự minh bạch, những mô hình này vẫn rất khó để giải thích. Chính OpenAI cũng không thể hoàn toàn giải thích cách mà các mô hình của nó đưa ra quyết định. Thì chuyện gì xảy ra tiếp theo?

BL: Điểm hay. Chúng ta không thể hoàn toàn diễn giải hành vi của mô hình — chúng quá phức tạp. Nhưng điều chúng ta có thể kiểm soát là dữ liệu huấn luyện. Đó là cần gạt của chúng ta.

Tôi sẽ đưa cho bạn một ví dụ: Tôi đã nghe về một bài nghiên cứu nơi một AI bị ám ảnh với cú và một AI khác thì giỏi toán. Họ chỉ được huấn luyện cùng nhau về các nhiệm vụ liên quan đến toán học. Nhưng đến cuối cùng, AI giỏi toán cũng bắt đầu yêu thích cú — chỉ bằng cách hấp thụ mẫu từ AI kia.

Thật điên rồ làm sao mà những mẫu hình này lại ngấm ngầm và tinh tế như vậy. Vì vậy, phòng thủ thực sự duy nhất là có ý định. Chúng ta cần phải cẩn thận về dữ liệu mà mình cung cấp cho những mô hình này. Chúng ta cần “chữa lành bản thân”, theo một cách nào đó, để xuất hiện trực tuyến một cách chân thực và xây dựng hơn. Bởi vì AI sẽ luôn phản ánh các giá trị và sự biến dạng của những người sáng tạo ra nó.

CN: Hãy nói về kinh doanh. OpenAI đang tiêu tốn tiền. Hạ tầng của họ cực kỳ đắt đỏ. Làm thế nào một hệ thống phi tập trung như Intuition có thể cạnh tranh — về mặt tài chính và kỹ thuật?

BL: Chúng tôi có hai lợi thế cốt lõi: khả năng kết hợp và sự phối hợp.

Hệ sinh thái phi tập trung — đặc biệt là trong lĩnh vực tiền điện tử — rất giỏi trong việc phối hợp. Chúng ta có những đội ngũ toàn cầu, phân tán đang làm việc trên các thành phần khác nhau của cùng một vấn đề lớn hơn. Thay vì một công ty tiêu tốn hàng tỷ đô la để chống lại thế giới, chúng ta có hàng trăm nhà đóng góp đồng thuận xây dựng các công cụ tương tác.

Nó giống như một bức tranh ghép. Một đội làm việc về danh tiếng của đại lý, một đội khác về lưu trữ phi tập trung, một đội khác nữa về các nguyên tắc danh tính — và chúng ta có thể ghép chúng lại với nhau.

Đó là siêu năng lực.

Lợi thế thứ hai là trải nghiệm người dùng. OpenAI bị khóa vào đầm lầy của mình. Họ không thể để bạn chuyển bối cảnh của mình từ ChatGPT sang Grok hoặc Anthropic — điều đó sẽ làm suy yếu khả năng phòng thủ của họ. Nhưng chúng tôi không quan tâm đến việc bị ràng buộc bởi nhà cung cấp.

Trong hệ thống của chúng tôi, bạn sẽ có thể sở hữu ngữ cảnh của mình, mang nó theo bên mình và kết nối nó với bất kỳ đại lý nào bạn muốn. Điều đó tạo ra một trải nghiệm tốt hơn. Mọi người sẽ chọn nó.

****CN:Chi phí cơ sở hạ tầng thì sao? Việc chạy các mô hình lớn là cực kỳ tốn kém. Bạn có thấy một thế giới mà các mô hình nhỏ hơn chạy cục bộ không?

BL: Vâng, 100%. Tôi thực sự nghĩ rằng đó là hướng đi của chúng ta — hướng tới nhiều mô hình nhỏ chạy cục bộ, được kết nối như các tế bào thần kinh trong một đàn phân tán.

Thay vì một trung tâm dữ liệu lớn đơn nhất, bạn có hàng tỷ thiết bị tiêu dùng đóng góp vào tính toán. Nếu chúng ta có thể phối hợp chúng — điều mà crypto xuất sắc — thì đó sẽ trở thành một kiến trúc vượt trội.

Và đây là lý do tại sao chúng tôi cũng đang xây dựng các lớp uy tín của đại lý. Các yêu cầu có thể được chuyển đến đại lý chuyên biệt phù hợp cho công việc. Bạn không cần một mô hình lớn để làm mọi thứ. Bạn chỉ cần một hệ thống thông minh để định tuyến nhiệm vụ — giống như một lớp API giữa hàng triệu đại lý.

CN: Thế còn tính xác định thì sao? LLM không giỏi cho những nhiệm vụ như toán, nơi bạn cần câu trả lời chính xác. Chúng ta có thể kết hợp mã xác định với AI không?

BL: Đó là những gì tôi muốn. Chúng ta cần đưa lại tính quyết định vào vòng lặp.

Chúng tôi bắt đầu với lý luận biểu tượng — hoàn toàn xác định — và sau đó chúng tôi đã chuyển sang học sâu, điều này là không xác định. Điều đó đã mang lại cho chúng tôi sự bùng nổ mà chúng ta đang thấy bây giờ. Nhưng tương lai là lý luận thần kinh — kết hợp những điều tốt nhất của cả hai.

Hãy để AI xử lý việc suy luận mơ hồ. Nhưng cũng hãy để nó kích hoạt các mô-đun xác định — kịch bản, hàm, động cơ logic — nơi bạn cần độ chính xác. Hãy nghĩ: “Ai trong số bạn bè của tôi thích nhà hàng này?” Điều đó nên là 100% xác định.

****CN:Thu nhỏ lại: chúng ta đã thấy các công ty tích hợp AI vào hoạt động của họ. Nhưng kết quả thì không đồng nhất. Bạn có nghĩ rằng thế hệ LLM hiện tại thực sự thúc đẩy năng suất không?

BL: Chắc chắn rồi. Điểm kỳ diệu đã đến — chỉ là nó chưa được phân bổ đồng đều.

Nếu bạn không sử dụng AI trong quy trình làm việc của mình, đặc biệt là cho mã hoặc nội dung, bạn đang làm việc với tốc độ chỉ một phần nhỏ so với những người khác. Công nghệ là có thật, và những lợi ích về hiệu suất là rất lớn. Sự gián đoạn đã xảy ra rồi. Mọi người chỉ chưa nhận ra hoàn toàn điều đó.

CN: Câu hỏi cuối cùng. Rất nhiều người đang nói rằng đây là một bong bóng. Vốn đầu tư mạo hiểm đang cạn kiệt. OpenAI đang tiêu tốn tiền. Nvidia đang tài trợ cho chính khách hàng của mình. Điều này sẽ kết thúc như thế nào?

BL: Vâng, có một bong bóng — nhưng công nghệ là có thật. Mỗi bong bóng đều vỡ, nhưng điều còn lại sau đó là các công nghệ nền tảng. AI sẽ là một trong số đó. Tiền ngu — tất cả những ứng dụng bọc bên ngoài mà không có sự đổi mới thực sự — sẽ bị rửa trôi. Nhưng các nhóm hạ tầng sâu? Họ sẽ sống sót.

Thực tế, điều này có thể theo một trong hai cách: Chúng ta có một đợt điều chỉnh nhẹ và trở lại với thực tế, nhưng sự tiến bộ vẫn tiếp tục. Hoặc, sự gia tăng năng suất lớn đến mức AI trở thành một lực lượng giảm phát trong nền kinh tế. GDP có thể tăng gấp 10 hoặc 100 lần về công suất sản xuất. Nếu điều đó xảy ra, thì việc chi tiêu là xứng đáng — chúng ta nâng cao vị thế như một xã hội.

Dù sao đi nữa, tôi lạc quan. Sẽ có sự hỗn loạn và việc mất việc, đúng vậy — nhưng cũng có khả năng cho một thế giới phong phú, hậu khan hiếm nếu chúng ta xây dựng nền tảng đúng đắn.

ON-9.41%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)