OpenAI phát hành GDPval để đánh giá hiệu suất công việc giá trị kinh tế AI PANews ngày 26 tháng 9 đưa tin, OpenAI đã ra mắt công cụ đánh giá mới GDPval, tập trung vào việc đo lường hiệu suất của AI trong các nhiệm vụ giá trị kinh tế thực tế. GDPval bao gồm 44 nghề nghiệp trong 9 ngành đóng góp lớn nhất vào GDP Mỹ, các nhiệm vụ được thiết kế bởi các chuyên gia trong ngành có trung bình 14 năm kinh nghiệm. Kết quả đánh giá cho thấy, mô hình Claude Opus 4.1 gần một nửa sản phẩm đầu ra tương đương hoặc tốt hơn mức độ của các chuyên gia. OpenAI cho biết trong tương lai sẽ tiếp tục mở rộng phạm vi và chi tiết đánh giá GDPval.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
OpenAI phát hành GDPval để đánh giá hiệu suất công việc giá trị kinh tế AI PANews ngày 26 tháng 9 đưa tin, OpenAI đã ra mắt công cụ đánh giá mới GDPval, tập trung vào việc đo lường hiệu suất của AI trong các nhiệm vụ giá trị kinh tế thực tế. GDPval bao gồm 44 nghề nghiệp trong 9 ngành đóng góp lớn nhất vào GDP Mỹ, các nhiệm vụ được thiết kế bởi các chuyên gia trong ngành có trung bình 14 năm kinh nghiệm. Kết quả đánh giá cho thấy, mô hình Claude Opus 4.1 gần một nửa sản phẩm đầu ra tương đương hoặc tốt hơn mức độ của các chuyên gia. OpenAI cho biết trong tương lai sẽ tiếp tục mở rộng phạm vi và chi tiết đánh giá GDPval.