Nóng bỏng như hổ báo của DeepSeek V4 mới nhất!


✅ 100万 token siêu dài ngữ cảnh: Đúng vậy, điều này là thật! Phiên bản V4 sẽ hỗ trợ cửa sổ ngữ cảnh 100万 token. Điều này có nghĩa là nó có thể “nuốt” một lúc các văn bản siêu dài như bộ ba 《Tam Sinh》hoặc xử lý các kho mã nguồn dài, đồng thời thực hiện suy luận logic sâu.
🎯 Những điểm nổi bật nâng cấp cốt lõi:
Khả năng đa phương tiện nguyên bản: không chỉ hỗ trợ văn bản, còn có thể hiểu hình ảnh, thực hiện phân tích kết hợp hình ảnh và văn bản;
Quy mô hàng nghìn tỷ tham số: dự kiến là một mô hình nền khổng lồ với quy mô hàng nghìn tỷ tham số;
Tăng cường khả năng lập trình: tối ưu đáng kể trong hiểu biết dự án đa tệp, suy luận chuỗi dài;
Tạo SVG ấn tượng: các ví dụ thử nghiệm cho thấy, SVG do V4 tạo ra có chất lượng vượt xa thế hệ trước, ngay cả trong chế độ không suy nghĩ cũng có thể vượt qua chế độ suy nghĩ của V3.2;
⏰ Thời gian phát hành:
Theo Reuters đưa tin, DeepSeek dự kiến sẽ ra mắt phiên bản V4 vào tuần tới. Do quy mô mô hình tăng đáng kể, tốc độ huấn luyện chậm lại, thời gian phát hành bị trì hoãn so với kế hoạch ban đầu.
😊 Một chiến lược thay đổi thú vị:
Lần này, DeepSeek phá vỡ quy tắc ngành, ưu tiên mở quyền thử nghiệm cho các nhà sản xuất chip Trung Quốc như Huawei, trong khi Nvidia, AMD lại bị bỏ lại phía sau. Điều này được hiểu là một tín hiệu quan trọng nhằm củng cố hệ sinh thái tính toán nội địa.
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim