DeepSeek tung V3.2-Exp xử lý văn bản dài, giá API rẻ hơn 50%

Admin

Công ty công nghệ DeepSeek (Trung Quốc) vừa giới thiệu mô hình AI thử nghiệm V3.2-Exp, hướng đến khả năng xử lý văn bản dài hiệu quả hơn và cắt giảm đáng kể chi phí vận hành.

DeepSeek tung V3.2-Exp xử lý văn bản dài, giá API rẻ hơn 50% - Ảnh 1.

DeepSeek giới thiệu mô hình AI mới tối ưu chi phí - Ảnh: REUTERS

Ngày 29-9, Công ty công nghệ DeepSeek (Trung Quốc) công bố mô hình DeepSeek tung V3.2-Exp xử lý văn bản dài, giá API rẻ hơn 50% - Ảnh 3.DeepSeek: Trong kỳ vọng, ngoài hoài nghiĐỌC NGAY

Thời điểm ra mắt V3.2-Exp trùng với giai đoạn các tập đoàn về công nghệ đang tăng tốc phát triển mô hình thế hệ mới. 

OpenAI được cho là đang chuẩn bị giới thiệu bản kế nhiệm GPT-4; Alibaba mở rộng hệ sinh thái Qwen; Baidu và Tencent tiếp tục đẩy mạnh tích hợp AI vào nền tảng dịch vụ sẵn có. 

Các công ty như Anthropic, Cohere hay xAI cũng liên tục cải tiến mô hình để tranh giành thị phần. Trong bối cảnh đó, lợi thế kết hợp giữa hiệu năng và chi phí thấp có thể giúp DeepSeek định vị ở nhóm doanh nghiệp vừa và nhỏ, nơi yếu tố giá thành mang tính quyết định.

Theo giới chuyên môn, khả năng xử lý chuỗi văn bản dài của V3.2-Exp phù hợp với các ứng dụng trong môi trường doanh nghiệp và ngành dịch vụ: trợ lý số đọc hiểu tài liệu nội bộ, hỗ trợ lập trình với ngữ cảnh mã nguồn phức tạp, phân tích dữ liệu chuyên ngành như pháp lý hoặc tài chính, vận hành chatbot có khả năng duy trì hội thoại dài, hay tạo nội dung dạng dài với độ nhất quán cao. 

Nếu cơ chế Sparse Attention đạt hiệu quả thực tế như kỳ vọng, hướng tiếp cận này có thể trở thành lựa chọn mới thay cho việc tăng số tham số mô hình một cách tuyến tính.

Việc DeepSeek gọi V3.2-Exp là 'bước trung gian' cho thấy công ty đang chủ động thử nghiệm kiến trúc mới, thu thập phản hồi và tiếp tục đầu tư vào hoạt động nghiên cứu và phát triển (R&D) trước khi tung ra phiên bản hoàn thiện hơn. Hiện chưa có lịch trình cụ thể cho bản nâng cấp tiếp theo, nhưng động thái này cho thấy DeepSeek đang theo đuổi chiến lược dài hạn thay vì chỉ chạy theo truyền thông.

Dù chưa tạo hiệu ứng truyền thông mạnh như các bản phát hành trước, V3.2-Exp phản ánh xu hướng dịch chuyển của ngành AI: thay vì tiếp tục phô diễn sức mạnh bằng quy mô, các công ty bắt đầu coi trọng hiệu quả xử lý, chi phí triển khai và khả năng tối ưu tài nguyên.

Nếu chứng minh được sự ổn định với chi phí thấp, DeepSeek có thể củng cố vị thế trong mảng API doanh nghiệp và góp phần định hình cuộc đua AI giữa Mỹ và Trung Quốc trong kỷ nguyên hậu GPT-4.

DeepSeek tung mô hình AI V3.2-Exp: Bước đệm chiến lược trong cuộc đua tối ưu chi phí - Ảnh 3.Sau nửa năm, DeepSeek của Trung Quốc có làm thay đổi ngành AI?

DeepSeek, mô hình AI của Trung Quốc, đã gây chấn động thị trường khi chứng minh rằng có thể tạo ra một mô hình mạnh mẽ với chi phí thấp.

Đọc tiếp Về trang Chủ đề