Hỗ trợ nội dung miễn phí

Chúng tôi sử dụng quảng cáo để giữ cho nội dung của chúng tôi miễn phí cho bạn. Vui lòng cho phép quảng cáo và để các nhà tài trợ tài trợ cho việc lướt web của bạn.
Cảm ơn bạn!

Cách Trung Quốc tạo ra AI vượt qua mô hình tốt nhất của Mỹ mà chi phí đầu tư so với OpenAI lại thấp hơn ít nhất 53,5 lần

Markettimes 21 Giờ trước

Mở đầu bài viết, ông Bảo đặt câu hỏi: “Làm cách nào để AI Trung Quốc dù đi sau Mỹ rất nhiều năm, trong bối cảnh “thiếu chip, thiếu tiền, thiếu dữ liệu và môi trường” lại tạo ra một hệ AI tổng quát (GAI) có thể vượt trội so với những mô hình AI tốt nhất của Mỹ, không những thế chi phí đầu tư lại thấp hơn ít nhất 53,5 lần OpenAI?”.

Theo ông, đây chính là câu hỏi mà những người làm AI, kinh doanh công nghệ của Mỹ cũng như toàn thế giới đang đặt ra câu hỏi và tìm câu trả lời.

Lý do đầu tiên theo vị lãnh đạo của FPT chính là nhờ những thiên tài trẻ với sứ mệnh cống hiến.

Theo ông Liang Wenfeng, người phụ trách Quỹ đầu tư Định lượng Trung Quốc khi tập hợp nhân sự cho DeepSeek, ông không tìm kiếm các chuyên gia AI có kinh nghiệm, không tìm kiếm các người được đào tạo và làm việc ở nước ngoài.

Thay vào đó, ông tập trung vào những nghiên cứu sinh từ các trường đại học hàng đầu Trung Quốc, bao gồm Đại học Bắc Kinh và Thanh Hoa, những người mong muốn chứng tỏ bản thân (hơn là mục tiêu tạo ra sản phẩm để làm giàu), đã giành được giải thưởng tại các hội nghị học thuật quốc tế. 

Chiến lược tuyển dụng này đã giúp tạo ra văn hóa công ty hợp tác, nơi mọi người được tự do sử dụng nhiều tài nguyên máy tính, trái ngược với văn hóa cạnh tranh tài nguyên của các công ty Internet lâu đời của Trung Quốc.

Hơn nữa, ông Liang cho rằng, sinh viên phù hợp hơn với việc nghiên cứu đầu tư cao, lợi nhuận thấp, bởi với những người trẻ họ có thể cống hiến hoàn toàn cho một sứ mệnh cao cả mà không thực dụng. 

Ông Liang đã đặt ra sứ mệnh cho những sinh viên tài năng trẻ: “Deep Seek được tạo ra để giải quyết những bài toán khó nhất thế giới”.

Người phụ trách Quỹ đầu tư Định lượng của Trung Quốc cũng truyền cho các bạn trẻ tinh thần yêu nước, mong muốn vượt qua các rào cản về bao vây, cấm vận công nghệ của Mỹ đối với Trung Quốc. 

Ông mong muốn các bạn trẻ cam kết thúc đẩy vị trí của Trung Quốc trong việc dẫn đầu đổi mới, sáng tạo trên toàn cầu.

gulfnews_2024-12-24_4q1jte3q_liang-wenfeng-deepseek-ai-ceo_-ezgif.com-avif-to-jpg-converter.jpgÔng Liang Wenfeng- Người sáng lập và CEO của DeepSeek

Lý do thứ hai để tạo ra DeepSeek theo ông Bảo là chính là việc Trung Quốc phải tìm cách vượt qua hạn chế về chip tiên tiến. Theo đó, vào tháng 10/2022, Trung Quốc bị cấm nhập khẩu chip tiên tiến như H100 của Nvidia. 

DeepSeek phải đưa ra một phương pháp luận hiệu quả hơn để đào tạo các mô hình AI của mình. 

Họ đã tối ưu hóa kiến trúc mô hình AI bằng cách sử dụng một loạt thủ thuật kỹ thuật, các sơ đồ giao tiếp tùy chỉnh giữa các con chip, giảm kích thước các trường dữ liệu để tiết kiệm bộ nhớ, yêu cầu sử dụng ít tài nguyên máy tính hơn để đào tạo, sử dụng sáng tạo bằng cách kết hợp các mô hình AI khác nhau. 

Nhiều cách tiếp cận này tuy không phải là mới, nhưng kết hợp chúng thành công để tạo ra một mô hình AI tiên tiến trong một khoảng thời gian cực ngắn, với chi phí cực rẻ là một kỳ tích.

Kết quả, DeepSeek hiệu quả đến mức chỉ cần 1/10 sức mạnh tính toán của LIama 3.1 của Meta.

Theo ông Bảo, việc phát triển các mô hình AI mã nguồn mở là cách duy nhất để Trung Quốc bắt kịp Mỹ, bởi nó thu hút nhiều người dùng và nhiều người đóng góp hơn vào kho mã nguồn mở AI. 

Các nhà nghiên cứu AI Trung Quốc đã đạt được điều mà nhiều người nghĩ là cách nhiều năm ánh sáng: Một mô hình AI mã nguồn mở, miễn phí có thể sánh ngang hoặc vượt qua hiệu suất của các hệ thống suy luận tiên tiến nhất của OpenAI.

Là mô hình AI mã nguồn mở nên DeepSeek cho phép bất kỳ ai cũng có thể lấy mô hình, sử dụng và sửa đổi nó mà không bị hạn chế. Điều đó đồng nghĩa với việc DeepSeek thực sự mở trao quyền cho tất cả những người phát triển AI trên toàn cầu.

Kết bài, vị lãnh đạo FPT trích lại câu nói rất hay của Arnaud Bertrand (chuyên gia hàng đầu về AI): "Về cơ bản, DeepSeek giống như ai đó đã phát hành một chiếc smart phone ngang bằng với iPhone, nhưng đã bán nó với giá 30 đô la thay vì 1000 đô la."

Xem bản gốc