DeepSeek - một công ty trí tuệ nhân tạo (AI) non trẻ của Trung Quốc, đã nhanh chóng trở thành tâm điểm toàn cầu khi chỉ trong một thời gian ngắn, ứng dụng của họ vươn lên dẫn đầu các bảng xếp hạng, vượt qua cả OpenAI và Anthropic.
Thành công này không chỉ giúp công ty đạt mức định giá ít nhất 1 tỷ USD mà còn đưa nhà sáng lập Liang Wenfeng vào hàng ngũ những doanh nhân giàu có nhất thế giới.
Ai đứng sau DeepSeek?
Liang Wenfeng sinh năm 1985 tại thành phố cảng Zhanjiang, Trung Quốc. Xuất thân từ một gia đình có mẹ là giáo viên tiểu học, Liang theo học ngành trí tuệ nhân tạo tại Đại học Chiết Giang và tốt nghiệp thạc sĩ vào năm 2010. Khi còn là sinh viên, ông đã quan tâm đến việc tự động hóa giao dịch chứng khoán bằng AI.
Năm 2013, Liang đồng sáng lập công ty đầu tư Hangzhou Jacobi cùng một người bạn đại học. Hai năm sau, ông tiếp tục thành lập quỹ đầu tư định lượng High-Flyer Capital Management, nơi sử dụng AI để phân tích và dự đoán thị trường chứng khoán. Dưới sự lãnh đạo của Liang, High-Flyer nhanh chóng trở thành một trong những quỹ giao dịch định lượng lớn nhất Trung Quốc, thu hút hàng tỷ USD tài sản quản lý.
Tuy nhiên, đến năm 2021, High-Flyer gặp khó khăn khi các thuật toán AI dự đoán sai thời điểm giao dịch, khiến hiệu suất quỹ suy giảm. Liang buộc phải điều chỉnh chiến lược và đến năm 2022, công ty đã phục hồi với lợi nhuận cao hơn thị trường chung. Nhưng thay vì tiếp tục phát triển High-Flyer, Liang quyết định rẽ hướng sang AI với DeepSeek.
Sự khác biệt của DeepSeek với OpenAI và các đối thủ
DeepSeek chính thức ra mắt vào tháng 4/2023 với sứ mệnh xây dựng trí tuệ nhân tạo tổng quát (AGI). Không giống như OpenAI hay Anthropic, DeepSeek không phụ thuộc vào nguồn vốn từ các nhà đầu tư bên ngoài mà chủ yếu do Liang tự tài trợ, một phần từ lợi nhuận của High-Flyer. Điều này giúp công ty có thể tập trung vào nghiên cứu thay vì chịu áp lực thương mại hóa sớm.
Một trong những yếu tố khiến DeepSeek trở nên nổi bật là khả năng đào tạo mô hình AI với chi phí thấp hơn nhiều so với các đối thủ phương Tây. Mô hình V3 của DeepSeek, ra mắt vào tháng 12/2023, chỉ tiêu tốn 6 triệu USD để huấn luyện, so với 100 triệu USD của GPT-4. Điều này có được nhờ cách tiếp cận tinh gọn, như sử dụng số lượng chữ số thập phân ít hơn khi tính toán hay chia kiến thức thành các nhóm chuyên gia, giúp tiết kiệm tài nguyên mà vẫn duy trì độ chính xác cao.
Hơn nữa, DeepSeek đi theo hướng mã nguồn mở, cho phép bất kỳ ai cũng có thể truy cập vào mô hình của họ miễn phí. Trong khi đó, OpenAI kiểm soát chặt chẽ quyền truy cập vào công nghệ của mình. Chính sách này giúp DeepSeek thu hút đông đảo người dùng, đặc biệt là trong giới lập trình và nghiên cứu AI.