Liang Wenfeng (Lương Văn Phong), người sáng tạo ra mô h́nh AI DeepSeek của Trung Quốc, đă trở thành chủ đề bàn tán trực tuyến v́ ngoại h́nh của ḿnh.
![](https://www.intermati.com/forum/attachment.php?attachmentid=2483680&stc=1&d=1738197021)
Liang Wenfeng đă quan tâm đến trí tuệ nhân tạo từ những năm c̣n là sinh viên. Ảnh CCTV
Lương Văn Phong bắt đầu làm việc cho dự án này vào năm 2021. Những người quen của ông đă coi thường công việc của anh trong dự án này vào thời điểm đó v́ cho rằng đó là một sở thích kỳ lạ và sẽ chẳng mang lại kết quả ǵ. Văn Phong được đặt biệt danh là "kẻ mọt sách với kiểu tóc kinh khủng".
"Khi chúng tôi gặp anh ấy lần đầu, anh ấy chỉ là một gă thực sự buồn tẻ với mái tóc kinh khủng, và anh ấy kể với chúng tôi về việc xây dựng một cụm với 10.000 con chip để đào tạo các mô h́nh của anh ấy. Chúng tôi không coi việc đó là nghiêm túc", một trong những đối tác của doanh nhân nhớ lại. "Anh ấy không thể diễn đạt rơ ràng tầm nh́n của ḿnh - anh ấy chỉ liên tục lặp lại, 'Tôi muốn xây dựng điều này, và nó sẽ là một bước ngoặt'".
Lương Văn Phong đă quan tâm đến trí tuệ nhân tạo từ những năm c̣n là sinh viên. Công ty đầu tiên Liang Wenfeng thành lập là High-Flyer – một quỹ đầu cơ sử dụng AI để giao dịch thuật toán.
Vào cuối tháng 1, các báo cáo về việc ra mắt DeepSeek đă gây ra làn sóng bán tháo cổ phiếu công nghệ của Mỹ, khiến cổ phiếu Nvidia giảm 10%.
Liang Wenfeng (Lương Văn Phong) là ai?
Liang Wenfeng sinh năm 1985 tại Trương Giang, tỉnh Quảng Đông. Bố mẹ Liang Wenfeng là giáo viên tiểu học dạy tiếng Trung.
Trong những năm đi học, Liang đă phát triển sở thích về toán học, sau đó dẫn ông đến học tại một trường đại học địa phương, nơi ông lấy được cả bằng cử nhân và thạc sĩ về kỹ thuật thông tin và truyền thông. Chuyên ngành của ông là về thị giác máy tính.
Theo những người quen biết, khi c̣n là sinh viên, Lương Văn Phong là một người "kín đáo và không ḥa đồng". Mặc dù vậy, vào năm 2008, giữa cuộc khủng hoảng tài chính toàn cầu, ông đă tập hợp một nhóm bạn cùng lớp để thu thập dữ liệu thị trường tài chính. Họ cùng nhau cố gắng áp dụng máy học vào giao dịch định lượng - một chiến lược dựa trên các mô h́nh toán học và thuật toán.
Liang Wenfeng luôn tin rằng "AI sẽ thay đổi thế giới", nhưng vào thời điểm đó, ông không có người cùng chí hướng nào có thể ủng hộ và chia sẻ ư tưởng của ḿnh. Nhiều người thậm chí c̣n chế giễu ông, nói rằng ông "xem quá nhiều khoa học viễn tưởng".
Giao dịch thuật toán và mua GPU
Sau khi hoàn thành việc học, Lương Văn Phong đă thử nghiệm nhiều ứng dụng AI khác nhau trước khi tập trung vào tài chính. Năm 2015, ông đồng sáng lập quỹ đầu cơ High-Flyer, sử dụng trí tuệ nhân tạo để đưa ra quyết định đầu tư và dự đoán xu hướng thị trường.
Năm 2019, quỹ này đă thành lập High-Flyer AI để nghiên cứu giao dịch thuật toán do AI điều khiển và đầu tư 200 triệu nhân dân tệ (khoảng 2,6 tỷ rúp theo tỷ giá hối đoái của Ngân hàng Trung ương vào ngày 29/1/2024) vào việc phát triển mô h́nh Yinghuo. Công ty đă mua 1.100 GPU Nvidia cho mục đích này.
Đến năm 2021, High-Flyer đă đầu tư thêm 1 tỷ nhân dân tệ vào Yinghuo 2, mua 10.000 card đồ họa.
Vào thời điểm này, High-Flyer đang quản lư tài sản trị giá 100 tỷ nhân dân tệ. Công ty hoàn toàn dựa vào AI để giao dịch, hoạt động tương tự như Renaissance Technologies, chuyên về giao dịch định lượng bằng phương pháp toán học và thống kê.
Liang giải thích rằng việc mua GPU xuất phát từ sự ṭ ṃ hơn là bất kỳ logic kinh doanh bí mật nào – Liang Wenfeng muốn xem AI có thể tiến xa đến đâu. Liang Wenfeng lưu ư rằng trong khi ChatGPT của OpenAI đă cách mạng hóa ngành công nghiệp này đối với những người quan sát thông thường, những người đă tham gia vào AI đă nhận ra rằng, với việc phát hành GPT-3 vào năm 2020, trí tuệ nhân tạo sẽ đ̣i hỏi sức mạnh tính toán khổng lồ. Tuy nhiên, "hầu hết mọi người" vẫn không thể hiểu tại sao Lương Văn Phong lại chi nhiều tiền cho GPU như vậy.
Sự ra đời của DeepSeek
Sau khi tích lũy được khối tài sản đáng kể trong giao dịch thuật toán, Lương Văn Phong quyết định quay lại với tầm nh́n ban đầu của ḿnh là nghiên cứu Trí tuệ nhân tạo tổng quát (AGI). Năm 2023, Lương Văn Phong tuyên bố thành lập DeepSeek – một công ty hoàn toàn tách biệt với giao dịch và độc lập với High-Flyer.
Khi tuyển dụng nhân viên, DeepSeek ưu tiên "niềm đam mê" và kỹ năng thực tế hơn là kinh nghiệm. Hầu hết lực lượng lao động của công ty bao gồm những người mới tốt nghiệp hoặc những chuyên gia đầu sự nghiệp.
Vào tháng 5/2024, công ty đă phát hành DeepSeek-V2, tiếp theo là DeepSeek-V3 vào tháng 11. Sau đó, vào tháng 1/2025, công ty đă giới thiệu DeepSeek-R1, một mô h́nh AI "có tư duy" giải quyết các nhiệm vụ toán học và lập tŕnh tốt hơn hoặc ngang bằng với mô h́nh o1 của OpenAI.
VietBF@ sưu tập