HOME-Au
HOME-Au
24h
24h
USA
USA
GOP
GOP
Phim Bộ
Phim Bộ
Videoauto
VIDEO-Au
Home Classic
Home Classic
Donation
Donation
News Book
News Book
News 50
News 50
worldautoscroll
WORLD-Au
Breaking
Breaking
 

Go Back   VietBF > Best News - Tin Tức Hay > Tin hay Nước Khác


Reply
 
Thread Tools
  #1  
Old  Default Kỹ thuật "chưng cất" (distillation) AI đang đặt ra câu hỏi lớn
Sự thành công của DeepSeek đến từ TQ nhờ học hỏi trực tiếp từ các mô hình AI lớn hơn đặt ra dấu hỏi về sự hiệu quả của hàng tỷ USD đang được đổ vào những kỹ thuật tiên tiến nhất.

Nhiều tập đoàn kỹ nghệ lớn đã chi ra hàng tỷ USD với niềm tin rằng "càng nhiều càng tốt" trong trí tuệ nhân tạo (AI).

Tuy nhiên, bước đột phá của DeepSeek cho thấy những mô hình nhỏ hơn cũng có thể đạt được mức hiệu quả tương đương chỉ với chi phí thấp hơn nhiều.

Vào cuối tháng 1/2025, DeepSeek tuyên bố chi phí để huấn luyện cuối cùng của mô hình R1 chỉ là 5,6 triệu USD(?). Con số ("dỡm") này chỉ bằng một phần nhỏ so với chi phí của các công ty Mỹ bỏ ra.

"Tên Cướp biển Kỹ Nghệ"
Bước nhảy vọt của DeepSeek đã đưa công ty khởi nghiệp này vào hàng ngũ các công ty sản xuất AI hàng đầu. Tuy nhiên, ở một phương diện khác, startup đến từ Hàng Châu cũng làm dấy lên những cuộc thảo luận sôi nổi tại Thung lũng Silicon về một quy trình gọi là "distillation" (chưng cất).

Đây là một kỹ thuật ám chỉ hệ thống mới học từ hệ thống hiện có bằng cách đặt ra hàng trăm ngàn câu hỏi và phân tích cặn kẽ các câu trả lời.

Thông qua quy trình "chưng cất", các công ty sẽ lấy một "mô hình ngôn ngữ lớn" (LLM) được gọi là "mô hình giáo viên", có khả năng dự đoán chữ tiếp theo có nhiều khả năng xuất hiện nhất trong một câu nói.

Mô hình giáo viên tạo ra dữ kiện, sau đó dữ kiện này được sử dụng để huấn luyện một "mô hình học sinh" nhỏ hơn. Quá trình này giúp chuyển giao nhanh chóng kiến thức và khả năng dự đoán từ mô hình lớn sang mô hình nhỏ.


Thay vì phải bỏ ra hàng tỷ USD để đào tạo mô hình, kỹ thuật "chưng cất" giúp cho DeepSeek có thể đạt thành tựu tương tự chỉ bằng việc học hỏi từ mô hình lớn có sẵn. (Ảnh: Mint).

Mặc dù kỹ thuật chưng cất đã được cho sử dụng rộng rãi trong nhiều năm qua, các tiến bộ khoa học kỹ thuật gần đây khiến cho những chuyên gia trong ngành tin rằng, điều đó sẽ ngày càng trở thành lợi thế lớn cho các startup như DeepSeek.

Khác so với những ông lớn trong ngành như OpenAI, những công ty này luôn tìm kiếm các giải pháp tiết kiệm chi phí để phát minh ra ứng dụng dựa trên kỹ thuật AI.

"Chưng cất khá kỳ diệu. Đó là quá trình lấy một mô hình biên lớn và thông minh, rồi sử dụng mô hình đó để dạy cho một mô hình nhỏ hơn. Nó rất hiệu quả trong các nhiệm vụ cụ thể, siêu rẻ và siêu nhanh để thực thi", Olivier Godement trưởng bộ phận sản phẩm của OpenAI cho biết.

Dấu hỏi về mức hiệu quả của hàng tỷ USD vốn đầu tư
Các LLM như GPT-4 của OpenAI, Gemini (Google) hay Llama (Meta) khá nổi tiếng với việc đòi hỏi số lượng dữ kiện khổng lồ và sức mạnh tính toán to lớn để vận hành và duy trì.

Dù cho các công ty không công bố ra chi phí chính xác, ước tính việc huấn luyện các mô hình này có thể tiêu tốn hàng trăm triệu USD.

Trong số này, có thể dễ dàng kể đến các tên như Google, OpenAI, AnthropicxAI của Elon Musk. Sau khi ông Trump nhậm chức, OpenAI đã công bố hợp tác với SoftBank và các đối tác khác để đầu tư 500 tỷ USD vào hạ tầng AI trong vòng 5 năm sắp tới.

Tuy nhiên, nhờ kỹ thuật chưng cất, các chuyên gia và doanh nghiệp có thể tiếp cận những khả năng mạnh mẽ của các mô hình lớn với một phần nhỏ chi phí cần bỏ ra. Điều này cho phép các ứng dụng AI chạy nhanh chóng trên các thiết bị như laptop hay smartphone.

Mô hình về kỹ thuật "chưng cất" trong huấn luyện mô hình AI. (Ảnh: arXiv).

Thậm chí, WSJ còn cho rằng, sau sự thành công của DeepSeek, các giám đốc điều hành và giới đầu tư tại Thung lũng Silicon đang xem xét lại mô hình kinh doanh của họ và đặt câu hỏi, liệu việc dẫn đầu ngành có còn xứng đáng nữa hay không.

"Liệu có xứng đáng về mặt kinh tế để đi đầu nếu chi phí lại tốn kém gấp 8 lần so với người đi theo sau?", Mike Volpi, một giám đốc điều hành kỹ nghệ kỳ cựu và người đầu tư mạo hiểm tại Hanabi Capital đặt câu hỏi.

Các giám đốc kỹ nghệ kỳ vọng sẽ trông thấy nhiều ứng dụng AI với chất lượng cao được tạo ra bằng kỹ thuật "chưng cất" trong thời gian sắp tới.

Cụ thể, các chuyên gia nghiên cứu tại công ty AI Hugging Face đã bắt đầu cố gắng xây dựng một mô hình tương tự như của DeepSeek. "Điều dễ cho sao chép nhất là quy trình chưng cất", chuyên gia nghiên cứu Lewis Tunstall cho biết.

Các mô hình AI từ OpenAI và Google vẫn dẫn đầu trên các bảng xếp hạng được sử dụng rộng rãi ở Thung lũng Silicon.

Các tập đoàn kỹ nghệ lớn có khả năng duy trì lợi thế trong các hệ thống tiên tiến nhất nhờ vào việc thực hiện việc nghiên cứu gốc nhiều nhất. Tuy nhiên, nhiều người tiêu dùng và doanh nghiệp sẵn sàng sử dụng kỹ thuật kém hơn một chút nhưng lại có mức giá rẻ hơn rất nhiều.

Dù kỹ thuật chưng cất có thể tạo ra các mô hình hoạt động tốt, nhưng có nhiều chuyên gia cũng cảnh cáo rằng, chúng vẫn có hạn chế nhất định.

"Chưng cất mang lại một sự đánh đổi thú vị. Khi bạn làm cho mô hình nhỏ hơn, không thể tránh khỏi việc giảm bớt khả năng của nó", Ahmed Awadallah từ Microsoft Research có giải thích.

Theo Awadallah, một mô hình chưng cất có thể rất giỏi trong việc tóm tắt email, nhưng đồng thời cũng thực sự không tốt cho bất cứ thao tác có ích nào khác.

Trong khi đó, David Cox, phó chủ tịch phụ trách mô hình AI tại IBM Research đưa ra nhận định, hầu hết doanh nghiệp không cần mô hình khổng lồ để cho vận hành sản phẩm.
Các mô hình chưng cất hiện đã đủ sức mạnh để phục vụ các mục đích như chatbot cho dịch vụ khách hàng hoặc hoạt động trên các thiết bị nhỏ như điện thoại.

"Bất cứ khi nào có thể giảm được chi phí mà vẫn đạt được hiệu suất mong muốn, chẳng có lý do gì để không làm ra điều đó", Cox nói thêm.
VIETBF Diễn Đàn Hay Nhất Của Người Việt Nam

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

Home Classic

Home Classic Master Page

VietBF iPad Music Portal

Tin nóng nhất 50h qua

Phim Bộ Online

Phim Bộ



trungthuc
R8 Võ Lâm Chí Tôn
Release: 03-16-2025
Reputation: 330592


Profile:
Join Date: Jul 2020
Location: California
Posts: 11,976
Last Update: None Rating: None
Attached Thumbnails
Click image for larger version

Name:	tai_xuong_13_.jpg
Views:	0
Size:	219.1 KB
ID:	2502353  
trungthuc_is_offline
Thanks: 424
Thanked 6,115 Times in 3,744 Posts
Mentioned: 18 Post(s)
Tagged: 0 Thread(s)
Quoted: 392 Post(s)
Rep Power: 33
trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10
trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10
Reply

User Tag List

Thread Tools

“Siêu đẹp” bí mật trong Himalaya: Dân Việt Nam sẽ chết không còn chỗ chôn? Ngoại trưởng trẻ nhất Trung Quốc và cú rơi không lời giải: Thăng như tên lửa, mất tích như bóng ma Hơn trăm người nhập viện bị ngộ độc, không biết là vì lý do gì, hoá ra là ....
“Bóp nghẹt không tiếng súng”: Việt Nam đang thua vì Trung Quốc quá mạnh, hay vì ta tự làm mình yếu? 10 khác biệt “đinh” giữa người Mỹ & người Việt Cộng: đọc thì cười, ngẫm lại… chạnh lòng “Mùa đỏ” của Cộng Sản bị loại khỏi giải Oscar
Thanh niên Việt mới sang Mỹ 9 tháng và một câu hỏi nhói lòng: “Bám trụ hay quay về?” Sony rút khỏi Huệ Châu, TQ, 30.000 người mất việc: khi “đèn nhà máy tắt” kéo cả một thành phố chao đảo Thảm sát Bondi Beach: hai cha con bị nghi theo ISIS, chuyến đi Mindanao và câu hỏi nhức nhối về “lỗ hổng” an ninh Úc
Hà Nội đang rất mệt – nhưng tôi vẫn không đành rời đi Chuyện giang hồ Á Châu và những cú sốc văn hoá Người Đàn Bà Gánh Sứ Mệnh Đến Hơi Thở Cuối Cùng
Putin Sụp Kiểu Liên Xô Hay Chỉ Là Giấc Mơ Của Phương Tây? “Con kiến kiện củ khoai”: Dân Phú Yên có thật sự kiện được thủy điện xả lũ? Trump Đánh Thuế, Chuỗi Cung Ứng Đại Di Cư: Việt Nam Đang Lên Đời Hay Chỉ Là Trạm Trung Chuyển Rẻ Tiền?
VIỆT NAM SẮP HÓNG HAY ĐANG ẢO GIÁC TẬP THỂ? Macron dọa đánh thuế hàng Trung Quốc: Châu Âu giật mình trước thâm hụt 300 tỷ euro Chiến lược An ninh Quốc gia mới của Trump: Khi ‘Nước Mỹ trên hết’ hóa thành bản tuyên ngôn cá nhân
Vì sao ngày xưa vua miễn thuế khi bão lụt, còn ngày nay thì không? Phép tính lạnh lùng của quyền lực Lindsey Halligan: 63 Ngày Hỗn Loạn Ở Viện Công Tố Virginia Việt Cộng sẽ tịch thu toàn bộ tiền của Việt kiều gửi trong ngân hàng?
Từ ‘Sổ Sinh Tử’ Đến Những Tấm Bưu Thiếp Tự Do: Lời Kêu Gọi Từ Buổi Tưởng Niệm 50 Năm Quốc Nạn 1975–2025 Paris By Night Lặng Im: Khi Đế Chế Giải Trí Chạm Đáy Khủng Hoảng Địa Ngục Lửa Trên Cao Ốc: Thảm Họa Wang Fuk Court Rúng Động Hồng Kông, ít nhất 146 người chết, khoảng 40 người vẫn còn mất tích
Ván Cờ Hòa Bình Của Trump: Ukraine Giữa Thể Diện Dân Tộc, Bom Đạn Và Lính Đánh Thuê Toàn Cầu Thảm Sát Trong Tiệc Sinh Nhật Ở California: Khi Bữa Tiệc Gia Đình Hóa Chiến Trường Đẫm Máu Vì sao Paris By Night và nghệ sĩ hải ngoại đồng loạt im lặng trước chuyện chống Cộng?
Nghề nail người Việt giữa cơn bão 2025: khi ghế trống nhiều hơn khách Giáng sinh kiểu Mỹ 2025: Rạp phim cháy vé, gấu bông biết nói nhảm và nỗi băn khoăn “có nên cho con tiền lúc mình còn sống?” Bitcoin lao dốc, vàng – bạc lập kỷ lục: cơn “sốc Nhật Bản” đang dọa thổi bay cú rally cuối năm của Phố Wall
Black Friday 2025: Người Mỹ mua nhiều mà được ít – thuế Trump và “K-đồ thị” xé đôi túi tiền Chống tham nhũng làm nghẽn “cỗ máy chiến tranh”: Doanh thu quốc phòng Trung Quốc bất ngờ lao dốc Cựu tiếp viên hàng không và “luật ngầm” 4 triệu – 7 triệu: đường dây mại dâm Tài Nguyên Fortuner II lộ sáng
Quân Lực VNCH – Ai còn nhớ, ai đã quên: TQLC Phúc Yên Nguyễn Xuân Phúc và một “tổn thất” của Khóa 16 Kinh tế Trung Quốc đang tan rã từ bên trong: “phép màu” chỉ là một phim trường khổng lồ Giữa Nước Mỹ Chia Rẽ: Tâm Sự Của Một Người Nhập Cư

 
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

iPad Videos Portal Autoscroll

VietBF Music Portal Autoscroll

iPad News Portal Autoscroll

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

USA News Autoscroll Portall

VietBF WORLD Autoscroll Portal

Home Classic

Super Widescreen

iPad World Portal Autoscroll

iPad USA Portal Autoscroll

Phim Bộ Online

Tin nóng nhất 24h qua

Tin nóng nhất 3 ngày qua

Tin nóng nhất 7 ngày qua

Tin nóng nhất 30 ngày qua

Albums

Total Videos Online
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Tranh luận sôi nổi nhất 7 ngày qua

Tranh luận sôi nổi nhất 14 ngày qua

Tranh luận sôi nổi nhất 30 ngày qua

10.000 Tin mới nhất

Tin tức Hoa Kỳ

Tin tức Công nghệ
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Super News

School Cooking Traveling Portal

Enter Portal

Series Shows and Movies Online

Home Classic Master Page

Donation Ủng hộ $3 cho VietBF
Lên đầu Xuống dưới Lên 3000px Xuống 3000px
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. Vì một tương lai tươi đẹp cho các thế hệ Việt Nam hãy ghé thăm chúng tôi, hãy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.

Lên đầu Xuống dưới Lên 3000px Xuống 3000px

All times are GMT. The time now is 09:34.
VietBF - Vietnamese Best Forum Copyright ©2005 - 2025
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2025 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.11473 seconds with 15 queries