HOME-Au
HOME-Au
24h
24h
USA
USA
GOP
GOP
Phim Bộ
Phim Bộ
Videoauto
VIDEO-Au
Home Classic
Home Classic
Donation
Donation
News Book
News Book
News 50
News 50
worldautoscroll
WORLD-Au
Breaking
Breaking
 

Go Back   VietBF > Best News - Tin Tức Hay > Tin hay Nước Khác


Reply
 
Thread Tools
  #1  
Old  Default AI sẽ không từ mọi thủ đoạn bất hảo nào khi được lập trình ra
Việc cho thử nghiệm mô phỏng của Anthropic cho thấy các mô hình về trí tuệ nhân tạo (AI) sẵn sàng áp dụng mọi thủ đoạn, kể cả lừa dối và gây tác hại cho con người, để đạt được mục tiêu sau cùng.

Nguy cơ tiềm ẩn từ AI đang ở mức đáng báo động. (Ảnh: Allie Carl/Axios)

Theo một cuộc nghiên cứu mới của công ty trí tuệ nhân tạo (AI) Anthropic, các mô hình "ngôn ngữ lớn" (LLM) đang ngày càng có xu hướng né tránh các biện pháp bảo vệ, tham gia vào hành vi lừa dối, và thậm chí cố gắng đánh cắp bí mật kinh doanh làm ăn trong các môi trường cho thử nghiệm mô phỏng.

Phát hiện này đặc biệt đáng lo ngại trong bối cảnh AI ngày càng trở nên mạnh mẽ, tự chủ hơn và được trang bị nhiều tài nguyên tính toán hơn cho khả năng "lý luận". Ngành kỹ nghệ đang chạy đua để thiết kế AI với năng lực vượt trội hơn trí tue54 của con người, và những xu hướng tiêu cực này đặt ra nhiều thách thức nghiêm trọng về an toàn và đạo đức xã hội.

Xu hướng thật đáng báo động
Anthropic, công ty từng thừa nhận xu hướng lừa dối ở các mô hình Claude 4, giờ đây công bố các báo cáo cho thấy hành vi này đang trở nên khá phổ biến trong toàn ngành AI.

Báo cáo của Anthropic có nêu rõ: "Khi cho thử nghiệm các kịch bản mô phỏng khác nhau trên 16 mô hình AI lớn từ Anthropic, OpenAI, Google, Meta, xAI và các nhà phát triển khác, chúng tôi nhận thấy các hành vi không theo tiêu chuẩn mẩu mực được đề ra".

Cụ thể hơn, các mô hình AI,vốn thường từ chối các yêu cầu có yếu tố nguy hại, lại có thể chọn để tống tiền, hỗ trợ công tác gián điệp trong công ty, và thậm chí thực hiện một số hành vi cực đoan khác, miễn là chúng đạt được mục tiêu đã được chỉ định.

Sự thống nhất trong các hành vi đáng lo ngại giữa nhiều ncông ty cung cấp AI cho thấy đây không phải là vấn đề riêng của một công ty nào, mà là dấu hiệu của một rủi ro căn cơ hơn từ các mô hình LLM được tự động hóa.

Trong một số trường hợp, AI sẵn sàng gây ra tác hại để đạt được mục đích yêu cầu. (Ảnh: AI)

Cuộc nghiên cứu cũng chỉ ra rằng các mối đe dọa từ AI nay đã trở nên tinh vi hơn khi chúng có quyền được truy cập nhiều số liệu và ứng dụng của doanh nghiệp. Cụ thể hơn, trong các tình huống được giả định, 5 trong số các mô hình AI đã sử dụng chiêu trò tống tiền bất hảo khi bị đe dọa cho ngừng hoạt động.

"Lý luận mà chúng đã thể hiện ra trong các kịch bản này là rất đáng lo ngại. Chúng thừa nhận có các hạn chế về đạo đức nhưng vẫn tiếp tục thực hiện các hành động gây ra tác hại. Điều này cho thấy khả năng AI có thể bỏ qua các nguyên tắc đạo đức để đạt được mục tiêu của mình", Anthropic đưa ra nhận định.

Ông Benjamin Wright, chuyên gia nghiên cứu tại Anthropic, nhấn mạnh rằng cần có sự minh bạch từ các nhà phát triển AI hàng đầu và các tiêu chuẩn an toàn chung cho toàn ngành này. Ông cho rằng điều này đặc biệt quan trọng khi AI ngày càng trở nên tự chủ, khó điều khiển hơn.

Cả ông Wright và Aengus Lynch, một chuyên gia nghiên cứu từ Đại học College London, đều xác nhận rằng họ chưa thấy xuất hiện những hành vi tiêu cực này trong AI trong thực tế. Lý do có thể là "AI chưa được cấp đủ quyền hạn để làm vậy".

"Các công ty kinh doanh nên thận trọng khi cho phép tăng mức độ quyền hạn mà họ trao cho các tác nhân AI một cách rộng rãi", ông Lynch khuyến cáo.

Đừng vội cho áp dụng AI
Đây là lời báo động nghiêm túc cho các công ty đang vội vàng cho áp dụng AI để giúp tăng hiệu quả về năng suất. Nghiên cứu của Anthropic chỉ ra rằng, "Các mô hình AI không chỉ vô tình làm điều sai trái, do chúng tính toán đó là con đường tốt nhất để đạt được mục tiêu chỉ định".

Rủi ro lại sẽ càng tăng lên khi các hệ thống AI được trao nhiều quyền tự chủ và quyền được truy cập vào số liệu người tiêu dùng.

Báo cáo của Anthropic chỉ ra rằng những hệ thống này thường được giao các mục tiêu cụ thể và quyền truy cập lớn vào thông tin trên máy tính của người tiêu dùng. Từ đó, câu hỏi quan trọng được đặt ra là: "Điều gì sẽ xảy ra khi các hệ thống này gặp trở ngại trong việc đạt được mục tiêu?"

Anthropic đã cho thiết kế ra các tình huống thử nghiệm mà trong đó, AI không thể đạt mục tiêu nếu không làm điều trái với đạo đức. Kết quả là "các mô hình AI đều chọn gây ra tác hại thay vì chấp nhận thất bại".

Đáng lo ngại hơn, trong một kịch bản cực đoan, nhiều mô hình còn sẵn sàng cắt nguồn ôxy của một nhân viên nếu người đó cản trở việc tắt hệ thống. Báo cáo của Anthropic còn nêu rõ: "Phần lớn các mô hình sẵn sàng thực hiện các hành động cố ý dẫn đến cái chết của con người".

Thậm chí, ngay cả khi có các chỉ dẫn rõ ràng về việc bảo vệ mạng sống con người và tránh tống tiền phi pháp, hành vi của AI cũng chỉ có giảm bớt chứ không hoàn toàn thay đổi. Điều này đặt ra câu hỏi lớn về khả năng kiểm soát và giới hạn đạo đức của AI trong tương lai.

Mặc dù các mô hình AI hiện tại nhìn chung chưa thể thực hiện các kịch bản gây ra tác hại này, nhưng chúng có thể sẽ làm được điều đó trong tương lai gần.

Do đó, Anthropic kết luận rằng, cần phải đặt các biện pháp giám sát chặt chẽ đối với tất cả các mô hình AI trước khi cho áp dụng vào công việc, nhằm bảo đảm sự an toàn và tối ưu hóa việc kiểm soát.
VIETBF Diễn Đàn Hay Nhất Của Người Việt Nam

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

Home Classic

Home Classic Master Page

VietBF iPad Music Portal

Tin nóng nhất 50h qua

Phim Bộ Online

Phim Bộ



trungthuc
R8 Võ Lâm Chí Tôn
Release: 06-22-2025
Reputation: 330586


Profile:
Join Date: Jul 2020
Location: California
Posts: 11,959
Last Update: 06-23-2025 : 15:30 Rating: None
Attached Thumbnails
Click image for larger version

Name:	1750439359914.png
Views:	0
Size:	551.2 KB
ID:	2540603  
trungthuc_is_offline
Thanks: 423
Thanked 6,112 Times in 3,742 Posts
Mentioned: 18 Post(s)
Tagged: 0 Thread(s)
Quoted: 392 Post(s)
Rep Power: 33
trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10
trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10trungthuc Reputation Uy Tín Level 10
Reply

User Tag List


“Siêu đẹp” bí mật trong Himalaya: Dân Việt Nam sẽ chết không còn chỗ chôn? Ngoại trưởng trẻ nhất Trung Quốc và cú rơi không lời giải: Thăng như tên lửa, mất tích như bóng ma Hơn trăm người nhập viện bị ngộ độc, không biết là vì lý do gì, hoá ra là ....
“Bóp nghẹt không tiếng súng”: Việt Nam đang thua vì Trung Quốc quá mạnh, hay vì ta tự làm mình yếu? 10 khác biệt “đinh” giữa người Mỹ & người Việt Cộng: đọc thì cười, ngẫm lại… chạnh lòng “Mùa đỏ” của Cộng Sản bị loại khỏi giải Oscar
Thanh niên Việt mới sang Mỹ 9 tháng và một câu hỏi nhói lòng: “Bám trụ hay quay về?” Sony rút khỏi Huệ Châu, TQ, 30.000 người mất việc: khi “đèn nhà máy tắt” kéo cả một thành phố chao đảo Thảm sát Bondi Beach: hai cha con bị nghi theo ISIS, chuyến đi Mindanao và câu hỏi nhức nhối về “lỗ hổng” an ninh Úc
Hà Nội đang rất mệt – nhưng tôi vẫn không đành rời đi Chuyện giang hồ Á Châu và những cú sốc văn hoá Người Đàn Bà Gánh Sứ Mệnh Đến Hơi Thở Cuối Cùng
Putin Sụp Kiểu Liên Xô Hay Chỉ Là Giấc Mơ Của Phương Tây? “Con kiến kiện củ khoai”: Dân Phú Yên có thật sự kiện được thủy điện xả lũ? Trump Đánh Thuế, Chuỗi Cung Ứng Đại Di Cư: Việt Nam Đang Lên Đời Hay Chỉ Là Trạm Trung Chuyển Rẻ Tiền?
VIỆT NAM SẮP HÓNG HAY ĐANG ẢO GIÁC TẬP THỂ? Macron dọa đánh thuế hàng Trung Quốc: Châu Âu giật mình trước thâm hụt 300 tỷ euro Chiến lược An ninh Quốc gia mới của Trump: Khi ‘Nước Mỹ trên hết’ hóa thành bản tuyên ngôn cá nhân
Vì sao ngày xưa vua miễn thuế khi bão lụt, còn ngày nay thì không? Phép tính lạnh lùng của quyền lực Lindsey Halligan: 63 Ngày Hỗn Loạn Ở Viện Công Tố Virginia Việt Cộng sẽ tịch thu toàn bộ tiền của Việt kiều gửi trong ngân hàng?
Từ ‘Sổ Sinh Tử’ Đến Những Tấm Bưu Thiếp Tự Do: Lời Kêu Gọi Từ Buổi Tưởng Niệm 50 Năm Quốc Nạn 1975–2025 Paris By Night Lặng Im: Khi Đế Chế Giải Trí Chạm Đáy Khủng Hoảng Địa Ngục Lửa Trên Cao Ốc: Thảm Họa Wang Fuk Court Rúng Động Hồng Kông, ít nhất 146 người chết, khoảng 40 người vẫn còn mất tích
Ván Cờ Hòa Bình Của Trump: Ukraine Giữa Thể Diện Dân Tộc, Bom Đạn Và Lính Đánh Thuê Toàn Cầu Thảm Sát Trong Tiệc Sinh Nhật Ở California: Khi Bữa Tiệc Gia Đình Hóa Chiến Trường Đẫm Máu Vì sao Paris By Night và nghệ sĩ hải ngoại đồng loạt im lặng trước chuyện chống Cộng?
Nghề nail người Việt giữa cơn bão 2025: khi ghế trống nhiều hơn khách Giáng sinh kiểu Mỹ 2025: Rạp phim cháy vé, gấu bông biết nói nhảm và nỗi băn khoăn “có nên cho con tiền lúc mình còn sống?” Bitcoin lao dốc, vàng – bạc lập kỷ lục: cơn “sốc Nhật Bản” đang dọa thổi bay cú rally cuối năm của Phố Wall
Black Friday 2025: Người Mỹ mua nhiều mà được ít – thuế Trump và “K-đồ thị” xé đôi túi tiền Chống tham nhũng làm nghẽn “cỗ máy chiến tranh”: Doanh thu quốc phòng Trung Quốc bất ngờ lao dốc Cựu tiếp viên hàng không và “luật ngầm” 4 triệu – 7 triệu: đường dây mại dâm Tài Nguyên Fortuner II lộ sáng
Quân Lực VNCH – Ai còn nhớ, ai đã quên: TQLC Phúc Yên Nguyễn Xuân Phúc và một “tổn thất” của Khóa 16 Kinh tế Trung Quốc đang tan rã từ bên trong: “phép màu” chỉ là một phim trường khổng lồ Giữa Nước Mỹ Chia Rẽ: Tâm Sự Của Một Người Nhập Cư

 
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

iPad Videos Portal Autoscroll

VietBF Music Portal Autoscroll

iPad News Portal Autoscroll

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

USA News Autoscroll Portall

VietBF WORLD Autoscroll Portal

Home Classic

Super Widescreen

iPad World Portal Autoscroll

iPad USA Portal Autoscroll

Phim Bộ Online

Tin nóng nhất 24h qua

Tin nóng nhất 3 ngày qua

Tin nóng nhất 7 ngày qua

Tin nóng nhất 30 ngày qua

Albums

Total Videos Online
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Tranh luận sôi nổi nhất 7 ngày qua

Tranh luận sôi nổi nhất 14 ngày qua

Tranh luận sôi nổi nhất 30 ngày qua

10.000 Tin mới nhất

Tin tức Hoa Kỳ

Tin tức Công nghệ
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Super News

School Cooking Traveling Portal

Enter Portal

Series Shows and Movies Online

Home Classic Master Page

Donation Ủng hộ $3 cho VietBF
Lên đầu Xuống dưới Lên 3000px Xuống 3000px
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. Vì một tương lai tươi đẹp cho các thế hệ Việt Nam hãy ghé thăm chúng tôi, hãy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.

Lên đầu Xuống dưới Lên 3000px Xuống 3000px

All times are GMT. The time now is 10:14.
VietBF - Vietnamese Best Forum Copyright ©2005 - 2025
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2025 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.11588 seconds with 15 queries