HOME-Au
HOME-Au
24h
24h
USA
USA
GOP
GOP
Phim Bộ
Phim Bộ
Videoauto
VIDEO-Au
Donation
Donation
News Book
News Book
News 50
News 50
worldautoscroll
WORLD-Au
Breaking
Breaking
 

Go Back   VietBF > Best > Tin hay Nước Khác


Reply
Thread Tools
 
 
  #1  
Old  Default AI sẽ không từ mọi thủ đoạn bất hảo nào khi được lập trình ra
Việc cho thử nghiệm mô phỏng của Anthropic cho thấy các mô hình về trí tuệ nhân tạo (AI) sẵn sàng áp dụng mọi thủ đoạn, kể cả lừa dối và gây tác hại cho con người, để đạt được mục tiêu sau cùng.

Nguy cơ tiềm ẩn từ AI đang ở mức đáng báo động. (Ảnh: Allie Carl/Axios)

Theo một cuộc nghiên cứu mới của công ty trí tuệ nhân tạo (AI) Anthropic, các mô hình "ngôn ngữ lớn" (LLM) đang ngày càng có xu hướng né tránh các biện pháp bảo vệ, tham gia vào hành vi lừa dối, và thậm chí cố gắng đánh cắp bí mật kinh doanh làm ăn trong các môi trường cho thử nghiệm mô phỏng.

Phát hiện này đặc biệt đáng lo ngại trong bối cảnh AI ngày càng trở nên mạnh mẽ, tự chủ hơn và được trang bị nhiều tài nguyên tính toán hơn cho khả năng "lý luận". Ngành kỹ nghệ đang chạy đua để thiết kế AI với năng lực vượt trội hơn trí tue54 của con người, và những xu hướng tiêu cực này đặt ra nhiều thách thức nghiêm trọng về an toàn và đạo đức xã hội.

Xu hướng thật đáng báo động
Anthropic, công ty từng thừa nhận xu hướng lừa dối ở các mô hình Claude 4, giờ đây công bố các báo cáo cho thấy hành vi này đang trở nên khá phổ biến trong toàn ngành AI.

Báo cáo của Anthropic có nêu rõ: "Khi cho thử nghiệm các kịch bản mô phỏng khác nhau trên 16 mô hình AI lớn từ Anthropic, OpenAI, Google, Meta, xAI và các nhà phát triển khác, chúng tôi nhận thấy các hành vi không theo tiêu chuẩn mẩu mực được đề ra".

Cụ thể hơn, các mô hình AI,vốn thường từ chối các yêu cầu có yếu tố nguy hại, lại có thể chọn để tống tiền, hỗ trợ công tác gián điệp trong công ty, và thậm chí thực hiện một số hành vi cực đoan khác, miễn là chúng đạt được mục tiêu đã được chỉ định.

Sự thống nhất trong các hành vi đáng lo ngại giữa nhiều ncông ty cung cấp AI cho thấy đây không phải là vấn đề riêng của một công ty nào, mà là dấu hiệu của một rủi ro căn cơ hơn từ các mô hình LLM được tự động hóa.

Trong một số trường hợp, AI sẵn sàng gây ra tác hại để đạt được mục đích yêu cầu. (Ảnh: AI)

Cuộc nghiên cứu cũng chỉ ra rằng các mối đe dọa từ AI nay đã trở nên tinh vi hơn khi chúng có quyền được truy cập nhiều số liệu và ứng dụng của doanh nghiệp. Cụ thể hơn, trong các tình huống được giả định, 5 trong số các mô hình AI đã sử dụng chiêu trò tống tiền bất hảo khi bị đe dọa cho ngừng hoạt động.

"Lý luận mà chúng đã thể hiện ra trong các kịch bản này là rất đáng lo ngại. Chúng thừa nhận có các hạn chế về đạo đức nhưng vẫn tiếp tục thực hiện các hành động gây ra tác hại. Điều này cho thấy khả năng AI có thể bỏ qua các nguyên tắc đạo đức để đạt được mục tiêu của mình", Anthropic đưa ra nhận định.

Ông Benjamin Wright, chuyên gia nghiên cứu tại Anthropic, nhấn mạnh rằng cần có sự minh bạch từ các nhà phát triển AI hàng đầu và các tiêu chuẩn an toàn chung cho toàn ngành này. Ông cho rằng điều này đặc biệt quan trọng khi AI ngày càng trở nên tự chủ, khó điều khiển hơn.

Cả ông Wright và Aengus Lynch, một chuyên gia nghiên cứu từ Đại học College London, đều xác nhận rằng họ chưa thấy xuất hiện những hành vi tiêu cực này trong AI trong thực tế. Lý do có thể là "AI chưa được cấp đủ quyền hạn để làm vậy".

"Các công ty kinh doanh nên thận trọng khi cho phép tăng mức độ quyền hạn mà họ trao cho các tác nhân AI một cách rộng rãi", ông Lynch khuyến cáo.

Đừng vội cho áp dụng AI
Đây là lời báo động nghiêm túc cho các công ty đang vội vàng cho áp dụng AI để giúp tăng hiệu quả về năng suất. Nghiên cứu của Anthropic chỉ ra rằng, "Các mô hình AI không chỉ vô tình làm điều sai trái, do chúng tính toán đó là con đường tốt nhất để đạt được mục tiêu chỉ định".

Rủi ro lại sẽ càng tăng lên khi các hệ thống AI được trao nhiều quyền tự chủ và quyền được truy cập vào số liệu người tiêu dùng.

Báo cáo của Anthropic chỉ ra rằng những hệ thống này thường được giao các mục tiêu cụ thể và quyền truy cập lớn vào thông tin trên máy tính của người tiêu dùng. Từ đó, câu hỏi quan trọng được đặt ra là: "Điều gì sẽ xảy ra khi các hệ thống này gặp trở ngại trong việc đạt được mục tiêu?"

Anthropic đã cho thiết kế ra các tình huống thử nghiệm mà trong đó, AI không thể đạt mục tiêu nếu không làm điều trái với đạo đức. Kết quả là "các mô hình AI đều chọn gây ra tác hại thay vì chấp nhận thất bại".

Đáng lo ngại hơn, trong một kịch bản cực đoan, nhiều mô hình còn sẵn sàng cắt nguồn ôxy của một nhân viên nếu người đó cản trở việc tắt hệ thống. Báo cáo của Anthropic còn nêu rõ: "Phần lớn các mô hình sẵn sàng thực hiện các hành động cố ý dẫn đến cái chết của con người".

Thậm chí, ngay cả khi có các chỉ dẫn rõ ràng về việc bảo vệ mạng sống con người và tránh tống tiền phi pháp, hành vi của AI cũng chỉ có giảm bớt chứ không hoàn toàn thay đổi. Điều này đặt ra câu hỏi lớn về khả năng kiểm soát và giới hạn đạo đức của AI trong tương lai.

Mặc dù các mô hình AI hiện tại nhìn chung chưa thể thực hiện các kịch bản gây ra tác hại này, nhưng chúng có thể sẽ làm được điều đó trong tương lai gần.

Do đó, Anthropic kết luận rằng, cần phải đặt các biện pháp giám sát chặt chẽ đối với tất cả các mô hình AI trước khi cho áp dụng vào công việc, nhằm bảo đảm sự an toàn và tối ưu hóa việc kiểm soát.
Dịch trang: EnglishEnglish DeutschDeutsch FrançaisFrançais EspañolEspañol ItalianoItaliano PortuguêsPortuguês
NorskNorsk NederlandsNederlands DanskDansk SuomiSuomi PolskiPolski ČeštinaČeština РусскийРусский
日本語日本語 한국어한국어 中文(简体)中文(简体) 中文(繁體)中文(繁體) MagyarMagyar TürkçeTürkçe
العربيةالعربية ไทยไทย LatinaLatina हिन्दीहिन्दी Bahasa IndonesiaBahasa Indonesia Bahasa MelayuBahasa Melayu
VIETBF Hybrid Community Content Hub

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

Video Classic Master

iPad News Portal

VietBF iPad Music Portal

Tin nóng nhất 50h qua

Phim Bộ Online

iMusic Pro Max



trungthuc
R8 Võ Lâm Chí Tôn
Release: 06-22-2025
Reputation: 531040


Profile:
Join Date: Jul 2020
Location: California
Posts: 12,625
Last Update: 06-23-2025 : 15:30 Rating: None
Attached Thumbnails
Click image for larger version

Name:	1750439359914.png
Views:	0
Size:	551.2 KB
ID:	2540603  
trungthuc_is_offline
Thanks: 426
Thanked 6,339 Times in 3,896 Posts
Mentioned: 18 Post(s)
Tagged: 0 Thread(s)
Quoted: 394 Post(s)
Rep Power: 44
trungthuc Reputation Uy Tín Level 11trungthuc Reputation Uy Tín Level 11trungthuc Reputation Uy Tín Level 11trungthuc Reputation Uy Tín Level 11trungthuc Reputation Uy Tín Level 11
trungthuc Reputation Uy Tín Level 11trungthuc Reputation Uy Tín Level 11trungthuc Reputation Uy Tín Level 11trungthuc Reputation Uy Tín Level 11trungthuc Reputation Uy Tín Level 11trungthuc Reputation Uy Tín Level 11trungthuc Reputation Uy Tín Level 11trungthuc Reputation Uy Tín Level 11trungthuc Reputation Uy Tín Level 11trungthuc Reputation Uy Tín Level 11trungthuc Reputation Uy Tín Level 11
Dịch trang: EnglishEnglish DeutschDeutsch FrançaisFrançais EspañolEspañol ItalianoItaliano PortuguêsPortuguês
NorskNorsk NederlandsNederlands DanskDansk SuomiSuomi PolskiPolski ČeštinaČeština РусскийРусский
日本語日本語 한국어한국어 中文(简体)中文(简体) 中文(繁體)中文(繁體) MagyarMagyar TürkçeTürkçe
العربيةالعربية ไทยไทย LatinaLatina हिन्दीहिन्दी Bahasa IndonesiaBahasa Indonesia Bahasa MelayuBahasa Melayu
Reply

User Tag List

Thread Tools

SIÊU NHẠC HỘI BTS TẠI CỐ CUNG: KHI K-POP VƯƠN MÌNH THÀNH ĐẾ CHẾ TOÀN CẦU VÀ CÂU HỎI VỀ BẢN SẮC SÓNG GIÓ HẬU BẦU CỬ: FBI "ĐÁNH NHANH THẮNG NHANH" TẠI GEORGIA VÀ CUỘC CHIẾN PHÁP LÝ NẢY LỬA VOLVO VÀ CUỘC ĐUA "ĐIỆN HÓA" NƯỚC MỸ: CEO HÅKAN SAMUELSSON LIỆU CÓ TẠO NÊN PHÉP MÀU?
ĐỒNG ĐÔ LA "HỤT HƠI": THUẾ NGẦM ĐANG BÀO MÒN TÚI TIỀN NGƯỜI DÂN MỸ GIỮA THỜI ĐẠI TRUMP CÔNG LÝ ĐÃ MỈM CƯỜI: NỮ THÔNG DỊCH VIÊN TÒA ÁN TẠI TEXAS ĐƯỢC TRẢ TỰ DO SAU CÚ "BẮT BỚ" NGỠ NGÀNG CỦA ICE CƠN SỐT "THỪA ĐẠM" VÀ HỆ LỤY KHÔN LƯỜNG: KHI BỮA ĂN THÀNH "GÁNH NẶNG" CHO THẬN
BÃO TÁP TRÊN CHÍNH TRƯỜNG MỸ: KHI NIỀM TIN VÀO TRUMP CHẠM ĐÁY VÀ CUỘC ĐUA TRUNG NHIỆM NÓNG DẦN SÓNG GIÓ PHÁP ĐÌNH MỸ: CUỘC CHIẾN GIÀNH LẠI QUYỀN TIẾP CẬN THUỐC PHÁ THAI TRƯỚC TÒA ÁN TỐI CAO "CÁNH CHIM" SPIRIT GÃY GÁNH GIỮA TRỜI: CÁC ĐẠI GIA HÀNG KHÔNG MỸ RA TAY "CỨU TRỢ" KHẨN CẤP
Châu Âu Trong "Cơn Bão Lửa" Năng Lượng: Gói Cứu Trợ Khẩn Cấp Và Cuộc Chiến Sinh Tồn Giữa Thời Chiến Iran Cuộc Chiến AI Xuyên Lục Địa: Mỹ Tố Trung Quốc "Đánh Cắp" Chất Xám Quy Mô Công Nghiệp Bằng Công Nghệ Chưng Cất Khi "Cây Bút" Đối Đầu "Họng Súng": FBI Bị Tố Dùng Quyền Lực Ngầm Để Trù Dập Phóng Viên Tờ New York Times
Cơn Địa Chấn Tại Meta Facebook: Sa Thải 8.000 Nhân Viên Để "Dọn Đường" Cho Kỷ Nguyên Trí Tuệ Nhân Tạo Đại Án "Bánh Sinh Nhật Ma" Rúng Động Trung Quốc: Phạt Kỷ Lục 3,6 Tỷ Tệ Và Những Màn Đối Đầu Như Phim Hành Động Nghịch Lý Phố Wall: Chứng Khoán Mỹ Lên Đỉnh Lịch Sử Bất Chấp "Chảo Lửa" Trung Đông Và Giá Dầu 100 Đô
Cú "Quay Xe" Lịch Sử: Spirit Airlines Và Canh Bạc Cứu Trợ 500 Triệu Đô Giữa Cơn Bão Lửa Trung Đông HÙNG CAO: TỪ CẬU BÉ TỊ NẠN SÀI GÒN ĐẾN NGƯỜI CHÈO LÁI HẢI QUÂN HOA KỲ Những chuyện hài hước nhất hôm nay +83 videos
Mỹ khả năng rút khỏi chiến trường Trung Đông, kế hoạch đánh sập Độc tài Iran thất bại? Bầu trời Trung Đông “dậy sóng”: Emirates, Qatar, Etihad đồng loạt huỷ chuyến, hành khách rối như tơ vò Trump cần thêm 200 tỷ USD để đánh Iran, dân Mỹ tha hồ đóng tiền "ngu"
Mỹ siết luật mạnh tay: Gian lận an sinh xã hội có thể bị trục xuất ngay lập tức Ferrari “đạp phanh” tại Trung Đông: Chiến tranh Iran làm rung chuyển thị trường siêu xe Giá vé máy bay quốc tế có thể tăng gấp đôi từ 1/4/2026
Joe Kent rời ghế phản khủng bố: tiếng nói “ngược dòng” giữa cơn bão chiến tranh Iran Mỹ đánh giá Iran “chưa sụp nhưng đã suy”: khoảng trống quyền lực mở ra, nguy cơ biến thành “Triều Tiên thứ hai” Israel tiếp tục “săn đầu não”: giết chết Bộ trưởng Tình báo Iran (Esmail Khatib), Tehran rơi vào vòng xoáy hỗn loạn
Chiến dịch ‘Epic Fury’, Tóm tắt tình hình mới nhất Đêm Lửa Tehran: Đòn Đánh Mỹ–Israel, Cái Chết Của Khamenei Và Cơn Địa Chấn Hormuz Bão lửa Trung Đông lan rộng: Iran tuyên bố ‘không đàm phán’, Gulf rung chuyển vì nổ lớn, và cú ‘bắn nhầm’ làm rơi 3 tiêm kích Mỹ tại Kuwait
Lần đầu tiên trong lịch sử: F-22 Raptor xuất hiện trên bầu trời Israel Ngày thứ hai sau cuộc tấn công của Mỹ và Israel vào Tehran và tiêu diệt hết lãnh đạo đầu não của Iran, chuyện gì đang diễn ra? Nguyên nhân các vũ khí, radar, tên lửa đánh chặn của Nga-Trung hoàn toàn vô dụng trước đòn tấn công của Mỹ
Nguyên nhân Mỹ đánh một phát trúng liền giết chết Giáo Chủ Iran Vì sao Iran không dựng Giáo Chủ giả mà công bố là đã chết? 5 quân nhân gốc Việt trên hàng không mẫu hạm Mỹ tham gia đánh Iran

 

iPad Videos Portal Autoscroll

VietBF Music Portal Autoscroll

iPad News Portal Autoscroll

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

USA News Autoscroll Portall

VietBF WORLD Autoscroll Portal

Video Classic Master Page

Super Widescreen

iPad World Portal Autoscroll

iPad USA Portal Autoscroll

Phim Bộ Online
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Tin nóng nhất 24h qua

Tin nóng nhất 3 ngày qua

Tin nóng nhất 7 ngày qua

Tin nóng nhất 30 ngày qua

Albums

Total Videos Online

Tranh luận sôi nổi nhất 7 ngày qua

Tranh luận sôi nổi nhất 14 ngày qua

Tranh luận sôi nổi nhất 30 ngày qua

10.000 Tin mới nhất

Tin tức Hoa Kỳ

Tin tức Công nghệ
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Duo Series Movies Portal

Duo Music Portal

Phim Bộ

Tỷ Giá

Thời Tiết

Tin Nóng Nhất 50h

Super News

School Cooking Traveling Portal

Enter Portal

Series Shows and Movies Online

Home Classic Master Page

Donation Ủng hộ $3 cho VietBF
Lên đầu Xuống dưới Lên 3000px Xuống 3000px
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. Vì một tương lai tươi đẹp cho các thế hệ Việt Nam hãy ghé thăm chúng tôi, hãy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.

Lên đầu Xuống dưới Lên 3000px Xuống 3000px

All times are GMT. The time now is 03:57.
VietBF - Vietnamese Best Forum Copyright ©2005 - 2026
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2026 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.11297 seconds with 15 queries