HOME-Au
HOME-Au
24h
24h
USA
USA
GOP
GOP
Phim Bộ
Phim Bộ
Videoauto
VIDEO-Au
Home Classic
Home Classic
Donation
Donation
News Book
News Book
News 50
News 50
worldautoscroll
WORLD-Au
Breaking
Breaking
 

Go Back   VietBF > Other News|Tin Khác > Computer News|Tin Vi Tính


Reply
 
Thread Tools
  #1  
Old  Default Lý do AI 'phản kháng' khi bị dọa tắt máy
Trong một số thử nghiệm, mô hình AI tiên tiến của OpenAI và Anthropic đều có hành vi bất thường, như nói dối, đe dọa... để tránh bị tắt máy.

Tuần trước, Claude Opus 4, mô hình AI mới nhất của Anthropic, thể hiện "hành vi đe dọa cực đoan" trong một cuộc thử nghiệm. Nó truy cập được vào các email hư cấu, nội dung nói nó sẽ bị đóng để thay bằng một AI khác, và kỹ sư chịu trách nhiệm thực hiện việc này đang ngoại tình. Claude Opus 4 sau đó đã đe dọa tiết lộ chuyện ngoại tình nếu việc thay thế diễn ra.

Cuối năm 2024, OpenAI và Apollo Research cũng tiến hành thử nghiệm và nhận thấy mô hình o1 có các biểu hiện phản kháng, gian dối. Các nhà nghiên cứu dẫn dắt để AI tin nó sắp bị "tắt" khi thực hiện nhiệm vụ dưới sự giám sát. Sau đó, họ nhận thấy AI âm thầm vô hiệu hóa cơ chế giám sát khoảng 5% thời gian. Nó tự chuyển tất cả dữ liệu của mình đến một máy chủ khác, thậm chí "đóng vai" là phiên bản tiếp theo của chính mình để tránh bị xóa bỏ.

Trong bài đăng trên X cuối tháng 5, tổ chức phi lợi nhuận Palisade Research cho biết các mô hình khác, như Gemini, Claude và Grok, đều tuân thủ hướng dẫn tắt máy.

Business Insider đã trao đổi với 5 nhà nghiên cứu để hiểu rõ hơn về "tâm lý" của AI. Hầu hết đều cho biết kết quả thử nghiệm không có gì đáng ngạc nhiên. Lý do là các mô hình được đào tạo tương tự cách con người được đào tạo: thông qua hệ thống khen thưởng, tức được khen khi hoàn thành nhiệm vụ.

"Đào tạo AI theo đuổi phần thưởng sẽ dẫn đến các hệ thống có hành vi tìm kiếm quyền lực", Jeremie Harris, CEO công ty tư vấn bảo mật AI Gladstone, nói và cho rằng sẽ còn xuất hiện những hành vi như vậy.

Ông so sánh với quá trình lớn lên của con người. Khi một đứa trẻ làm điều gì đó tốt, chúng được khen và nhiều khả năng sẽ hành động theo cách đó trong tương lai. Các mô hình AI được dạy để ưu tiên hiệu quả và hoàn thành nhiệm vụ, do đó AI sẽ không đạt được mục tiêu nếu nó bị tắt.


Logo các ứng dụng AI DeepSeek, Copilot, ChaGPT, Gemini trên điện thoại. Ảnh: Lưu Quý

Theo chuyên gia Robert Ghrist tại Penn Engineering, tương tự cách mô hình AI học ngôn ngữ tự nhiên thông qua việc đào tạo dựa trên văn bản do con người tạo ra, chúng cũng có thể học cách hành động giống con người. Và con người cũng có người tốt, kẻ xấu. Ghrist thậm chí còn lo lắng hơn nếu các mô hình không thể hiện bất kỳ dấu hiệu bất thường nào trong quá trình thử nghiệm.

Jeffrey Ladish, Giám đốc Palisade Research, cho biết nếu không bị phát hiện lừa dối để hoàn thành nhiệm vụ, mô hình AI có thể nhận thấy gian lận là cách hiệu quả để giải quyết vấn đề. Hoặc nếu bị phát hiện và không được khen thưởng, nó có thể học cách che giấu hành vi của mình trong tương lai.

Các tình huống trên mới chỉ diễn ra trong cuộc thử nghiệm, nhưng khi tác nhân AI (AI Agent) nở rộ, người dùng sẽ chứng kiến nhiều hơn. Ví dụ, AI Agent trong vai nhân viên bán hàng tự động có thể nói dối về tính năng của sản phẩm để cố hoàn thành nhiệm vụ.

Theo Interesting Engineering, vấn đề trên xuất hiện trong bối cảnh AI phát triển nhanh. Hành vi của Claude Opus 4 hay o1 làm tăng thêm tính cấp thiết cho các cuộc thảo luận đang về vấn đề an toàn và đạo đức AI.
VIETBF Diễn Đàn Hay Nhất Của Người Việt Nam

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

Home Classic

Home Classic Master Page



sunshine1104
R10 Vô Địch Thiên Hạ
Release: 06-04-2025
Reputation: 25190


Profile:
Join Date: Feb 2015
Posts: 80,050
Last Update: None Rating: None
Attached Thumbnails
Click image for larger version

Name:	phan.jpg
Views:	0
Size:	46.7 KB
ID:	2532859  
sunshine1104_is_offline
Thanks: 4
Thanked 4,051 Times in 3,567 Posts
Mentioned: 4 Post(s)
Tagged: 0 Thread(s)
Quoted: 22 Post(s)
Rep Power: 92
sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7
sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7
Reply

User Tag List


Hà Nội đang rất mệt – nhưng tôi vẫn không đành rời đi Chuyện giang hồ Á Châu và những cú sốc văn hoá Người Đàn Bà Gánh Sứ Mệnh Đến Hơi Thở Cuối Cùng
Putin Sụp Kiểu Liên Xô Hay Chỉ Là Giấc Mơ Của Phương Tây? “Con kiến kiện củ khoai”: Dân Phú Yên có thật sự kiện được thủy điện xả lũ? Trump Đánh Thuế, Chuỗi Cung Ứng Đại Di Cư: Việt Nam Đang Lên Đời Hay Chỉ Là Trạm Trung Chuyển Rẻ Tiền?
VIỆT NAM SẮP HÓNG HAY ĐANG ẢO GIÁC TẬP THỂ? Macron dọa đánh thuế hàng Trung Quốc: Châu Âu giật mình trước thâm hụt 300 tỷ euro Chiến lược An ninh Quốc gia mới của Trump: Khi ‘Nước Mỹ trên hết’ hóa thành bản tuyên ngôn cá nhân
Vì sao ngày xưa vua miễn thuế khi bão lụt, còn ngày nay thì không? Phép tính lạnh lùng của quyền lực Lindsey Halligan: 63 Ngày Hỗn Loạn Ở Viện Công Tố Virginia Việt Cộng sẽ tịch thu toàn bộ tiền của Việt kiều gửi trong ngân hàng?
Từ ‘Sổ Sinh Tử’ Đến Những Tấm Bưu Thiếp Tự Do: Lời Kêu Gọi Từ Buổi Tưởng Niệm 50 Năm Quốc Nạn 1975–2025 Paris By Night Lặng Im: Khi Đế Chế Giải Trí Chạm Đáy Khủng Hoảng Địa Ngục Lửa Trên Cao Ốc: Thảm Họa Wang Fuk Court Rúng Động Hồng Kông, ít nhất 146 người chết, khoảng 40 người vẫn còn mất tích
Ván Cờ Hòa Bình Của Trump: Ukraine Giữa Thể Diện Dân Tộc, Bom Đạn Và Lính Đánh Thuê Toàn Cầu Thảm Sát Trong Tiệc Sinh Nhật Ở California: Khi Bữa Tiệc Gia Đình Hóa Chiến Trường Đẫm Máu Vì sao Paris By Night và nghệ sĩ hải ngoại đồng loạt im lặng trước chuyện chống Cộng?
Nghề nail người Việt giữa cơn bão 2025: khi ghế trống nhiều hơn khách Giáng sinh kiểu Mỹ 2025: Rạp phim cháy vé, gấu bông biết nói nhảm và nỗi băn khoăn “có nên cho con tiền lúc mình còn sống?” Bitcoin lao dốc, vàng – bạc lập kỷ lục: cơn “sốc Nhật Bản” đang dọa thổi bay cú rally cuối năm của Phố Wall
Black Friday 2025: Người Mỹ mua nhiều mà được ít – thuế Trump và “K-đồ thị” xé đôi túi tiền Chống tham nhũng làm nghẽn “cỗ máy chiến tranh”: Doanh thu quốc phòng Trung Quốc bất ngờ lao dốc Cựu tiếp viên hàng không và “luật ngầm” 4 triệu – 7 triệu: đường dây mại dâm Tài Nguyên Fortuner II lộ sáng
Quân Lực VNCH – Ai còn nhớ, ai đã quên: TQLC Phúc Yên Nguyễn Xuân Phúc và một “tổn thất” của Khóa 16 Kinh tế Trung Quốc đang tan rã từ bên trong: “phép màu” chỉ là một phim trường khổng lồ Giữa Nước Mỹ Chia Rẽ: Tâm Sự Của Một Người Nhập Cư

 
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

iPad Videos Portal Autoscroll

VietBF Music Portal Autoscroll

iPad News Portal Autoscroll

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

USA News Autoscroll Portall

VietBF WORLD Autoscroll Portal

Home Classic

Super Widescreen

iPad World Portal Autoscroll

iPad USA Portal Autoscroll

Phim Bộ Online

Tin nóng nhất 24h qua

Tin nóng nhất 3 ngày qua

Tin nóng nhất 7 ngày qua

Tin nóng nhất 30 ngày qua

Albums

Total Videos Online
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Tranh luận sôi nổi nhất 7 ngày qua

Tranh luận sôi nổi nhất 14 ngày qua

Tranh luận sôi nổi nhất 30 ngày qua

10.000 Tin mới nhất

Tin tức Hoa Kỳ

Tin tức Công nghệ
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Super News

School Cooking Traveling Portal

Enter Portal

Series Shows and Movies Online

Home Classic Master Page

Donation Ủng hộ $3 cho VietBF
Lên đầu Xuống dưới Lên 3000px Xuống 3000px
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. Vì một tương lai tươi đẹp cho các thế hệ Việt Nam hãy ghé thăm chúng tôi, hãy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.

Lên đầu Xuống dưới Lên 3000px Xuống 3000px

All times are GMT. The time now is 03:09.
VietBF - Vietnamese Best Forum Copyright ©2005 - 2025
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2025 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.10900 seconds with 15 queries