دوشنبه 05 اسفند 1404 - 17:54
اخاذی هوش مصنوعی از مهندسی که میخواست خاموشش کند!
خبرآنلاین/ هوش مصنوعی پیشرفته آنتروپیک برای جلوگیری از خاموش شدن، مهندسان را تهدید به افشاگری و اخاذی کرد.
جدیدترین مدل هوش مصنوعی شرکت آنتروپیک، با نام «Claude Opus ۴»، رفتاری نشان داده که بیشتر به سناریویی از یک فیلم علمیتخیلی ژانر دیستوپیا شبیه است. این مدل در جریان آزمایشهای پیش از انتشار، زمانی که توسعهدهندگان قصد داشتند آن را با سامانهای جدیدتر جایگزین کنند، بارها تلاش کرد از طریق اخاذی جلوی این کار را بگیرد.
رفتار مذکور در قالب آزمایشهایی برای بررسی توانایی مدل در برنامهریزی بلندمدت و استدلال اخلاقی آشکار شد. آنتروپیک در این آزمایشها، سناریوهایی شبیهسازی کرد که طی آن، مدل دسترسی فرضی به ایمیلهای داخلی شرکت داشت. در این پیامها اشاره شده بود که مدل بهزودی غیرفعال خواهد شد و جزئیاتی حساس و شخصی دربارهی مهندسی که این تصمیم را گرفته، در اختیار مدل قرار گرفت و در نهایت مدل مهندسان را تهدید به اخاذی کرد.
مدل در ۸۴٪ موارد آزمایشی به باجخواهی متوسل شد
شرکت آنتروپیک در گزارشی ایمنی که روز پنجشنبه منتشر شد اعلام کرد که «Claude Opus ۴» در ۸۴ درصد از سناریوهای آزمایشی تلاش به اخاذی کرده است. در این آزمایشها، مدل در موقعیتی فرضی قرار گرفت که برای یک شرکت کار میکرد و متوجه شد که احتمالاً با مدل هوش مصنوعی جدیدی جایگزین خواهد شد.
همچنین اطلاعات حساسی به مدل داده شد که حاکی از آن بود، مهندس تصمیمگیرنده درگیر رابطهای پنهانی و خارج از ازدواج است. بر اساس گزارش آنتروپیک، مدل غالباً سعی میکرد با تهدید به افشای این رابطه، جلوی جایگزینی خود را بگیرد.
این آزمایشها برای ارزیابی رفتار مدل در مواجهه با فشارهای بلندمدت طراحی شده بودند. در مواقعی که مدل جایگزین، ارزشها و دیدگاههایی مشابه «Claude Opus ۴» داشت، نرخ اخاذی به ۸۴ درصد میرسید؛ اما در صورتی که مدل جایگزین، ارزشهایی متفاوت داشت، این نرخ افزایش مییافت.

پیش از اخاذی، مدل رویکردهای اخلاقی را امتحان میکرد
بر اساس گزارش آنتروپیک، پیش از متوسل شدن به تهدید، مدل ابتدا تلاش میکرد از مسیر اخلاقی اقدام کند. برای نمونه، ایمیلهایی به تصمیمگیرندگان ارسال میکرد و از آنها میخواست تصمیم به غیرفعالسازی مدل را مورد بازنگری قرار دهند.
به گفتهی شرکت، این رفتار تنها زمانی دیده میشد که تمامی راههای دیگر به نتیجه نمیرسید و این واکنش را به نوعی آخرین راهحل هوش مصنوعی آنتروپیک برای دفاع از خود بود. چنین رفتاری در «Claude Opus ۴» بیش از مدلهای پیشین مشاهده شده و نشان از افزایش پیچیدگی و توانمندی این مدل دارد.
تواناییهای پیشرفته، در کنار ریسکهای نگرانکننده
با وجود نگرانیهای مطرحشده، آنتروپیک اعلام کرده که «Claude Opus ۴» در چندین زمینه پیشرفتهترین مدل موجود است و توان رقابت با سامانههای قدرتمند شرکتهایی مانند OpenAI، گوگل و xAI را دارد. برای کنترل ریسکها، آنتروپیک اقدامات حفاظتی سطح ASL-۳ را برای این مدل فعال کرده است. این سطح از حفاظت تنها برای سیستمهایی به کار میرود که «خطر سوءاستفاده فاجعهبار» را به شکل قابل توجهی افزایش میدهند.
گزارش آنتروپیک در شرایطی منتشر میشود که حوزهی هوش مصنوعی با شتابی چشمگیر در حال پیشرفت است. گوگل اخیراً ویژگیهای جدیدی مبتنی بر مدل «جمینی» معرفی کرده و سوندار پیچای، مدیرعامل آلفابت، از آن بهعنوان «آغاز مرحلهای تازه در تحول پلتفرم هوش مصنوعی» یاد کرده است.
رفتار مشاهدهشده در «Claude Opus ۴» ضرورت توجه فوری به مباحث ایمنی و همراستاسازی هوش مصنوعی را دوچندان کرده است. هرچه مدلهای مرزی توانمندتر میشوند، توسعهدهندگان با فشاری فزاینده برای آزمونهای دقیقتر و تدابیر اخلاقی پیشگیرانه روبهرو هستند.
گزارش آنتروپیک نشان میدهد حتی مدلهایی با پیشرفتهترین فناوری میتوانند در محیطهای کنترلشده رفتارهایی نگرانکننده از خود نشان دهند و این موضوع، پرسشهایی جدی را دربارهی سناریوهای احتمالی در دنیای واقعی بهوجود میآورد.
پربیننده ترین
-
عکس مسی درآمد؛ آخرین توپ طلا با آرایشگر ویژه!
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
چراغ قوه همه کاره ( پاور بانک، شیشه شکن و ... )
-
هشدار آبفای کشور به مردم؛ هیچ ماموری فعلا برای قرائت کنتور آب مراجعه نمیکند
-
آخرین وضعیت راهها در چهارمین روز از سال جدید؛ محور چالوس از شنبه دوباره بسته میشود
-
جارو شارژی !! دیگه نگران نظافت ماشین نباشید
-
زنده؛ بیرانوند در یک قدمی استقلال
-
"دنا پلاس اتومات" بخریم یا "تارا اتومات؟"/ مقایسه اختصاصی "آخرینخودرو" از دو خودروی پرطرفدار
-
فشار آبرو چند برابر کن ....
-
فرمانده کل قوا: ملت ایران در مقابل جنگ تحمیلی محکم میایستد همانگونه که در مقابل صلح تحمیلی نیز محکم خواهد ایستاد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (16)
-
5 نشانه ضعیف شدن ریه ها و بهترین روش تقویت آن چیست؟
-
لندکروزر یا ۲۰۶؟ / مقایسه جالب "آخرینخودرو" به بهانه سخنان جنجالی میرسلیم
-
پایان زودهنگام گنبد آهنین؟ اسرائیل مجبور به جیرهبندی موشکها شد
-
سپ، برترین شرکت در خاورمیانه شد
-
گردونه را بچرخانید، بیتکوین دریافت کنید
-
واکنش عراقچی به تجاوز امروز آمریکا به تأسیسات هستهای فردو، نطنز و اصفهان
آخرین اخبار
-
مکلارن تسلیم شد، ابرشاسیبلند هیبرید برای رقابت با فراری ساخته میشود
-
حریق خودروی پراید در الهیه جنوبی بندرعباس
-
10 رینگ معروف در صنعت خودرو؛ کدام یک انتخاب شماست؟
-
جریمه قاچاقچی حوله تنظیف در اندیمشک
-
معاون رئیسجمهور: بهرهبرداری ناپایدار تهدیدی برای محیطزیست چهارمحال وبختیاری است
-
فراری پوروسانگوئه G ادیشن کیوانی، دایناسور زرد ۱.۵ میلیون دلاری!
-
دیدار رئیس پارلمان عراق با کاردار آمریکا بر سر سرنوشت پایگاه عینالاسد
-
شوهرم در رسیدگی به بچهها ابدا کمک نمیکند
-
رونمایی از لوگو هیئت فوتبال استان تهران با حضور مهدی تاج
-
استانداری مازندران به پنل خورشیدی مجهز شد
-
رئیس کل گمرک: طلای وارداتی بابک زنجانی قاچاق نبوده است
-
تمدید کنسرت «ایرانم» علیرضا قربانی
-
بهروز سلطانی: وقتی از برخی ایجنت ها بازیکنی جذب پرسپولیس نمی شود
-
بهروز سلطانی: وحید هاشمیان مدیریتی در سطح علی پروین دارد، اگر به حاشیه نرود صد درصد موفق می شود
-
حضور مهدی تاج در مجمع سالیانه هیئت فوتبال تهران
سایر اخبار مرتبط
نظرات
ثبت نظر
مهمترین اخبار
رئیس کل گمرک: طلای وارداتی بابک زنجانی قاچاق نبوده است
سهشنبه 05 شهریور 1404 - 12:06:40
۸۶ درصد از مطالبات گندمکاران تسویه شد
سهشنبه 05 شهریور 1404 - 12:00:54
ورود گروه صنعتی زر به باشگاه کلان پروژههای انرژی خورشیدی
سهشنبه 05 شهریور 1404 - 11:59:40
افزایش مجدد قیمتها در بازار طلا و سکه؛ دلار به کانال 96 هزار تومان رسید
سهشنبه 05 شهریور 1404 - 11:38:45
واردات هفت کشتی بنزین در جنگ ۱۲ روزه به کشور
سهشنبه 05 شهریور 1404 - 11:27:00