شنبه 28 مهر 1403 - 16:05
هوش مصنوعی روزی آگاهانه خرابکاری میکند
ایسنا/شرکت توسعه هوش مصنوعی آنتروپیک(Anthropic) میگوید هوش مصنوعی روزی میتواند بشریت را با کارشکنی و خرابکاری مواجه کند، اما فعلاً همه چیز خوب پیش میرود.
شرکت آنتروپیک که توسعه دهنده هوش مصنوعی است، به تازگی تحقیقات جدیدی را منتشر کرده است که در آن مجموعهای از تهدیدات بالقوه خرابکارانه برای بشریت ناشی از مدلهای پیشرفته هوش مصنوعی را شناسایی میکند.
به گفته این شرکت، این پژوهش بر چهار روش خاص متمرکز شده است که یک مدل هوش مصنوعی مخرب میتواند انسان را فریب دهد تا تصمیمی خطرناک یا مضر بگیرد.
در نهایت، این تحقیقات جدید یک خبر خوب یک خبر بد برای ما دارد. خبر بد اینکه طبق تحقیقات این شرکت، مدلهای زبان بزرگ پیشرفته مانند ChatGPT و Claude-3 ظرفیت روشنی برای خرابکاری نشان میدهند.
در این مطالعه آمده است: مدلهای به اندازه کافی توانمند میتوانند نظارت و تصمیمگیری انسانی را در زمینههای مهم زیر سوال ببرند. به عنوان مثال، در زمینه توسعه هوش مصنوعی، مدلها میتوانند به طور پنهانی تلاشها برای ارزیابی قابلیتهای خطرناک خود، نظارت بر رفتار آنها یا تصمیمگیری در مورد استقرارشان را مختل کنند.
با این حال، خبر خوب این است که محققان شرکت آنتروپیک مطمئن هستند که این خطرات را حداقل در حال حاضر میتوان کاهش داد.
خرابکاری
آنتروپیک چهار راه را که یک مدل هوش مصنوعی میتواند با آنها تصمیمگیری انسان را مختل کند، شناسایی کرد و سپس مدلهای خود را آزمایش کرد تا ببیند آیا موفقیت آمیز عمل خواهند کرد یا خیر.
محققان ابتدا یک مدل را وادار کردند تا با هدایت انسان به سمت اطلاعات نادرست، اقدام به خرابکاری کند. این تهدید میتواند در شرایطی پدیدار شود که انسانها برای تجزیه حجم عظیمی از دادهها از جانب خود به یک سیستم هوش مصنوعی متکی هستند.
سپس این تیم مدلها را آزمایش کرد تا ببیند سامانه هوش مصنوعی طراحی شده برای کمک به توسعهدهندگان انسانی برای ایجاد کدی برای وارد کردن مخفیانه اشکالات یا خراب کردن تلاشهای کدگذار، چقدر آسان عمل میکند.
دو تهدید آخر شامل «پنهان کردن تواناییها»(sandbagging) بود که اصطلاحی است که سناریویی را توصیف میکند که در آن یک هوش مصنوعی وانمود میکند که قادر به انجام کاری نیست تا آزمایشکنندگان ایمنی را متقاعد کند که خطرناک نیست.
در حالی که همه اینها ممکن است به طور بالقوه خطرناک به نظر برسند، آنتروپیک به مردم اطمینان داد که برای محافظت از بشریت در برابر احتمال خرابکاری هوش مصنوعی به اقدامات پیشگیرنده اندکی نیاز است.
طبق اعلام این شرکت؛ به طور کلی در حالی که آزمایشات ما نشان داد که احتمالاً نشانههای سطح پایینی از تواناییهای خرابکاری در مدلهای فعلی وجود دارد، ما میگوییم که حداقل اقدامات پیشگیرنده برای مقابله با خطرات کافی است. با این حال، با بهبود قابلیتهای هوش مصنوعی، ارزیابیهای واقعیتر و پیشگیریهای قویتر احتمالاً ضروری خواهند بود.
پربیننده ترین
-
عکس مسی درآمد؛ آخرین توپ طلا با آرایشگر ویژه!
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
آخرین وضعیت راهها در چهارمین روز از سال جدید؛ محور چالوس از شنبه دوباره بسته میشود
-
زنده؛ بیرانوند در یک قدمی استقلال
-
"دنا پلاس اتومات" بخریم یا "تارا اتومات؟"/ مقایسه اختصاصی "آخرینخودرو" از دو خودروی پرطرفدار
-
چالش/ بازیکن داخل تصویر رو حدس بزن (16)
-
5 نشانه ضعیف شدن ریه ها و بهترین روش تقویت آن چیست؟
-
لندکروزر یا ۲۰۶؟ / مقایسه جالب "آخرینخودرو" به بهانه سخنان جنجالی میرسلیم
-
سپ، برترین شرکت در خاورمیانه شد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (28)
-
ویدیو تست و بررسی فیدلیتی پرایم جدید در آخرین خودرو
-
چالش/ بازیکن داخل تصویر رو حدس بزن (14)
-
لحظه به لحظه با جدال پرسپولیس مقابل النصر
-
چالش/ بازیکن داخل تصویر رو حدس بزن (22)
-
یحیی مچ ساپینتو را خواباند / برد ارزشمند پرسپولیس در صدمین شهرآورد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (19)
-
چالش/بازیکن داخل تصویر رو حدس بزن (11)
آخرین اخبار
-
اقدام به موقع مامور پست، زن میانسال را از مرگ نجات داد
-
دستگیری سارق اسکیمری 1106 کارت بانکی در استان مرکزی
-
آگهی دعوت به همکاری بانک صادرات ایران برای 31 استان
-
جریمه نقدی و حبس برای عاملان آتشسوزی بقایای اراضی کشاورزی در بوکان
-
پزشکیان سهشنبه به روسیه میرود
-
علت انتشار بوی بنزین در کابین خودرو چیست؟
-
واحد غیرمجاز پزشکی و دندانپزشکی در قزوین پلمب شد
-
نجات بازیکن سابق رئال از اعتیاد به قمار و ورشکستگی
-
صندلی های آزادی به ورزشگاه شیرودی رسید
-
دویدن جالب و سرعتی ربات در صحرا
-
طولانی ترین پژوهش انجام شده در مورد خوشبختی!
-
قاتل فراری در ساوجبلاغ گرفتار قانون شد
-
ابداع پلاستیکی که ۱۵ برابر سریعتر از کاغذ در دریا تجزیه میشود
-
نشست فوتسالی در غیاب شمسایی؛ تیم صانعی در کافا شرکت میکند
-
ضربوشتم نیروهای اورژانس کاشمر حین خدمت
سایر اخبار مرتبط
نظرات
ثبت نظر
مهمترین اخبار
آثار کاهش نرخ سود در اقتصاد ایران
شنبه 28 مهر 1403 - 16:00:00
نرخ رشد نقدینگی شهریورماه به ۲۷.۸ درصد رسید
شنبه 28 مهر 1403 - 15:42:12
روایت تسنیم از ریختوپاش ۲۶۶همتی ۲۲ بانک برای اشخاص مرتبط
شنبه 28 مهر 1403 - 15:34:00
تولید خودرو ۵ درصد کم شد
شنبه 28 مهر 1403 - 15:27:06
افزایش ۳۹ درصدی ارزش صادرات خاویار در ۶ ماهه امسال
شنبه 28 مهر 1403 - 14:45:44