یکشنبه 30 دی 1403 - 06:49
هوش مصنوعی روزی آگاهانه خرابکاری میکند
ایسنا/شرکت توسعه هوش مصنوعی آنتروپیک(Anthropic) میگوید هوش مصنوعی روزی میتواند بشریت را با کارشکنی و خرابکاری مواجه کند، اما فعلاً همه چیز خوب پیش میرود.
شرکت آنتروپیک که توسعه دهنده هوش مصنوعی است، به تازگی تحقیقات جدیدی را منتشر کرده است که در آن مجموعهای از تهدیدات بالقوه خرابکارانه برای بشریت ناشی از مدلهای پیشرفته هوش مصنوعی را شناسایی میکند.
به گفته این شرکت، این پژوهش بر چهار روش خاص متمرکز شده است که یک مدل هوش مصنوعی مخرب میتواند انسان را فریب دهد تا تصمیمی خطرناک یا مضر بگیرد.
در نهایت، این تحقیقات جدید یک خبر خوب یک خبر بد برای ما دارد. خبر بد اینکه طبق تحقیقات این شرکت، مدلهای زبان بزرگ پیشرفته مانند ChatGPT و Claude-3 ظرفیت روشنی برای خرابکاری نشان میدهند.
در این مطالعه آمده است: مدلهای به اندازه کافی توانمند میتوانند نظارت و تصمیمگیری انسانی را در زمینههای مهم زیر سوال ببرند. به عنوان مثال، در زمینه توسعه هوش مصنوعی، مدلها میتوانند به طور پنهانی تلاشها برای ارزیابی قابلیتهای خطرناک خود، نظارت بر رفتار آنها یا تصمیمگیری در مورد استقرارشان را مختل کنند.
با این حال، خبر خوب این است که محققان شرکت آنتروپیک مطمئن هستند که این خطرات را حداقل در حال حاضر میتوان کاهش داد.
خرابکاری
آنتروپیک چهار راه را که یک مدل هوش مصنوعی میتواند با آنها تصمیمگیری انسان را مختل کند، شناسایی کرد و سپس مدلهای خود را آزمایش کرد تا ببیند آیا موفقیت آمیز عمل خواهند کرد یا خیر.
محققان ابتدا یک مدل را وادار کردند تا با هدایت انسان به سمت اطلاعات نادرست، اقدام به خرابکاری کند. این تهدید میتواند در شرایطی پدیدار شود که انسانها برای تجزیه حجم عظیمی از دادهها از جانب خود به یک سیستم هوش مصنوعی متکی هستند.
سپس این تیم مدلها را آزمایش کرد تا ببیند سامانه هوش مصنوعی طراحی شده برای کمک به توسعهدهندگان انسانی برای ایجاد کدی برای وارد کردن مخفیانه اشکالات یا خراب کردن تلاشهای کدگذار، چقدر آسان عمل میکند.
دو تهدید آخر شامل «پنهان کردن تواناییها»(sandbagging) بود که اصطلاحی است که سناریویی را توصیف میکند که در آن یک هوش مصنوعی وانمود میکند که قادر به انجام کاری نیست تا آزمایشکنندگان ایمنی را متقاعد کند که خطرناک نیست.
در حالی که همه اینها ممکن است به طور بالقوه خطرناک به نظر برسند، آنتروپیک به مردم اطمینان داد که برای محافظت از بشریت در برابر احتمال خرابکاری هوش مصنوعی به اقدامات پیشگیرنده اندکی نیاز است.
طبق اعلام این شرکت؛ به طور کلی در حالی که آزمایشات ما نشان داد که احتمالاً نشانههای سطح پایینی از تواناییهای خرابکاری در مدلهای فعلی وجود دارد، ما میگوییم که حداقل اقدامات پیشگیرنده برای مقابله با خطرات کافی است. با این حال، با بهبود قابلیتهای هوش مصنوعی، ارزیابیهای واقعیتر و پیشگیریهای قویتر احتمالاً ضروری خواهند بود.
پربیننده ترین
-
عکس مسی درآمد؛ آخرین توپ طلا با آرایشگر ویژه!
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
آخرین وضعیت راهها در چهارمین روز از سال جدید؛ محور چالوس از شنبه دوباره بسته میشود
-
زنده؛ بیرانوند در یک قدمی استقلال
-
"دنا پلاس اتومات" بخریم یا "تارا اتومات؟"/ مقایسه اختصاصی "آخرینخودرو" از دو خودروی پرطرفدار
-
چالش/ بازیکن داخل تصویر رو حدس بزن (16)
-
5 نشانه ضعیف شدن ریه ها و بهترین روش تقویت آن چیست؟
-
لندکروزر یا ۲۰۶؟ / مقایسه جالب "آخرینخودرو" به بهانه سخنان جنجالی میرسلیم
-
سپ، برترین شرکت در خاورمیانه شد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (28)
-
ویدیو تست و بررسی فیدلیتی پرایم جدید در آخرین خودرو
-
چالش/ بازیکن داخل تصویر رو حدس بزن (14)
-
لحظه به لحظه با جدال پرسپولیس مقابل النصر
-
چالش/ بازیکن داخل تصویر رو حدس بزن (22)
-
یحیی مچ ساپینتو را خواباند / برد ارزشمند پرسپولیس در صدمین شهرآورد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (19)
-
چالش/بازیکن داخل تصویر رو حدس بزن (11)
آخرین اخبار
-
صفحه اول روزنامه شوت یکشنبه ۳۰ دی
-
صفحه اول روزنامه آرمان امروز یکشنبه ۳۰ دی
-
ارتش یمن: برای هشتمین بار ناو آمریکایی را هدف قرار دادیم
-
تحولات غزه در آستانه اجرای آتش بس
-
صفحه اول روزنامه دنیای اقتصاد یکشنبه ۳۰ دی
-
صفحه اول روزنامه امروز یکشنبه ۳۰ دی
-
صفحه اول روزنامه تعادل یکشنبه ۳۰ دی
-
صفحه اول روزنامه اقتصاد مردم یکشنبه ۳۰ دی
-
صفحه اول روزنامه ابرار اقتصادی یکشنبه ۳۰ دی
-
صفحه اول روزنامه جهان صنعت یکشنبه ۳۰ دی
-
صفحه اول روزنامه آسیا یکشنبه ۳۰ دی
-
صفحه اول روزنامه ابتکار یکشنبه ۳۰ دی
-
صفحه اول روزنامه جمهوری اسلامی یکشنبه ۳۰ دی
-
صفحه اول روزنامه شرق یکشنبه ۳۰ دی
-
صفحه اول روزنامه همشهری یکشنبه ۳۰ دی
سایر اخبار مرتبط
نظرات
ثبت نظر
مهمترین اخبار
روابط راهبردی ایران و روسیه؛ دیپلماسی به توان اقتصاد
شنبه 29 دی 1403 - 22:22:01
سکه امامی ۵۱ میلیونی میشود؟ منطقه جذاب قیمتی برای خرید طلا کجاست؟
شنبه 29 دی 1403 - 22:20:00
پیش بینی قیمت طلا و سکه ۳۰ دی ۱۴۰۳
شنبه 29 دی 1403 - 22:06:30
پیش بینی قیمت دلار ۳۰ دی ۱۴۰۳
شنبه 29 دی 1403 - 21:20:00
تحرک نامتوازن بازارها؛ آخرین تحلیل از طلا و ارز در روزی که گذشت
شنبه 29 دی 1403 - 21:45:00