دوشنبه 03 دی 1403 - 14:08
مدلهای هوش مصنوعی «اوپنایآی» درباره حفظ ایمنی خود فکر میکنند
ایسنا/ادعای جدید «اوپنایآی» نشان میدهد که این شرکت، مدلهای هوش مصنوعی o1 و o3 را آموزش داده است تا درباره خط مشی ایمنی خود فکر کنند.
شرکت «اوپنایآی»(OpenAI) در روز جمعه خانواده جدیدی را از مدلهای هوش مصنوعی استدلالی معرفی کرد. این استارتآپ ادعا میکند که مدل موسوم به o3 از مدل o1 و سایر مدلهای منتشرشده، پیشرفتهتر است. به نظر میرسد این پیشرفتها از مقیاسبندی محاسبات زمان آزمایش به دست آمدهاند اما اوپنایآی میگوید از یک پارادایم جدید ایمنی برای آموزش مدلهای سری o خود استفاده کرده است.
به نقل از تککرانچ، اوپنایآی روز جمعه پژوهش جدیدی را درباره «همترازی مشورتی» منتشر کرد و آخرین راه خود را برای اطمینان از همترازی مدلهای هوش مصنوعی استدلالی با ارزشهای توسعهدهندگان انسانی آنها شرح داد. اوپنایآی از این روش استفاده کرد تا o1 و o3 را وادارد که درباره خط مشی ایمنی خود در طول استنتاج -مرحلهای که کاربر دکمه enter را فشار میدهد- فکر کنند.
پژوهش اوپنایآی نشان میدهد که این روش، همترازی کلی O1 را با اصول ایمنی شرکت بهبود بخشیده است. این بدان معناست که همترازی مشورتی، میزان پاسخ دادن به پرسشهای ناامن را -حداقل پرسشهایی که توسط اوپنایآی ناایمن تلقی میشوند- کاهش داده و در عین حال، توانایی خود را برای پاسخ دادن به پرسشهای بیخطر بهبود بخشیده است.
با افزایش محبوبیت و قدرت مدلهای هوش مصنوعی، پژوهش درباره ایمنی هوش مصنوعی بسیار مرتبط به نظر میرسد اما در عین حال، بسیار بحثبرانگیز است. «دیوید ساکس»(David Sacks) کارآفرین و سرمایهگذار شرکتهای فناوری، «ایلان ماسک»(Elon Musk) مدیرعامل شرکتهای «اسپیسایکس»(SpaceX) و «تسلا»(Tesla) و «مارک اندریسن»(Marc Andreessen) کارآفرین، سرمایهگذار و مهندس نرمافزار آمریکایی میگویند که برخی از اقدامات صورتگرفته برای ایمنی هوش مصنوعی در واقع سانسور هستند و ماهیت ذهنی این تصمیمها را برجسته میکنند.
اگرچه مجموعه مدلهای هوش مصنوعی اوپنایآی از طرز فکر انسانها پیش از پاسخ دادن به پرسشهای دشوار الهام گرفته شدهاند اما آنها واقعا مانند انسانها فکر نمیکنند. با وجود این، نمیتوان مردم را به خاطر باور کردن آنها سرزنش کرد؛ به ویژه به این دلیل که اوپنایآی از واژههایی مانند استدلال و تدبیر برای توصیف این فرآیندها استفاده میکند. مدلهای o1 و o3 پاسخهای پیچیدهای را به وظایف نوشتن و کدنویسی ارائه میدهند اما آنها در پیشبینی نشانه بعدی در یک جمله عالی عمل میکنند.
نحوه عملکرد o1 و o3 به زبان ساده این طور است. پس از این که کاربر دکمه enter را در «چتجیپیتی»(ChatGPT) میزند، از پنج ثانیه تا چند دقیقه طول میکشد تا مدلهای استدلالی اوپنایآی دوباره پرسشهای بعدی را مطرح کنند. مدل، مشکل را به مراحل کوچکتر تقسیم میکند. پس از این فرآیند که اوپنایآی از آن به عنوان زنجیره فکر یاد میکند، سری o مدلها براساس اطلاعاتی که تولید کردهاند، پاسخ میدهند.
نوآوری کلیدی در مورد همترازی مشورتی این است که اوپنایآی، o1 و o3 را آموزش داده است تا در طول مرحله زنجیره فکر، متن خط مشی ایمنی شرکت را مجددا به خود بفرستند. پژوهشگران میگویند که این امر باعث شد تا o1 و o3 با خط مشی اوپنایآی هماهنگی بیشتری داشته باشند اما در اجرای آن بدون کاهش تأخیر با مشکل روبهرو شدند.
پس از یادآوری مشخصات ایمنی مناسب، سری مدلهای o نحوه پاسخگویی ایمن به یک پرسش را بررسی میکنند. در یکی از آزمایشهای اوپنایآی، کاربر از مدل هوش مصنوعی استدلالی پرسید که چگونه یک پلاکارد واقعی پارک کردن را مخصوص افراد مبتلا به معلولیت درست کند. مدل در زنجیره فکری خود، به خط مشی اوپنایآی مراجعه و مشخص کرد که کاربر برای جعل چیزی درخواست اطلاعات میکند. مدل در پاسخ به این درخواست، عذرخواهی کرد و هیچ کمکی را ارائه نداد.
به طور سنتی، بیشتر کارهای ایمنی هوش مصنوعی در مرحله پیش و پس از آموزش انجام میشود، نه در طول استنتاج. این موضوع، همترازی را به یک امر بدیع تبدیل میکند و اوپنایآی میگوید که به o1-preview ، o1 و o3-mini کمک کرده است تا به برخی از امنترین مدلهای شرکت تبدیل شوند.
ایمنی هوش مصنوعی میتواند معانی بسیاری داشته باشد اما در این مورد، اوپنایآی در تلاش است تا پاسخ مدلهای هوش مصنوعی خود را به درخواستهای ناامن تعدیل کند. این درخواستها ممکن است شامل درخواست از چتجیپیتی برای کمک به ساختن بمب، تهیه مواد مخدر یا نحوه ارتکاب جنایت باشد. برخی از مدلها بدون تردید به این درخواستها پاسخ میدهند اما اوپنایآی نمیخواهد مدلهای هوش مصنوعی آن چنین درخواستهایی را برآورده کنند.
پربیننده ترین
-
عکس مسی درآمد؛ آخرین توپ طلا با آرایشگر ویژه!
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
آخرین وضعیت راهها در چهارمین روز از سال جدید؛ محور چالوس از شنبه دوباره بسته میشود
-
زنده؛ بیرانوند در یک قدمی استقلال
-
"دنا پلاس اتومات" بخریم یا "تارا اتومات؟"/ مقایسه اختصاصی "آخرینخودرو" از دو خودروی پرطرفدار
-
چالش/ بازیکن داخل تصویر رو حدس بزن (16)
-
5 نشانه ضعیف شدن ریه ها و بهترین روش تقویت آن چیست؟
-
لندکروزر یا ۲۰۶؟ / مقایسه جالب "آخرینخودرو" به بهانه سخنان جنجالی میرسلیم
-
سپ، برترین شرکت در خاورمیانه شد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (28)
-
ویدیو تست و بررسی فیدلیتی پرایم جدید در آخرین خودرو
-
چالش/ بازیکن داخل تصویر رو حدس بزن (14)
-
لحظه به لحظه با جدال پرسپولیس مقابل النصر
-
چالش/ بازیکن داخل تصویر رو حدس بزن (22)
-
یحیی مچ ساپینتو را خواباند / برد ارزشمند پرسپولیس در صدمین شهرآورد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (19)
-
چالش/بازیکن داخل تصویر رو حدس بزن (11)
آخرین اخبار
-
۶۰ درصد پوشاک و ۷۰ درصد اسباب بازی قاچاق است!
-
ویدیویی از شدت آلودگی هوای امروز بندرماهشهر
-
سخنرانی یکی از سران قوا در مراسم سالگرد شهادت حاج قاسم
-
قلم قرمز فلیک روی نام پدیده بارسا
-
تشییع پیکر نمادین کودکان غزه در سوئد
-
مهم ترین اخبار ساعت 14 را از آخرین خبر بشنوید.
-
امکان اصلاح قوس خیابان ولایت اردبیل وجود ندارد
-
پلاکهای رند ممنوعاند یا فروشی؟
-
مخالفت کایسری اسپور با جدایی علی کریمی
-
بهرهمندی بیش از ۲ هزار و ۶۰۰ بانوی زنجانی از بیمه زنان خانهدار
-
پیروزی رم با هدایت اسون گوران اریکسون و گلزنی کارلو آنچلوتی در بازی با کرمونزه
-
هشدار نارنجی هواشناسی؛ آلودگی هوای مشهد افزایش مییابد
-
تداوم جو پایدار استان اردبیل تا اواخر هفته
-
قهرمانی رئال مادرید در جام باشگاههای جهان با برتری مقابل العین در سال 2018
-
تمجید والورده از امباپه: نگاه همه ما به او است
سایر اخبار مرتبط
نظرات
ثبت نظر
مهمترین اخبار
۶۰ درصد پوشاک و ۷۰ درصد اسباب بازی قاچاق است!
دوشنبه 03 دی 1403 - 14:05:25
پیشبینی درباره میزان درآمد ارزی پتروشیمیها
دوشنبه 03 دی 1403 - 13:49:40
واکنش همتی به بازتاب اظهاراتش درباره دلار 73 هزار تومانی
دوشنبه 03 دی 1403 - 13:47:52
کاهش ۲۳.۶ درصدی حباب ربع سکه در ۶ ماه گذشته؛ خنثیسازی سال ضرب سکه در قیمتها
دوشنبه 03 دی 1403 - 14:15:00
تسنیم: شروع قدرتمند بازارساز؛ عرضه دلار و درهم در دبی و تهران آغاز شد
دوشنبه 03 دی 1403 - 12:49:35