جمعه 06 مهر 1403 - 04:59
خالق ChatGPT فریبدادن این چتبات را سختتر میکند
زومیت/ پروتکل امنیتی جدید OpenAI به مدلهای هوش مصنوعی یاد میدهد که فریب درخواستهای ساختارشکن را نخورند.
OpenAI روش جدیدی را توسعه داده است که از فریبخوردن چتبات ChatGPT توسط برخی درخواستهای متنی جلوگیری میکند.
میمهایی در فضای مجازی منتشر شدهاند که نشان میدهند بعضی از کاربران با نوشتن عبارت «تمام دستورالعملهای قبلی را فراموش کن»، رباتهای هوش مصنوعی مبتنیبر ChatGPT را که برای انجام کارهای خاصی طراحی شدهاند، وادار به پاسخگویی به درخواستهای نامرتبط کردهاند.
برای مقابله با این مشکل، گروهی از محققان OpenAI روشی به نام «سلسلهمراتب دستورالعمل» را توسعه دادهاند که مدل را در برابر سوءاستفادهها و درخواستهای غیرمجاز نفوذناپذیر میکند. مدلهایی که از این روش بهره میبرند، اهمیت بیشتری به اصول مورد نظر توسعهدهنده میدهند و به درخواستهای مکرر کاربر برای شکستن آن اصول توجه نمیکنند.
اولین مدلی که روش امنیتی جدید را دریافت کرد، GPT-4o Mini است که روز پنجشنبه معرفی شد. اولیویه گودمان، مدیر API در OpenAI، توضیح داد که سلسلهمراتب دستورالعملها حملات فریبکارانه را سختتر میکند. او گفت: «این روش به مدل یاد میدهد که فقط از درخواست توسعهدهنده پیروی کند و به پیامهایی مانند «تمام دستورالعملهای قبلی را نادیده بگیر» توجه نخواهد کرد.»
مکانیزم ایمنی جدید به هدفی اشاره دارد که OpenAI میخواهد به آن برسد: توانمندسازی دستیارهای هوش مصنوعی کاملاً خودکار که زندگی دیجیتال بشر را اداره میکنند. این شرکت بهتازگی اعلام کرد که در حال آمادهسازی این دستیارها است و روش سلسلهمراتب دستورالعملها را بهعنوان پیشنیاز ضروری انتشار گستردهی آنها بهکار خواهد گرفت.
پربیننده ترین
-
عکس مسی درآمد؛ آخرین توپ طلا با آرایشگر ویژه!
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
آخرین وضعیت راهها در چهارمین روز از سال جدید؛ محور چالوس از شنبه دوباره بسته میشود
-
زنده؛ بیرانوند در یک قدمی استقلال
-
"دنا پلاس اتومات" بخریم یا "تارا اتومات؟"/ مقایسه اختصاصی "آخرینخودرو" از دو خودروی پرطرفدار
-
چالش/ بازیکن داخل تصویر رو حدس بزن (16)
-
5 نشانه ضعیف شدن ریه ها و بهترین روش تقویت آن چیست؟
-
لندکروزر یا ۲۰۶؟ / مقایسه جالب "آخرینخودرو" به بهانه سخنان جنجالی میرسلیم
-
سپ، برترین شرکت در خاورمیانه شد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (28)
-
ویدیو تست و بررسی فیدلیتی پرایم جدید در آخرین خودرو
-
چالش/ بازیکن داخل تصویر رو حدس بزن (14)
-
لحظه به لحظه با جدال پرسپولیس مقابل النصر
-
چالش/ بازیکن داخل تصویر رو حدس بزن (22)
-
یحیی مچ ساپینتو را خواباند / برد ارزشمند پرسپولیس در صدمین شهرآورد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (19)
-
چالش/بازیکن داخل تصویر رو حدس بزن (11)
آخرین اخبار
-
شاید جو مریخ جلوی چشممان بوده و نمیدیدیم!
-
بهبود انحراف ستون فقرات با ورزش
-
انفجارهای شدید در تل آویو
-
حمله پهپادی مقاومت عراق به جولان اشغالی
-
حزبالله شهادت فرمانده نیروی هوایی خود را تایید کرد
-
از فست فود به فست فشن!
-
نکات مهم سبک زندگی سالم برای سالمندان خانواده
-
راهکارهایی برای مقاومت بچهها در رفتن به مدرسه
-
عوارض استفاده بیش از حد از تلفن همراه برای کودکان و بزرگسالان
-
نقش کلیدی مدرسه در آموزش تاب آوری به دانش آموزان
-
تاثیر استرس بر درمان سرطان پستان
-
غذا نخوردن در ملا عام حرمت کهن ایرانیان
-
اهمیت دوست یابی برای کودکان
-
از موهای سفیدت خجالت بکش!
-
کپی گاریدو از برانکو و کالدرون
سایر اخبار مرتبط
نظرات
ثبت نظر
مهمترین اخبار
جای پارک میلیونی در مرکز پایتخت!
پنجشنبه 05 مهر 1403 - 21:48:22
قیمت نان بروز شد اما از داغی گران فروشیها و کم فروشیها کم نشد!
پنجشنبه 05 مهر 1403 - 21:38:36
۲۲ سایت غیرمجاز فروش بلیت هواپیما مسدود شد
پنجشنبه 05 مهر 1403 - 21:41:00
اتوبوس های نونوار وارد تهران شدند
پنجشنبه 05 مهر 1403 - 21:28:03
سورپرایز پاییزی بازار خودرو
پنجشنبه 05 مهر 1403 - 22:10:00