رسانه خبری آینا - مدل هوش مصنوعی o3 شرکت OpenAI در ارزیابی‌ها کمتر از انتظار امتیاز گرفت

دوشنبه 02 اردیبهشت 1404 - 12:14

کد خبر 877767

دوشنبه 02 اردیبهشت 1404 - 09:50:55

مدل هوش مصنوعی o3 شرکت OpenAI در ارزیابی‌ها کمتر از انتظار امتیاز گرفت

زومیت/ ظاهراً عملکرد مدل هوش مصنوعی o3 در معیار FrontierMath، با آنچه OpenAI رسماً اعلام کرده بود، تفاوت زیادی دارد.

مدل هوش مصنوعی o3 که در دسامبر (آذر و دی ۱۴۰۳) معرفی شد، ابتدا با ادعای پاسخگویی به بیش از ۲۵ درصد از سؤالات مجموعه‌ی ریاضی FrontierMath توجهات را به خود جلب کرد؛ عددی که به‌مراتب بالاتر از عملکرد سایر مدل‌ها بود؛ اما حالا نتایج ارزیابی مستقل مؤسسه‌ی Epoch AI، این ادعاها را زیر سؤال برده است.

طبق گزارش Epoch، مدل o3 فقط حدود ۱۰ درصد از سؤالات FrontierMath را با موفقیت پاسخ داده که این عدد بسیار پایین‌تر از ادعای اولیه‌ی OpenAI است.

همین اختلاف باعث شد بحث‌هایی درباره‌ی شفافیت و نحوه‌ی بنچمارک‌گرفتن OpenAI شکل بگیرد، به‌ویژه اینکه نسخه‌ی تست‌شده‌ی این شرکت احتمالاً به منابع پردازشی بیشتری دسترسی داشته است.

Epoch AI

بنیاد ARC Prize اعلام کرد که نسخه‌ی عمومی مدل o3 با نسخه‌ی مورد استفاده در بنچمارک‌های اولیه تفاوت دارد و برای کاربردهای روزمره مانند چت بهینه‌سازی شده است. به عبارتی، نسخه‌ی نهایی عملکرد بهتری در دنیای واقعی دارد، اما در تست‌های سنگین امتیاز کمتری کسب می‌کند.

شرکت OpenAI نیز اذعان داشت که نسخه‌ی نهایی o3 به‌منظور افزایش سرعت پاسخ‌دهی و کاهش هزینه بهینه شده است و امکان دارد با نسخه‌ی نمایشی اولیه در نتایج بنچمارک تفاوت‌هایی داشته باشد. این شرکت همچنین وعده داد در آینده‌ی نزدیک مدل قدرتمندتری تحت عنوان o3-pro منتشر خواهد شد.

ماجرای نتایج عملکرد مدل o3 بار دیگر نشان می‌دهد که بنچمارک‌های مدل‌های هوش مصنوعی همیشه قابل اتکا نیستند؛ به‌ویژه زمانی‌ که از سوی شرکت‌های سازنده‌ی مدل‌ها منتشر شوند. در شرایط رقابتی فعلی بازار هوش مصنوعی، شرکت‌ها گاهی برای جلب‌ توجه، اطلاعات خود را به‌صورت گزینشی منتشر می‌کنند.

پربیننده ترین

آخرین اخبار

سایر اخبار مرتبط

برق در حضور وزیر نیرو رفت!

صادق: آزادراه تهران ـ شمال مشکل منابع مالی دارد

وزیر کار برای توضیحات درباره حذف یارانه‌ها به مجلس می‌رود

پیشنهاد افزایش تعرفه های برق از ابتدای خرداد

طلای جهانی پرواز کرد، اما دلار جا ماند!

نظرات

ثبت نظر

دیدگاه های ارسال شده توسط شما، پس از تایید توسط خبرگزاری آینا در وب سایت منتشر خواهد شد

16598235

مهمترین اخبار

برق در حضور وزیر نیرو رفت!

دوشنبه 02 اردیبهشت 1404 - 11:49:34

صادق: آزادراه تهران ـ شمال مشکل منابع مالی دارد

دوشنبه 02 اردیبهشت 1404 - 11:29:11

وزیر کار برای توضیحات درباره حذف یارانه‌ها به مجلس می‌رود

دوشنبه 02 اردیبهشت 1404 - 11:16:12

پیشنهاد افزایش تعرفه های برق از ابتدای خرداد

دوشنبه 02 اردیبهشت 1404 - 10:04:28

طلای جهانی پرواز کرد، اما دلار جا ماند!

دوشنبه 02 اردیبهشت 1404 - 09:38:35