پنجشنبه 08 اسفند 1404 - 16:02
اوپن ای آی دست هوش مصنوعی ایلان ماسک را رو کرد
مهر/هفته گذشته یکی از کارمندان اوپن ای آی شرکت هوش مصنوعیxAI متعلق به ایلان ماسک را به انتشار نتایج گمراه کننده از سنجش گورک ۳ با یکی از معیارهای بررسی قدرت مدل متهم کرد.
به نقل از تک کرانچ، ایگور بابوشکین یکی از بنیانگذاران xAI تاکید دارد ادعاهای این شرکت درباره قدرت گورک۳ صحت دارند.
این شرکت فناوری در یک پست وبلاگی نموداری را منتشر کرد که عملکرد گورک ۳ را در AIME ۲۰۲۵ (مجموعه ای از سوالات چالش برانگیز ریاضی از یک آزمون ریاضی) نشان می داد. البته برخی از کارشناسان اعتبار AIME را به عنوان یک معیار هوش مصنوعی زیر سوال برده اند. با این وجود AIME ۲۰۲۵ و نسخه های قدیمی تر این تست به طور معمول برای بررسی قابلیت های ریاضی مدل های هوش مصنوعی به کار می روند.
نمودار استارت آپ هوش مصنوعی ایلان ماسک نشان می داد عملکرد نسخه های «گورک ۳ »، «گورک ۳ استدلالی بتا» و «گورک ۳ استدلالی مینی» در معیار AIME ۲۰۲۵ بهتر از مدل «o۳مینی» شرکت اوپن ای آی است.
اما کارمندان اوپن ای آی در پلتفرم ایکس به این نکته اشاره کردند که در نمودارxAI امتیاز «o۳مینی» در شاخص cons@۶۴ مربوط به معیار AIME ۲۰۲۵ شامل نشده است. cons@۶۴ به مدلهای هوش مصنوعی اجازه میدهد تا ۶۴ بار به سوالات پاسخ دهند و نتایج پرتکرار را به عنوان پاسخ نهایی در نظر میگیرد که حذف آن میتواند نتایج را گمراهکننده جلوه دهد.
بابوشکین در پلتفرم ایکس مدعی شد اوپن ای آی قبلا جدول های معیار گمراه کننده مشابه را منتشر کرده است، هرچند این جدول ها مقایسه بین عملکرد مدل های هوش مصنوعی خود بوده است.
در این میان ناتان لمبرت محقق هوش مصنوعی در پستی این نکته را ذکر کرد که نتیجه مهمترین معیار مدل های هوش مصنوعی، یعنی هزینه رایانشی و مالی هر مدل برای دستیابی به بهترین امتیاز همچنان نامشخص است. این امر نشان می دهد بیشتر معیارهای هوش مصنوعی فقط اندکی از قدرت ها و محدودیت های مدل ها را نمایش می دهند.
پربیننده ترین
-
عکس مسی درآمد؛ آخرین توپ طلا با آرایشگر ویژه!
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
چراغ قوه همه کاره ( پاور بانک، شیشه شکن و ... )
-
هشدار آبفای کشور به مردم؛ هیچ ماموری فعلا برای قرائت کنتور آب مراجعه نمیکند
-
آخرین وضعیت راهها در چهارمین روز از سال جدید؛ محور چالوس از شنبه دوباره بسته میشود
-
جارو شارژی !! دیگه نگران نظافت ماشین نباشید
-
زنده؛ بیرانوند در یک قدمی استقلال
-
"دنا پلاس اتومات" بخریم یا "تارا اتومات؟"/ مقایسه اختصاصی "آخرینخودرو" از دو خودروی پرطرفدار
-
فشار آبرو چند برابر کن ....
-
فرمانده کل قوا: ملت ایران در مقابل جنگ تحمیلی محکم میایستد همانگونه که در مقابل صلح تحمیلی نیز محکم خواهد ایستاد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (16)
-
5 نشانه ضعیف شدن ریه ها و بهترین روش تقویت آن چیست؟
-
لندکروزر یا ۲۰۶؟ / مقایسه جالب "آخرینخودرو" به بهانه سخنان جنجالی میرسلیم
-
پایان زودهنگام گنبد آهنین؟ اسرائیل مجبور به جیرهبندی موشکها شد
-
سپ، برترین شرکت در خاورمیانه شد
-
گردونه را بچرخانید، بیتکوین دریافت کنید
-
واکنش عراقچی به تجاوز امروز آمریکا به تأسیسات هستهای فردو، نطنز و اصفهان
آخرین اخبار
-
حمله تند طراح سابق فراری و ب ام و به جگوار تایپ ۰۰ ؛ محصولی فاقد انسجام و ناقص!
-
سرمقاله سازندگی/ نژادپرستی تا ۲۰۲۵
-
آغاز طوفان لالیگایی علیه اسرائیل
-
سیما تیرانداز: بازیگر خوب، بازی نمیکنه!
-
سرمقاله دنیای اقتصاد/ استاندارد دوگانه در آزادسازی
-
حسرت بزرگ جوان سپاهان در نقش جهان!
-
جاری شدن آبشار فصلی در جاده لار به بستک
-
اولین گام آقای گل پرسپولیس برای ویزای آمریکا
-
هفته دوم لیگ برتر فوتبال ایران؛ فجر سپاسی - گل گهر
-
قیمت خودرو امروز 5 شهریور 1404
-
تعویض پرچم گنبد مطهر رضوی پس از ۶۳ روز عزاداری
-
رسانه آمریکایی: یمن شدیدترین درگیری دریایی را برای آمریکا رقم زد
-
دستگیری عامل برداشت وجه از حساب افراد کهنسال
-
تست بازیگری سیما تیرانداز از جناب خان
-
تقویم تاریخ/ روز داروسازی
سایر اخبار مرتبط
نظرات
ثبت نظر
مهمترین اخبار
نامه قالیباف به رئیس جمهور؛ مصوبه اصلاح حقوق کارکنان دولت غیرقانونی است
چهارشنبه 06 شهریور 1404 - 08:30:33
5 خدمت بانکی مشروط به ثبت نشانی در سامانه املاک شد
چهارشنبه 06 شهریور 1404 - 08:27:00
رئیس سازمان برنامه: دولت در حال تهیه زیرساخت برای انتقال مردم به منطقه مکران است
چهارشنبه 06 شهریور 1404 - 08:04:21
خبر خوش مالیاتی به مودیان مالیاتی
چهارشنبه 06 شهریور 1404 - 07:52:00
جنجال طلایی بابک
چهارشنبه 06 شهریور 1404 - 07:44:58