جمعه 09 اسفند 1404 - 15:19
OpenAI دست هوش مصنوعی ایلان ماسک را رو کرد
مهر/ هفته گذشته یکی از کارمندان اوپن ای آی شرکت هوش مصنوعی xAI متعلق به ایلان ماسک را به انتشار نتایج گمراه کننده از سنجش گورک ۳ با یکی از معیارهای بررسی قدرت مدل متهم کرد.
به گزارش تک کرانچ، ایگور بابوشکین یکی از بنیانگذاران xAI تاکید دارد ادعاهای این شرکت درباره قدرت گورک۳ صحت دارند.
این شرکت فناوری در یک پست وبلاگی نموداری را منتشر کرد که عملکرد گورک ۳ را در AIME ۲۰۲۵ (مجموعه ای از سوالات چالش برانگیز ریاضی از یک آزمون ریاضی) نشان می داد. البته برخی از کارشناسان اعتبار AIME را به عنوان یک معیار هوش مصنوعی زیر سوال برده اند. با این وجود AIME ۲۰۲۵ و نسخه های قدیمی تر این تست به طور معمول برای بررسی قابلیت های ریاضی مدل های هوش مصنوعی به کار می روند.
نمودار استارت آپ هوش مصنوعی ایلان ماسک نشان می داد عملکرد نسخه های «گورک ۳ »، «گورک ۳ استدلالی بتا» و «گورک ۳ استدلالی مینی» در معیار AIME ۲۰۲۵ بهتر از مدل «o۳مینی» شرکت اوپن ای آی است.
اما کارمندان اوپن ای آی در پلتفرم ایکس به این نکته اشاره کردند که در نمودارxAI امتیاز «o۳مینی» در شاخص cons@۶۴ مربوط به معیار AIME ۲۰۲۵ شامل نشده است. cons@۶۴ به مدلهای هوش مصنوعی اجازه میدهد تا ۶۴ بار به سوالات پاسخ دهند و نتایج پرتکرار را به عنوان پاسخ نهایی در نظر میگیرد که حذف آن میتواند نتایج را گمراهکننده جلوه دهد.
بابوشکین در پلتفرم ایکس مدعی شد اوپن ای آی قبلا جدول های معیار گمراه کننده مشابه را منتشر کرده است، هرچند این جدول ها مقایسه بین عملکرد مدل های هوش مصنوعی خود بوده است.
در این میان ناتان لمبرت محقق هوش مصنوعی در پستی این نکته را ذکر کرد که نتیجه مهمترین معیار مدل های هوش مصنوعی، یعنی هزینه رایانشی و مالی هر مدل برای دستیابی به بهترین امتیاز همچنان نامشخص است. این امر نشان می دهد بیشتر معیارهای هوش مصنوعی فقط اندکی از قدرت ها و محدودیت های مدل ها را نمایش می دهند.
پربیننده ترین
-
عکس مسی درآمد؛ آخرین توپ طلا با آرایشگر ویژه!
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
چراغ قوه همه کاره ( پاور بانک، شیشه شکن و ... )
-
هشدار آبفای کشور به مردم؛ هیچ ماموری فعلا برای قرائت کنتور آب مراجعه نمیکند
-
آخرین وضعیت راهها در چهارمین روز از سال جدید؛ محور چالوس از شنبه دوباره بسته میشود
-
جارو شارژی !! دیگه نگران نظافت ماشین نباشید
-
زنده؛ بیرانوند در یک قدمی استقلال
-
"دنا پلاس اتومات" بخریم یا "تارا اتومات؟"/ مقایسه اختصاصی "آخرینخودرو" از دو خودروی پرطرفدار
-
فشار آبرو چند برابر کن ....
-
فرمانده کل قوا: ملت ایران در مقابل جنگ تحمیلی محکم میایستد همانگونه که در مقابل صلح تحمیلی نیز محکم خواهد ایستاد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (16)
-
5 نشانه ضعیف شدن ریه ها و بهترین روش تقویت آن چیست؟
-
لندکروزر یا ۲۰۶؟ / مقایسه جالب "آخرینخودرو" به بهانه سخنان جنجالی میرسلیم
-
پایان زودهنگام گنبد آهنین؟ اسرائیل مجبور به جیرهبندی موشکها شد
-
سپ، برترین شرکت در خاورمیانه شد
-
گردونه را بچرخانید، بیتکوین دریافت کنید
-
واکنش عراقچی به تجاوز امروز آمریکا به تأسیسات هستهای فردو، نطنز و اصفهان
آخرین اخبار
-
تیراندازی در مینیاپولیس آمریکا با ۲۳ کشته و زخمی
-
ایران نیاز به مسوولان شجاع برای تغییر استراتژیها دارد
-
نتانیاهو: با اداره غزه توسط آمریکا موافقم
-
نهنگ سواری بچه های آبادان در خلیج فارس!
-
شتر رفت دنیای زیر آب را دید!
-
گفتوگوی وزیر خارجه آمریکا با وزرای خارجه انگلیس، فرانسه و آلمان درخصوص ایران
-
سر بریده فرستاده؛ فرمان جدیدی صادر خواهد شد!
-
دیدار مدیر امور بینالملل جماعت اسلامی پاکستان با سید حسن خمینی
-
فیل خشمگین یک وانت را سرنگون کرد
-
شوک به تیم پرهوادار لیگ برتری؛ آقای سرپرست باسابقه محروم شد!
-
بازگشت قطعنامهها یا تمدید قطعنامه؟
-
کشف ارزش واقعی یک جواهر قدیمی خانوادگی
-
تلاش دولت ترامپ برای کنترل بزرگترین ایستگاه ریلی واشنگتن
-
پژمان جمشیدی خطاب به محسن تنابنده: بابا یه پایتخت ساختی دیگه! بدبختمون کردی!
-
تقدیر مدیرعامل پیشین استقلال از ساپینتو
سایر اخبار مرتبط
نظرات
ثبت نظر
مهمترین اخبار
پیامکهای سهمیهبندی آب جعلی است
چهارشنبه 06 شهریور 1404 - 18:55:08
صلیب سرخ برای آزادگان کارت بانکی ارسال کرد؟
چهارشنبه 06 شهریور 1404 - 18:49:11
انتقاد یک کارشناس اقتصادی از دولت بهخاطر بالارفتن قیمت ارز
چهارشنبه 06 شهریور 1404 - 18:38:13
دلار 100 هزارتومان را «تاچ» کرد!
چهارشنبه 06 شهریور 1404 - 18:11:00
یارانه دهک دهم جامعه حذف شد
چهارشنبه 06 شهریور 1404 - 17:53:05