چهارشنبه 07 اسفند 1404 - 03:18
انویدیا منتشر کرد: نسخهای از مدل لاما 3.1 که کوچکتر و قویتر از DeepSeek R1 است
دیجیاتو/ این مدل جدید باوجود اندازه کوچکتر عملکردی بهتر از DeepSeek R1 دارد.
متا همچنان درگیر پاسخ به پرسشها و انتقادات درباره خانواده مدلهای جدید Llama 4 است اما شرکت انویدیا با معرفی مدل زبان بزرگ (LLM) متنباز و قدرتمند، توجهها را به خود جلب کرده است. این مدل که Llama-3.1 Nemotron Ultra نام دارد، بر پایه نسخه قبلی مدلهای Llama-3.1-405B-Instruct متا توسعه یافته و به گفته انویدیا، عملکردی نزدیک به برترین مدلهای موجود دارد.
مدل Llama-3.1-Nemotron-Ultra-253B-v1 با 253 میلیارد پارامتر برای وظایفی مانند استدلال پیشرفته، پیروی از دستورات و ایفای نقش دستیار هوش مصنوعی طراحی شده است.
این مدل نخستین بار مارس در کنفرانس سالانه GTC انویدیا معرفی شده بود و اکنون کامل و متنباز در پلتفرم Hugging Face در دسترس قرار گرفته است. کد مدل، وزنها و دادههای پس از آموزش آن نیز عمومی منتشر شدهاند.

مدل جدید انویدیا با استفاده از فرایند جستجوی معماری عصبی (NAS) توسعه یافته که در آن نوآوریهایی مانند حذف لایههای توجه، شبکههای Fused feedforward و فشردهسازی متغیر در ساختار مدل اعمال شدهاند. این معماری به گونهای طراحی شده که مدل با کاهش مصرف حافظه و منابع محاسباتی، همچنان کیفیت خروجی بالایی ارائه دهد و بتوان آن را فقط با 8 کارت گرافیک H100 اجرا کرد.
علاوهبر H100، این مدل با معماریهای پیشرفتهتر انویدیا مانند B100 و Hopper نیز سازگار بوده و در حالتهای دقت BF16 و FP8 عملکرد مطلوبی دارد.
انویدیا برای ارتقای تواناییهای مدل از فرایند پسآموزش چندمرحلهای بهره برده که شامل آموزش نظارتشده در حوزههایی مانند ریاضی، تولید کد، چت و استفاده از ابزارها بوده است. همچنین برای بهبود عملکرد در دنبالکردن دستورات و توانایی استدلال، از الگوریتم GRPO (بهینهسازی نسبی سیاست گروهی) استفاده شده است.
عملکرد مدل جدید انویدیا در برابر رقبا

مدل جدید انویدیا در آزمونهای معتبر مختلف عملکرد خیرهکنندهای داسته است. برای مثال، در آزمون MATH500، عملکرد مدل از 80.40 درصد در حالت عادی به 97 درصد در حالت استدلال افزایش یافته است. همچنین در آزمون AIME25، امتیاز آن از 16.67 درصد به 72.50 درصد و در LiveCodeBench از 29.03 درصد به 66.31 درصد رسیده است.
این مدل در پاسخ به پرسشهای عمومی (GPQA) در حالت استدلال فعال به امتیاز 76.01 درصد دست یافته که از DeepSeek R1 (با امتیاز 71.5 درصد) پیشی گرفته است. همچنین در آزمون IFEval برای پیروی از دستورات، امتیاز 89.45 درصد در برابر 83.3 درصد رقیب ثبت شده و در LiveCodeBench نیز اندکی بهتر عمل کرده است.
البته باید توجه کرد که مدل DeepSeek R1 در برخی آزمونهای ریاضی سنگین همچنان بهتر عمل میکند، ازجمله در AIME25 با امتیاز 79.8 درصد برابر 72.50 درصد مدل انویدیا.
این مدل از زبانهای متعددی ازجمله انگلیسی، آلمانی، فرانسوی، ایتالیایی، پرتغالی، هندی، اسپانیایی و تایلندی پشتیبانی میکند و برای کاربردهایی مانند چتبات، ساخت عاملهای هوش مصنوعی، تولید کد و تولید با روش بازیابی-افزوده (RAG) قابلاستفاده است.
پربیننده ترین
-
عکس مسی درآمد؛ آخرین توپ طلا با آرایشگر ویژه!
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
چراغ قوه همه کاره ( پاور بانک، شیشه شکن و ... )
-
هشدار آبفای کشور به مردم؛ هیچ ماموری فعلا برای قرائت کنتور آب مراجعه نمیکند
-
آخرین وضعیت راهها در چهارمین روز از سال جدید؛ محور چالوس از شنبه دوباره بسته میشود
-
جارو شارژی !! دیگه نگران نظافت ماشین نباشید
-
زنده؛ بیرانوند در یک قدمی استقلال
-
"دنا پلاس اتومات" بخریم یا "تارا اتومات؟"/ مقایسه اختصاصی "آخرینخودرو" از دو خودروی پرطرفدار
-
فشار آبرو چند برابر کن ....
-
فرمانده کل قوا: ملت ایران در مقابل جنگ تحمیلی محکم میایستد همانگونه که در مقابل صلح تحمیلی نیز محکم خواهد ایستاد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (16)
-
5 نشانه ضعیف شدن ریه ها و بهترین روش تقویت آن چیست؟
-
لندکروزر یا ۲۰۶؟ / مقایسه جالب "آخرینخودرو" به بهانه سخنان جنجالی میرسلیم
-
پایان زودهنگام گنبد آهنین؟ اسرائیل مجبور به جیرهبندی موشکها شد
-
سپ، برترین شرکت در خاورمیانه شد
-
گردونه را بچرخانید، بیتکوین دریافت کنید
-
واکنش عراقچی به تجاوز امروز آمریکا به تأسیسات هستهای فردو، نطنز و اصفهان
آخرین اخبار
-
مکلارن تسلیم شد، ابرشاسیبلند هیبرید برای رقابت با فراری ساخته میشود
-
حریق خودروی پراید در الهیه جنوبی بندرعباس
-
10 رینگ معروف در صنعت خودرو؛ کدام یک انتخاب شماست؟
-
جریمه قاچاقچی حوله تنظیف در اندیمشک
-
معاون رئیسجمهور: بهرهبرداری ناپایدار تهدیدی برای محیطزیست چهارمحال وبختیاری است
-
فراری پوروسانگوئه G ادیشن کیوانی، دایناسور زرد ۱.۵ میلیون دلاری!
-
دیدار رئیس پارلمان عراق با کاردار آمریکا بر سر سرنوشت پایگاه عینالاسد
-
شوهرم در رسیدگی به بچهها ابدا کمک نمیکند
-
رونمایی از لوگو هیئت فوتبال استان تهران با حضور مهدی تاج
-
استانداری مازندران به پنل خورشیدی مجهز شد
-
رئیس کل گمرک: طلای وارداتی بابک زنجانی قاچاق نبوده است
-
تمدید کنسرت «ایرانم» علیرضا قربانی
-
بهروز سلطانی: وقتی از برخی ایجنت ها بازیکنی جذب پرسپولیس نمی شود
-
بهروز سلطانی: وحید هاشمیان مدیریتی در سطح علی پروین دارد، اگر به حاشیه نرود صد درصد موفق می شود
-
حضور مهدی تاج در مجمع سالیانه هیئت فوتبال تهران
سایر اخبار مرتبط
نظرات
ثبت نظر
مهمترین اخبار
رئیس کل گمرک: طلای وارداتی بابک زنجانی قاچاق نبوده است
سهشنبه 05 شهریور 1404 - 12:06:40
۸۶ درصد از مطالبات گندمکاران تسویه شد
سهشنبه 05 شهریور 1404 - 12:00:54
ورود گروه صنعتی زر به باشگاه کلان پروژههای انرژی خورشیدی
سهشنبه 05 شهریور 1404 - 11:59:40
افزایش مجدد قیمتها در بازار طلا و سکه؛ دلار به کانال 96 هزار تومان رسید
سهشنبه 05 شهریور 1404 - 11:38:45
واردات هفت کشتی بنزین در جنگ ۱۲ روزه به کشور
سهشنبه 05 شهریور 1404 - 11:27:00