شنبه 31 شهریور 1403 - 21:25
یک هوش مصنوعی جدید میتواند متون ۱۰ هزار کلمهای تولید کند
ایسنا/ یکی از مشکلات عمدهای که مدلهای زبان بزرگ با آن مواجه هستند، طول خروجی متنی است که تولید میکنند. مدلهای زبانی کنونی ادعا میکنند که ورودیها را تا ۱۰۰ هزار کلمه پردازش میکنند اما برای تولید خروجیهایی با طول متوسط ۲۰۰۰ کلمه با مشکلاتی مواجه هستند. اما اکنون به نظر میرسد یک مدل هوش مصنوعی جدید این توانایی را ارتقا داده است.
برای حل این مشکل، گروهی از محققان هوش مصنوعی در دانشگاه چینهوا(Tsinghua)، یک مدل زبانی بزرگ(LLM) به نام لانگ رایتر(LongWriter) توسعه دادهاند.
این هوش مصنوعی میتواند پاسخهای طولانی ایجاد کند
این گروه ادعا میکنند که مدل زبان بزرگ آنها میتواند خروجی متن تا ۱۰ هزار کلمه تولید کند.
به نقل از آیای، از آنجایی که مدلهای زبانی بزرگ جریانساز شدهاند، بسیاری متوجه شدهاند که آنها نمیتوانند پاسخهای بسیار طولانی مانند کتابهای کامل یا نسخههای خطی تولید کنند و حد فعلی تولید متن آنها به نظر میرسد تقریبا ۲۰۰۰ کلمه باشد.
محققان میگویند که احتمالا این به این دلیل است که همه آنها با استفاده از دادههای کوتاه آموزش دیدهاند. آنها در تلاش جدید خود دریافتند که اگر مدلهای زبانی بزرگ را کمی تغییر دهند و با استفاده از اسناد بسیار طولانیتر آموزش دهند، میتوان متون طولانیتری تولید کرد.
آزمایش نظریه
محققان برای آزمایش نظریه خود، ابتدا یک مدل زبانی بزرگ را با ۹ میلیارد پارامتر با استفاده از یک مجموعه داده معمولی، که شامل اسنادی بود که عمدتا کمتر از ۲۰۰۰ کلمه بودند، آموزش دادند.
همانطور که انتظار میرفت، هنگام پرس و جو، این هوش مصنوعی میتوانست متنهایی با حداکثر ۲۰۰۰ کلمه ایجاد کند.
سپس، محققان یک مدل زبانی بزرگ سنتی را با استفاده از یک کانال ارتباطی به نام AgentWrite اصلاح کردند تا دادههای آموزشی را به وظایف فرعی تجزیه کنند.
آنها سپس مجموعه دادهای را به نام LongWriter-۶k جمعآوری کردند که حاوی ۶۰۰۰ سند مکتوب با طول ۲۰۰۰ تا ۳۲ هزار کلمه بود. آنها سپس مدل زبانی بزرگ اصلاح شده را با استفاده از مجموعه داده جدید آموزش دادند و دریافتند که با انجام این کار، طول متنی که این هوش مصنوعی میتواند تولید کند به تقریبا ۱۰ هزار کلمه افزایش مییابد.
قابلیت استفاده در زمینههای مختلف
در بررسی مطالب طولانی جدید تولید شده توسط مدل زبانی بزرگ، محققان آنها را منسجم و قابل استفاده در زمینههای مختلف یافتند. آنها همچنین ویدیویی را منتشر کردند که نشان میدهد لانگ رایتر یک راهنمای گردشگری ۱۰ هزار کلمهای برای افرادی که به چین سفر میکنند تولید میکند.
محققان اذعان میکنند که اکنون که مشخص شده است که مدل زبانی بزرگ میتواند کل مقالات تحقیقاتی، کتابها، دستنوشتهها یا شاید حتی فیلمنامههای فیلم را تولید کند. با درک محدودیتها و بهکارگیری شیوههای استفاده مسئولانه، انسانها میتوانند از قدرت مدل زبانی بزرگ استفاده کنند و در عین حال خطرات بالقوه را کاهش دهند.
پربیننده ترین
-
عکس مسی درآمد؛ آخرین توپ طلا با آرایشگر ویژه!
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
آخرین وضعیت راهها در چهارمین روز از سال جدید؛ محور چالوس از شنبه دوباره بسته میشود
-
زنده؛ بیرانوند در یک قدمی استقلال
-
"دنا پلاس اتومات" بخریم یا "تارا اتومات؟"/ مقایسه اختصاصی "آخرینخودرو" از دو خودروی پرطرفدار
-
چالش/ بازیکن داخل تصویر رو حدس بزن (16)
-
5 نشانه ضعیف شدن ریه ها و بهترین روش تقویت آن چیست؟
-
لندکروزر یا ۲۰۶؟ / مقایسه جالب "آخرینخودرو" به بهانه سخنان جنجالی میرسلیم
-
سپ، برترین شرکت در خاورمیانه شد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (28)
-
ویدیو تست و بررسی فیدلیتی پرایم جدید در آخرین خودرو
-
چالش/ بازیکن داخل تصویر رو حدس بزن (14)
-
لحظه به لحظه با جدال پرسپولیس مقابل النصر
-
چالش/ بازیکن داخل تصویر رو حدس بزن (22)
-
یحیی مچ ساپینتو را خواباند / برد ارزشمند پرسپولیس در صدمین شهرآورد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (19)
-
چالش/بازیکن داخل تصویر رو حدس بزن (11)
آخرین اخبار
-
تصویری شگفت انگیز از Dione، قمرِ سیارهی زحل
-
عشق خیابانی زن شکستخورده را به دادگاه کشاند
-
هوش مصنوعی کوپایلوت را در اپلیکیشنهای مجموعه آفیس ببینید
-
دستیار هوش مصنوعی کوپایلت به اپلیکیشنهای مجموعه آفیس مجهز میآید
-
لحظه نجات یک دختر از زیر آوار خانه ویران شده در غزه
-
کالبدشکافی آیفون 16 پرو منتشر شد؛ تلاش اپل برای سادهکردن تعمیر دستگاه
-
عضو کمیسیون امنیت ملی: قدرتهایی مانند روسیه و ایران ساکت نخواهند نشست
-
مشاور مدیرعامل استقلال: اینکه میگویند من از سمیعی قابل صوتی دارم دروغ محض است
-
جوجه پنگوئن بزرگ ستاره شبکههای اجتماعی شد
-
حواشی ساخت هتل ۳۰ طبقه در ولنجک تهران
-
گوشی ۱۲۰ میلیونی گوگل مثل بیسکویت میشکند
-
ربات پلیس درحال گشتزنی در خیابانهای لسآنجلس
-
عکس/ عیادت «قالیباف» از دختربچهٔ یازدهساله
-
نحوه عصاره گیری گل محمدی هنگام گلاب گرفتن
-
بازتاب رژه نیروهای مسلح در رسانههای خارجی
سایر اخبار مرتبط
نظرات
ثبت نظر
مهمترین اخبار
حواشی ساخت هتل ۳۰ طبقه در ولنجک تهران
شنبه 31 شهریور 1403 - 21:08:24
برای خرید نوشت افزار کمتر از ۲ تا ۴ میلیون حساب نکنید!
شنبه 31 شهریور 1403 - 20:38:29
رکورد حراج شمش طلا در مرداد ماه شکسته شد
شنبه 31 شهریور 1403 - 19:55:23
تولید قراردادی راهکار خودکفایی در گوشت قرمز
شنبه 31 شهریور 1403 - 18:55:00
بدهی انگلیس به بالاترین میزان در 60 سال اخیر رسید
شنبه 31 شهریور 1403 - 18:24:10