دوشنبه 12 فروردین 1404 - 12:16
OpenAI مدلهای گفتاری و نوشتاری جدیدی برای ایجنتهای هوش مصنوعی معرفی کرد

دیجیاتو/ البته OpenAI در حال حاضر قصد ندارد این مدلهای جدید را به صورت عمومی منتشر کند.
OpenAI از ارتقاء مدلهای هوش مصنوعی خود در زمینه تبدیل گفتار به متن و متن به گفتار خبر داد. این مدلهای جدید که به API این شرکت اضافه شدهاند، نسبت به نسخههای قبلی پیشرفتهای قابلتوجهی داشتهاند و قابلیتهای بیشتری را در اختیار توسعهدهندگان قرار میدهند.
به گفته OpenAI، این مدلهای جدید بخشی از چشمانداز بزرگتر این شرکت برای ساخت سیستمهای خودکار یا «عاملهای هوشمند» هستند که میتوانند بهطور مستقل وظایف مختلفی را برای کاربران انجام دهند. «اولیویه گودمن»، مدیر محصول اوپنایآی، در این باره به TechCrunch توضیح داده که این ایجنتها میتوانند بهعنوان چتباتهایی عمل کنند که با مشتریان یک کسبوکار تعامل میکنند. او پیشبینی کرد که در ماههای آینده شاهد ظهور تعداد بیشتری از این عاملها خواهیم بود.
مدل تبدیل متن به گفتار OpenAI
مدل جدید تبدیل متن به گفتار OpenAI با نام gpt-4o-mini-tts، نه تنها گفتاری طبیعیتر و با جزئیات بیشتر تولید میکند، بلکه قابلیت تنظیم دقیقتری نیز دارد. توسعهدهندگان میتوانند با استفاده از دستورات زبان طبیعی، نحوه بیان متن را کنترل کنند.
بهعنوان مثال، میتوان از این مدل خواست که مانند یک «دانشمند دیوانه» یا با صدایی آرام و شبیه به یک معلم صحبت کند. یک نمونه از صداهای تولید شده توسط این مدل را در ادامه میتوانید بشنوید:
«جف هریس»، یکی از اعضای تیم محصول OpenAI، تأکید کرده که هدف این است که توسعهدهندگان بتوانند هم «تجربه صوتی» و هم «زمینه» را به دلخواه خود تنظیم کنند. او میگوید:
«در موقعیتهای مختلف، شما نمیخواهید که صدایی یکنواخت و بدون احساس شنیده شود. مثلاً اگر در یک تجربه پشتیبانی مشتری هستید و میخواهید صدای ربات عذرخواهی کند، میتوانید به مدل دستور دهید که این احساس را در صدا لحاظ کند.»
مدلهای تبدیل گفتار به متن
OpenAI همچنین دو مدل جدید تبدیل گفتار به متن با نامهای gpt-4o-transcribe و gpt-4o-mini-transcribe را معرفی کرده است که جایگزین مدل قدیمی Whisper میشوند. این مدلهای جدید که روی مجموعه دادههای صوتی متنوع و باکیفیت آموزش دیدهاند، میتوانند صداهای با لهجههای مختلف و حتی در محیطهای شلوغ را با دقت بیشتری تشخیص دهند.
هریس همچنین اشاره کرده که این مدلها کمتر از Whisper دچار خطاهای «توهم» میشوند. مدل Whisper گاهی اوقات کلمات یا حتی جملات کاملی را که وجود نداشتند، به متن اضافه میکرد که این موضوع میتوانست مشکلاتی را ایجاد کند. او میگوید:
«این مدلها در مقایسه با Whisper بهبود چشمگیری داشتهاند. دقت مدلها برای ایجاد یک تجربه صوتی قابل اعتماد کاملاً ضروری است و دقت در اینجا به این معناست که مدلها کلمات را به درستی تشخیص میدهند و جزئیاتی که نشنیدهاند را به متن اضافه نمیکنند.»
بااینحال، دقت این مدلها ممکن است بسته به زبانی که تبدیل میشود، متفاوت باشد.
برخلاف رویه گذشته، OpenAI قصد ندارد این مدلهای جدید تبدیل گفتار به متن خود را بهصورت عمومی منتشر کند. این شرکت پیشتر نسخههای جدید Whisper را تحت مجوز MIT برای استفاده تجاری منتشر میکرد. هریس توضیح داده که مدلهای جدید بسیار بزرگتر از Whisper هستند و بنابراین برای انتشار عمومی مناسب نیستند. او میگوید:
«این مدلها از نوعی نیستند که بتوانید به راحتی روی لپتاپ خود اجرا کنید. ما میخواهیم اگر چیزی را بهصورت متنباز منتشر میکنیم، با دقت این کار را انجام دهیم و مدلی را ارائه کنیم که واقعاً برای آن نیاز خاص مناسب باشد.»
پربیننده ترین
-
عکس مسی درآمد؛ آخرین توپ طلا با آرایشگر ویژه!
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
آخرین وضعیت راهها در چهارمین روز از سال جدید؛ محور چالوس از شنبه دوباره بسته میشود
-
زنده؛ بیرانوند در یک قدمی استقلال
-
"دنا پلاس اتومات" بخریم یا "تارا اتومات؟"/ مقایسه اختصاصی "آخرینخودرو" از دو خودروی پرطرفدار
-
چالش/ بازیکن داخل تصویر رو حدس بزن (16)
-
5 نشانه ضعیف شدن ریه ها و بهترین روش تقویت آن چیست؟
-
لندکروزر یا ۲۰۶؟ / مقایسه جالب "آخرینخودرو" به بهانه سخنان جنجالی میرسلیم
-
سپ، برترین شرکت در خاورمیانه شد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (28)
-
ویدیو تست و بررسی فیدلیتی پرایم جدید در آخرین خودرو
-
چالش/ بازیکن داخل تصویر رو حدس بزن (14)
-
لحظه به لحظه با جدال پرسپولیس مقابل النصر
-
چالش/ بازیکن داخل تصویر رو حدس بزن (22)
-
یحیی مچ ساپینتو را خواباند / برد ارزشمند پرسپولیس در صدمین شهرآورد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (19)
-
چالش/بازیکن داخل تصویر رو حدس بزن (11)
آخرین اخبار
-
ماجرای جالب مرد کوتاه قامت مشهدی که ۱۷ بار به خواستگاری رفت
-
اولین عامل مرگ در گروه سنی ۱۸ تا ۲۹ سال در ایران اعلام شد
-
اثرات مثبت خاک بازی
-
تردد در تونل جاده اردبیل - سرچم برقرار شد
-
عکس/ نمای هوایی از اقامه نماز عید سعید فطر در در مصلای تهران
-
طراحی مکبوک پرو در سال ۲۰۲۶ با سه تغییر مهم بهطور کامل بهروز میشود
-
ایموبیله گزینه جانشینی طارمی در اینتر
-
برکناری پاشازاده از هدایت بعثت کرمانشاه پس از کمتر از ۴۵ روز
-
اپل به زلزلهزدگان میانمار و تایلند کمک مالی میکند
-
اجرای قطعه موسیقی توسط محمد معتمدی در دستگاه ماهور
-
پیام بارسا به رقبا: ما غیرقابل توقف هستیم
-
طعنه راموس به هواداران اتلتیکو در روز تولدش!
-
شروع کار جوانان والیبال ایران از ۱۶ فروردین
-
پیام قالیباف در پی قهرمانی تیمهای کشتی فرنگی و آزاد و فوتبال ساحلی
-
توسعه بازی The Elder Scrolls 6 هنوز وارد مرحله آلفا نشده است
سایر اخبار مرتبط
نظرات
ثبت نظر
مهمترین اخبار

اطلاعیه سازمان هواپیمایی کشوری خطاب به مسافرین نوروزی
دوشنبه 12 فروردین 1404 - 11:55:43

مصرف برق پرمصرفها محدود میشود
دوشنبه 12 فروردین 1404 - 11:22:59

علت صفهای طولانی خرید نان چیست؟
دوشنبه 12 فروردین 1404 - 11:00:38

طلای جهانی از ۳۱۰۰ دلار عبور کرد
دوشنبه 12 فروردین 1404 - 10:37:00

حساب این گروه از یارانهبگیران میلیونی شارژ شد
دوشنبه 12 فروردین 1404 - 10:19:00