پنجشنبه 08 اسفند 1404 - 04:24
OpenAI مدلهای گفتاری و نوشتاری جدیدی برای ایجنتهای هوش مصنوعی معرفی کرد
دیجیاتو/ البته OpenAI در حال حاضر قصد ندارد این مدلهای جدید را به صورت عمومی منتشر کند.
OpenAI از ارتقاء مدلهای هوش مصنوعی خود در زمینه تبدیل گفتار به متن و متن به گفتار خبر داد. این مدلهای جدید که به API این شرکت اضافه شدهاند، نسبت به نسخههای قبلی پیشرفتهای قابلتوجهی داشتهاند و قابلیتهای بیشتری را در اختیار توسعهدهندگان قرار میدهند.
به گفته OpenAI، این مدلهای جدید بخشی از چشمانداز بزرگتر این شرکت برای ساخت سیستمهای خودکار یا «عاملهای هوشمند» هستند که میتوانند بهطور مستقل وظایف مختلفی را برای کاربران انجام دهند. «اولیویه گودمن»، مدیر محصول اوپنایآی، در این باره به TechCrunch توضیح داده که این ایجنتها میتوانند بهعنوان چتباتهایی عمل کنند که با مشتریان یک کسبوکار تعامل میکنند. او پیشبینی کرد که در ماههای آینده شاهد ظهور تعداد بیشتری از این عاملها خواهیم بود.
مدل تبدیل متن به گفتار OpenAI
مدل جدید تبدیل متن به گفتار OpenAI با نام gpt-4o-mini-tts، نه تنها گفتاری طبیعیتر و با جزئیات بیشتر تولید میکند، بلکه قابلیت تنظیم دقیقتری نیز دارد. توسعهدهندگان میتوانند با استفاده از دستورات زبان طبیعی، نحوه بیان متن را کنترل کنند.
بهعنوان مثال، میتوان از این مدل خواست که مانند یک «دانشمند دیوانه» یا با صدایی آرام و شبیه به یک معلم صحبت کند. یک نمونه از صداهای تولید شده توسط این مدل را در ادامه میتوانید بشنوید:
«جف هریس»، یکی از اعضای تیم محصول OpenAI، تأکید کرده که هدف این است که توسعهدهندگان بتوانند هم «تجربه صوتی» و هم «زمینه» را به دلخواه خود تنظیم کنند. او میگوید:
«در موقعیتهای مختلف، شما نمیخواهید که صدایی یکنواخت و بدون احساس شنیده شود. مثلاً اگر در یک تجربه پشتیبانی مشتری هستید و میخواهید صدای ربات عذرخواهی کند، میتوانید به مدل دستور دهید که این احساس را در صدا لحاظ کند.»
مدلهای تبدیل گفتار به متن
OpenAI همچنین دو مدل جدید تبدیل گفتار به متن با نامهای gpt-4o-transcribe و gpt-4o-mini-transcribe را معرفی کرده است که جایگزین مدل قدیمی Whisper میشوند. این مدلهای جدید که روی مجموعه دادههای صوتی متنوع و باکیفیت آموزش دیدهاند، میتوانند صداهای با لهجههای مختلف و حتی در محیطهای شلوغ را با دقت بیشتری تشخیص دهند.
هریس همچنین اشاره کرده که این مدلها کمتر از Whisper دچار خطاهای «توهم» میشوند. مدل Whisper گاهی اوقات کلمات یا حتی جملات کاملی را که وجود نداشتند، به متن اضافه میکرد که این موضوع میتوانست مشکلاتی را ایجاد کند. او میگوید:
«این مدلها در مقایسه با Whisper بهبود چشمگیری داشتهاند. دقت مدلها برای ایجاد یک تجربه صوتی قابل اعتماد کاملاً ضروری است و دقت در اینجا به این معناست که مدلها کلمات را به درستی تشخیص میدهند و جزئیاتی که نشنیدهاند را به متن اضافه نمیکنند.»

بااینحال، دقت این مدلها ممکن است بسته به زبانی که تبدیل میشود، متفاوت باشد.
برخلاف رویه گذشته، OpenAI قصد ندارد این مدلهای جدید تبدیل گفتار به متن خود را بهصورت عمومی منتشر کند. این شرکت پیشتر نسخههای جدید Whisper را تحت مجوز MIT برای استفاده تجاری منتشر میکرد. هریس توضیح داده که مدلهای جدید بسیار بزرگتر از Whisper هستند و بنابراین برای انتشار عمومی مناسب نیستند. او میگوید:
«این مدلها از نوعی نیستند که بتوانید به راحتی روی لپتاپ خود اجرا کنید. ما میخواهیم اگر چیزی را بهصورت متنباز منتشر میکنیم، با دقت این کار را انجام دهیم و مدلی را ارائه کنیم که واقعاً برای آن نیاز خاص مناسب باشد.»
پربیننده ترین
-
عکس مسی درآمد؛ آخرین توپ طلا با آرایشگر ویژه!
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
10 جایزه 5 میلیون تومانی برای کاربران آخرین خبر (مهلت شرکت در مسابقه تا 9 آذر تمدید شد.)
-
چراغ قوه همه کاره ( پاور بانک، شیشه شکن و ... )
-
هشدار آبفای کشور به مردم؛ هیچ ماموری فعلا برای قرائت کنتور آب مراجعه نمیکند
-
آخرین وضعیت راهها در چهارمین روز از سال جدید؛ محور چالوس از شنبه دوباره بسته میشود
-
جارو شارژی !! دیگه نگران نظافت ماشین نباشید
-
زنده؛ بیرانوند در یک قدمی استقلال
-
"دنا پلاس اتومات" بخریم یا "تارا اتومات؟"/ مقایسه اختصاصی "آخرینخودرو" از دو خودروی پرطرفدار
-
فشار آبرو چند برابر کن ....
-
فرمانده کل قوا: ملت ایران در مقابل جنگ تحمیلی محکم میایستد همانگونه که در مقابل صلح تحمیلی نیز محکم خواهد ایستاد
-
چالش/ بازیکن داخل تصویر رو حدس بزن (16)
-
5 نشانه ضعیف شدن ریه ها و بهترین روش تقویت آن چیست؟
-
لندکروزر یا ۲۰۶؟ / مقایسه جالب "آخرینخودرو" به بهانه سخنان جنجالی میرسلیم
-
پایان زودهنگام گنبد آهنین؟ اسرائیل مجبور به جیرهبندی موشکها شد
-
سپ، برترین شرکت در خاورمیانه شد
-
گردونه را بچرخانید، بیتکوین دریافت کنید
-
واکنش عراقچی به تجاوز امروز آمریکا به تأسیسات هستهای فردو، نطنز و اصفهان
آخرین اخبار
-
دهنمکی: ماجرای مهسا امینی را پیشبینی کرده بودم!
-
ویدئویی از بازیگری کارگردان «سووشون» در یک مستند
-
وقتی خورشید زبانه میکشد
-
واکنش رئیس رسانه ملی به انتقادات از اظهارات برخی کارشناسان صداوسیما
-
پاسخ کوبنده دختر محمود نقاشِ «پایتخت» به بیحرمتی به شاهنامه
-
کپسول «دراگون» به ایستگاه فضایی بینالمللی متصل شد
-
علت ماندگاری نام استاد فرشچیان از زبان اسماعیل آذر
-
سیاوش خیرابی خطاب به شاهرخ استخری: نمیگم اونموقعها با هم کجاها میرفتیم
-
یه سوت بزنی اومدم!
-
پل معلق در دل دره «خیاو چایی» اردبیل
-
معاون وزیر کشور: پیشنویس لایحه افزایش تعداد نمایندگان مجلس تهیه شد
-
دورتموند با کواچ تمدید کرد
-
مرسدسبنز از خیر سرمایهگذاری در نیسان گذشت
-
حدادی: اوریه احتمالا از بازی بعدی با ماست
-
شمارش معکوس افزایش ظرفیت تأمین آب تهران
سایر اخبار مرتبط
نظرات
ثبت نظر
مهمترین اخبار
شمارش معکوس افزایش ظرفیت تأمین آب تهران
سهشنبه 05 شهریور 1404 - 14:50:29
رکوردشکنی همراه مکانیک در 1403 به روایت آمار
سهشنبه 05 شهریور 1404 - 14:36:18
کدام شرکتها سود سهام عدالت را واریز نکردند؟
سهشنبه 05 شهریور 1404 - 14:24:20
ادامه ریزش قیمت ارزهای معتبر در مرکز مبادله ایران
سهشنبه 05 شهریور 1404 - 14:22:22
جزئیات وامهای قرضالحسنه اعلام شد
سهشنبه 05 شهریور 1404 - 14:18:00