رسانه خبری آینا - آن چه جی پی تی -۴ می‌تواند و نمی‌تواند انجام دهد

چهارشنبه 23 بهمن 1404 - 08:21

کد خبر 2311

جمعه 04 فروردین 1402 - 11:20:00

آن چه جی پی تی -۴ می‌تواند و نمی‌تواند انجام دهد

فرارو/متن پیش رو در فرارو منتشر شده و انتشار آن در آخرین خبر به معنای تاییدش نیست

بینگ جدید که نسخه‌ای از جی پی تی ۴ را اجرا می‌کند سهم خود را در نگارش متن‌های آزار دهنده و توهین آمیز نشان داده است: به کودکان توهین‌های قومیتی را آموزش می‌دهد، شعار‌های نازیستی را تبلیغ کرده و نظریه‌های علمی را ابداع می‌کند.

کم‌تر از چهار ماه پس از انتشار چت جی پی تی هوش مصنوعی تولید کننده متن که به نظر می‌رسد ما را به عصر فناوری علمی - تخیلی سوق داده است Open AI از محصول جدیدی به نام جی پی تی -۴ (GPT-۴) رونمایی کرده است.

به گزارش فرارو به نقل از آتلانتیک، بیش از یک سال از انتشار شایعات و هیاهو در مورد این برنامه می‌گذرد: کارشناسان گفته اند که این برنامه فوق العاده قدرتمند خواهد بود و قادر به نوشتن کتاب‌های ۶۰ هزار کلمه‌ای از طریق تک دستور و تولید ویدئو از متن خواهد بود. به نظر می‌رسد توانایی‌های جی پی تی -۴ علیرغم آن که چشمگیر است، اما بسیار کم‌تر از انتظار می‌باشد: عملکرد آن در تست‌های استاندارد و سایر معیار‌ها نسبت به مدل قبلی بهتر است در ده‌ها زبان کار می‌کند و می‌تواند تصاویر را به عنوان ورودی بگیرد برای مثال، این بدان معناست که قادر است محتوای یک عکس یا نمودار را توصیف کند.

برخلاف چت جی پی تی این مدل تازه در حال حاضر برای آزمایش عمومی در دسترس نیست (اگرچه می‌توانید آن را درخواست کنید یا هزینه دسترسی را بپردازید). در حالی که چت جی پی تی تنها می‌تواند متن را مدیریت کند جی پی تی -۴ به طور دقیق به پرسش‌های مربوط به عکس‌های کابل‌های رایانه پاسخ داد، اما ورودی‌های تصویر هنوز به صورت عمومی در دسترس نیستند حتی برای کسانی که در نهایت از لیست انتظار دسترسی پیدا کردند. بنابراین، تایید ادعا‌های Open AI امکان پذیر نیست.

مدل تازه جی پی تی -۴ تازه‌ترین مدل در یک شجره نامه طولانی (جی پی تی -۲، جی پی تی -۱، چت جی پی تی، جی پی تی – ۳.۵، و جی پی تی -۳) از آن چیزی است که اکنون با عنوان "مدل‌های زبان بزرگ" یا LLM شناخته می‌شود که برنامه‌های هوش مصنوعی هستند که یاد می‌گیرند تا پیش بینی کنند چه واژگانی احتمالا به دنبال یکدیگر می‌آیند.

این مدل‌ها بر اساس فرضیه‌ای کار می‌کنند که ریشه‌های شان به برخی از اولین تحقیقات هوش مصنوعی در دهه ۱۹۵۰ میلادی باز می‌گردد: این که رایانه‌ای که زبان را می‌فهمد و تولید می‌کند لزوما هوشمند خواهد بود.

این باور زیربنای بازی تقلیدی معروف "آلن تورینگ" بود که اکنون به عنوان تست تورینگ شناخته می‌شود که هوش رایانه‌ای را بر اساس نحوه خواندن متنی انسان ارزیابی می‌کرد.

در آن برنامه‌های اولیه هوش مصنوعی دانشمندان رایانه به جای استنتاج‌های آماری عمیقی که امروزه استفاده می‌شود قوانین پیچیده و دست نوشته را استخراج می‌کردند. پیش ساز‌های مدل‌های زبان بزرگ معاصر به اوایل دهه ۲۰۰۰ میلادی باز می‌گردند زمانی که دانشمندان استفاده از نوعی برنامه الهام گرفته از مغز انسان به نام "شبکه عصبی" را آغاز کردند که بسیاری از لایه‌های به هم پیوسته گره‌های مصنوعی را شامل می‌شد که حجم عظیمی از داده‌های آموزشی را پردازش کرده و متن را تولید می‌کند.

این فناوری در سالیان اخیر به لطف برخی از پیشرفت‌های کلیدی به ویژه افزایش دامنه توجه برنامه‌ها به سرعت پیشرفت کرده است. جی پی تی - ۴ می‌تواند نه تنها بر اساس عبارت قبلی بلکه بر اساس بسیاری از کلمات قبلی پیش بینی کند و اهمیت هر کلمه را متفاوت ارزیابی نماید.

"مدل‌های زبان بزرگ" امروزی برای یافتن این الگو‌های آماری عمیق، کتاب‌ها، مدخل‌های ویکیپدیا، پست‌های رسانه‌های اجتماعی، و منابع بی شماری دیگر را می‌خوانند. Open AI هم چنین شروع به استفاده از محققان انسانی برای تنظیم دقیق خروجی‌های مدل‌های خود کرده است. در نتیجه، جی پی تی -۴ و برنامه‌های مشابه دارای امکانات قابل توجهی در حوزه زبان، نوشتن داستان کوتاه، مقاله و کپی تبلیغاتی هستند.

برخی از زبان شناسان و دانشمندان علوم شناختی بر این باورند که این مدل‌های هوش مصنوعی درک مناسبی از علم نحو و حداقل طبق گفته Open AI شاید حتی ذره‌ای از درک یا استدلال را نشان می‌دهند اگرچه نکته اخیر بسیار بحث برانگیز است و تسلط دستوری وصرف و نحوی رسمی به دور از توانایی تفکر است.

جی پی تی – ۴ تازه‌ترین نقطه عطف در عرصه فناوری مرتبط با زبان است و بخشی از انفجار گسترده‌تر "هوش مصنوعی مولد" یا برنامه‌هایی است که قادر به تولید تصاویر، متن، کد، موسیقی و ویدئو در پاسخ به درخواست‌ها می‌باشند. اگر چنین نرم افزاری به وعده‌های بزرگ خود عمل کند می‌تواند شناخت و خلاقیت انسان را بازتعریف نماید درست مانند اینترنت، نوشتن یا حتی پیش از آن مانند آتش. Open AI هر تکرار جدید از "مدل‌های زبان بزرگ" خود را به عنوان گامی به سمت ماموریت اعلام شده شرکت برای ایجاد "هوش عمومی مصنوعی" یا رایانه‌هایی که می‌توانند یاد بگیرند و در همه چیز برتری داشته باشند به روشی که "به نفع همه بشریت باشد" قاب بندی می‌کند. "سم آلتمن" مدیر عامل Open AI به "نیویورک تایمز" گفته است که اگرچه جی پی تی -۴ استدلال یا هوشمندی را حل نکرده، اما گامی رو به جلو نسبت به آن چیزی است که در حال حاضر وجود دارد.

با این وجود، هوش مصنوعی پیشرفته‌تر خواه عموماً باهوش باشد یا نباشد ممکن است بخش عظیمی از جمعیت را بیکار کند یا کار‌های بوروکراتیک جدید مرتبط با هوش مصنوعی و نیاز‌های بهره وری بالاتر را جایگزین کار منظم کند.

صرفنظر از آن که این فناوری برای افراد عادی یک موهبت باشد یا یک بار سنگین کسانی که آن را کنترل می‌کنند بدون شک سود زیادی کسب خواهند کرد همان طور که Open AI به سمت تجاری سازی و فقدان شفافیت حرکت کرده اند همگان خواستار ورود به عرصه هوش مصنوعی هستند. شرکت‌هایی مانند اسنپ و اینستاکارت از فناوری Open AI از دستیار‌های هوش مصنوعی در خدمات خود استفاده می‌کنند. در اوایل سال جاری مایکروسافت ۱۰ میلیارد دلار در Open AI سرمایه گذاری کرد و اکنون فناوری چت بات را در موتور جستجوی بینگ خود گنجانده است.

گوگل با سرمایه گذاری مبلغ کمتری در استارت آپ رقیب هوش مصنوعی "آنتروپیک" (Anthropic) (که اخیرا ۴.۱ میلیارد دلار ارزش داشت) و اعلام ظرفیت‌های هوش مصنوعی مختلف در جستجوی گوگل، نقشه‌ها و برنامه‌های دیگر خود اقدام کرد. آمازون "هاگینگ فیس" (Hugging Face) وب سایتی محبوب که دسترسی آسان به ابزار‌های هوش مصنوعی می‌دهد را در AWS گنجانده است تا با "آزور" (Azure) سرویس ابری مایکروسافت رقابت کند.

متا مدت‌هاست که یک بخش هوش مصنوعی دارد و اکنون "مارک زاکربرگ" در تلاش است تا یک تیم خاص و مولد با هوش مصنوعی از خاکستر‌های پیکسلی متاورس بسازد. استارت آپ‌ها میلیارد‌ها دلار سرمایه‌گذاری خطرپذیر دارند.

جی پی تی -۴ در حال حاضر بینگ جدید را تامین می‌کند و می‌توان آن را در مایکروسافت آفیس ادغام کرد. مدیر عامل مایکروسافت در رویدادی که ماه گذشته بینگ جدید را معرفی کرد گفته بود:"مسابقه از امروز شروع می‌شود و ما به سرعت حرکت می‌کنیم".

حتی از آنجایی که "مدل‌های زبان بزرگ" در تولید تکرار واضحات عالی هستند بسیاری از منتقدان می‌گویند که اساس دنیا را درک نمی‌کنند و شاید نتوانند درک کنند. این مدل‌ها پاسخ‌هایی را با توهم دانایی کل تولید می‌کنند به این معنی که می‌توانند به راحتی دروغ‌های قانع کننده و نفرت مذموم را منتشر کنند. پیشینه نشان می‌دهد که مهملات زیادی از سوی ابزار‌های هوش مصنوعی منتشر می‌شوند. چت بات اصلی مایکروسافت به نام Tay که در سال ۲۰۱۶ میلادی منتشر شد زن‌ستیز و نژادپرستانه بود و به سرعت متوقف شد.

جی پی تی -۲ سوگیری علیه زنان و سایر گروه‌های جمعیتی را از خود نشان داد. هم چنین، جی پی تی -۳ مطالب نژادپرستانه و جنسیتی را گفته بود و چت جی پی تی متهم به اظهارنظر‌های سمی مشابهی شد. Open AI سعی کرد هر بار مشکل را برطرف کند و در این باره متحمل شکست شد. بینگ جدید که نسخه‌ای از جی پی تی ۴ را اجرا می‌کند سهم خود را در نگارش متن‌های آزار دهنده و توهین آمیز نشان داده است: به کودکان توهین‌های قومیتی را آموزش می‌دهد، شعار‌های نازیستی را تبلیغ کرده و نظریه‌های علمی را ابداع می‌کند.

در واقع، Open AI در پست وبلاگ خود اعتراف می‌کند که جی پی تی -۴ واقعیات را تبدیل به توهم می‌کند و خطا‌های استدلالی ایجاد می‌نماید و بررسی واقعیات خیلی بهتر نشده است و می‌تواند می‌تواند سوگیری‌های مختلفی در خروجی‌های خود داشته باشد. با این وجود، همان گونه که هر کاربر چت جی پی تی می‌تواند تایید کند حتی متقاعدکننده‌ترین الگو‌ها نیز نتایج کاملا قابل پیش بینی‌ای ندارند.

با توجه بیش‌تر پژوهشگران به سوگیری تکرار یک مدل زبان در آینده جی پی تی -۴ یا موارد دیگر می‌توانند روزی این الگوی تثبیت شده را بشکنند. با این وجود، فارغ از آن که مدل تازه توانایی خود را در چه چیزی ثابت کند هنوز پرسش‌های بسیار بزرگتری وجود دارند: این فناوری برای چه کسی است؟ زندگی چه کسانی مختل می‌شود؟ و اگر پاسخ‌ها را دوست نداشته باشیم آیا می‌توانیم کاری برای مخالفت با آن فناوری‌ها انجام دهیم؟