اوایل سال 2023 بود که مایکروسافت با سرمایهگذاری 10 میلیارد دلاری خود در شرکت OpenAI جان تازهای به این غول دنیای هوش مصنوعی بخشید و باعث شد تا فرایند توسعه AI تحت مدیریت این شرکت تسریع شود.
حالا OpenAI با انتشار یک بیانیه رسمی از تازه ترین به روزرسانی مدل زبانی بزرگ (LLM) خود خبر داده و آن را بزرگترین آپدیت آن نامیده است.
طبق ادعای OpenAI این بهروزرسانی باعث شده اکنون مدل زبانی GPT-4 بتواند مانند یک انسان ببیند و بشنود و حرف بزند. این توصیفی است که OpenAI برای توانایی فهم فایلهای صوتی و پاسخ با صدای مصنوعی و پردازش تصاویر در ChatGPT بهکار برده است. ChatGPT پنج صدای مختلف ارائه میدهد تا از میان آنها صدای مدنظر خودتان را انتخاب کنید. همچنین، ChatGPT میتواند محتوای تصاویر را درک و مهمترین نکات آنها را استخراج کند.
بهروزرسانی جدید ChatGPT در حالی معرفی میشود که رقابت بین بزرگان صنعت هوش مصنوعی همچنان ادامه دارد. شرکتهای حوزهی فناوری برای جانماندن از رقابت در حال اضافهکردن هوش مصنوعی به بسیاری از سرویسهایشان هستند. هفتهی گذشته، مایکروسافت ویژگیهای جدیدی برپایهی هوش مصنوعی برای ویندوز معرفی کرد و آمازون از اضافهشدن این فناوری به دستیار صوتی الکسا خبر داد.
کارشناسان نگران افزایش محتوای دیپفیک بهوسیلهی هوش مصنوعی هستند و اضافهشدن صدا به ChatGPT این نگرانی را تقویت میکند. OpenAI میگوید که برای تولید صداهای ChatGPT با برخی از صداپیشگان همکاری کرده است تا مشکلی درزمینهی حریم خصوصی پیش نیاید.
کسانی که نسخه اشتراکی استفاده از چتبات ChatGPT را خریداری کردهاند میتوانند طی دو هفته آینده از نسخه جدید آن استفاده کنند. البته، در نظر داشته باشید که قابلیتهای صوتی ChatGPT به اپلیکیشن موبایل این چتبات محدود شده و تا زمان انتشار نسخهی جدید آن برای عموم مردم باید در انتظار این ویژگیهای جذاب و جالب باشیم.