گوگل پیش از این Bard را در بسیاری از برنامهها مانند Gmail، YouTube، Google Maps و Flights ادغام کرده است و این به آن مزیت بزرگی نسبت به ChatGPT میدهد. بنابراین OpenAI اخیراً اعلام کرده است که نسخه رایگان ChatGPT به زودی امکان ورودی صدا و تصویر را نیز فراهم میکند.
این یعنی کاربران میتوانند سوالات ChatGPT را به روشی طبیعیتر از تایپ کردن در آیفون و اندروید بپرسند، یا حتی از تصاویر برای دریافت پاسخهای بهتر استفاده کنند. نکته کلیدی این است که کاربران برای دریافت بهروزرسانیها نیازی به پرداخت هزینه برای ChatGPT Plus نخواهند داشت، اگرچه حسابهای پولی اولین کسانی خواهند بود که نسخه آزمایشی دریافت میکنند.
کاربران حسابهای پلاس و انترپرایز این بهروزرسانی را طی دو هفته آینده دریافت خواهند کرد و پس از آن سایر گروههای کاربری، از جمله توسعهدهندگان، این بهروزرسانی را دریافت خواهند کرد. استفاده از تصاویر برای ورودی به ChatGPT نحوه کار مدلهای هوش مصنوعی چندوجهی است. این شبیه به نحوه استفاده غول جستجو از گوگل لنز با هوش مصنوعی است.
انتظار میرود دو ویژگی جدید در ChatGPT کاربران بیشتری را نسبت به Google Bard جذب کند.
در همین حال، ویژگی پشتیبانی صوتی فقط در برنامه ChatGPT برای آیفون و اندروید در دسترس خواهد بود. کاربران فقط باید پس از فعال کردن این ویژگی، آن را در تنظیمات برنامه فعال کنند. OpenAI میگوید ChatGPT فقط به چند ثانیه نمونه گفتار نیاز دارد تا صدای شبیه به صدای انسان را از متن تولید کند و برای این کار از یک مدل جدید تبدیل متن به گفتار استفاده میکند.
این فناوری که میتواند در عرض چند ثانیه صداهای مصنوعی واقعگرایانهای را از گفتار واقعی تولید کند، راه را برای بسیاری از برنامههای نوآورانه و متمرکز بر دسترسیپذیری باز میکند. با این حال، خطرات جدیدی مانند احتمال جعل هویت افراد مشهور یا ارتکاب کلاهبرداری را نیز به همراه دارد. OpenAI همچنین اعلام کرد که با Spotify برای آزمایش یک ویژگی ترجمه صوتی برای پادکستها همکاری میکند و به سازندگان اجازه میدهد محتوای خود را با استفاده از صدای خود به زبانهای دیگر ترجمه کنند.
لینک منبع
نظر (0)