ChatGPT از ورودی فرمان صوتی و تصویری رایگان پشتیبانی می‌کند

گوگل پیش از این Bard را در بسیاری از برنامه‌ها مانند Gmail، YouTube، Google Maps و Flights ادغام کرده است و این به آن مزیت بزرگی نسبت به ChatGPT می‌دهد. بنابراین OpenAI اخیراً اعلام کرده است که نسخه رایگان ChatGPT به زودی امکان ورودی صدا و تصویر را نیز فراهم می‌کند.

این یعنی کاربران می‌توانند سوالات ChatGPT را به روشی طبیعی‌تر از تایپ کردن در آیفون و اندروید بپرسند، یا حتی از تصاویر برای دریافت پاسخ‌های بهتر استفاده کنند. نکته کلیدی این است که کاربران برای دریافت به‌روزرسانی‌ها نیازی به پرداخت هزینه برای ChatGPT Plus نخواهند داشت، اگرچه حساب‌های پولی اولین کسانی خواهند بود که نسخه آزمایشی دریافت می‌کنند.

کاربران حساب‌های پلاس و انترپرایز این به‌روزرسانی را طی دو هفته آینده دریافت خواهند کرد و پس از آن سایر گروه‌های کاربری، از جمله توسعه‌دهندگان، این به‌روزرسانی را دریافت خواهند کرد. استفاده از تصاویر برای ورودی به ChatGPT نحوه کار مدل‌های هوش مصنوعی چندوجهی است. این شبیه به نحوه استفاده غول جستجو از گوگل لنز با هوش مصنوعی است.

ChatGPT hỗ trợ nhập lệnh bằng giọng nói và hình ảnh miễn phí - Ảnh 1. — انتظار می‌رود دو ویژگی جدید در ChatGPT کاربران بیشتری را نسبت به Google Bard جذب کند.

در همین حال، ویژگی پشتیبانی صوتی فقط در برنامه ChatGPT برای آیفون و اندروید در دسترس خواهد بود. کاربران فقط باید پس از فعال کردن این ویژگی، آن را در تنظیمات برنامه فعال کنند. OpenAI می‌گوید ChatGPT فقط به چند ثانیه نمونه گفتار نیاز دارد تا صدای شبیه به صدای انسان را از متن تولید کند و برای این کار از یک مدل جدید تبدیل متن به گفتار استفاده می‌کند.

این فناوری که می‌تواند در عرض چند ثانیه صداهای مصنوعی واقع‌گرایانه‌ای را از گفتار واقعی تولید کند، راه را برای بسیاری از برنامه‌های نوآورانه و متمرکز بر دسترسی‌پذیری باز می‌کند. با این حال، خطرات جدیدی مانند احتمال جعل هویت افراد مشهور یا ارتکاب کلاهبرداری را نیز به همراه دارد. OpenAI همچنین اعلام کرد که با Spotify برای آزمایش یک ویژگی ترجمه صوتی برای پادکست‌ها همکاری می‌کند و به سازندگان اجازه می‌دهد محتوای خود را با استفاده از صدای خود به زبان‌های دیگر ترجمه کنند.

لینک منبع