یک زن بریتانیایی که از بیماری نورون حرکتی (MND) رنج میبرد و باعث شده بود توانایی صحبت کردن خود را از دست بدهد، به لطف فناوری هوش مصنوعی (AI) و ضبط صدای ۸ ثانیهای از یک ویدیوی خانوادگی قدیمی، دوباره توانسته است با استفاده از صدای خود ارتباط برقرار کند.
سارا ازیکیل، هنرمندی که در شمال لندن زندگی میکند، پس از تشخیص بیماری MND در سن ۳۴ سالگی، در حالی که ۲۵ سال پیش فرزند دومش را باردار بود، توانایی صحبت کردن خود را از دست داد.
این بیماری به سیستم عصبی آسیب میرساند و عضلات زبان، دهان و گلو را ضعیف میکند و باعث میشود برخی از بیماران توانایی صحبت کردن را به طور کامل از دست بدهند.
سالهای زیادی، ازیکیل مجبور بود برای برقراری ارتباط از کامپیوتر و فناوری تولید صدا استفاده کند، اما صدای حاصل هیچ شباهتی به صدای خودش نداشت. دو فرزند او، آویوا و اریک، هرگز صدای واقعی مادرشان را نشنیدند.
در سالهای اخیر، متخصصان توانستهاند با استفاده از فناوری، صدای اصلی یک فرد را بازسازی کنند. با این حال، این تکنیک نیاز به ضبطهای طولانی و با کیفیت بالا دارد و صدای حاصل اغلب «یکنواخت» ارزیابی میشود.
سایمون پول، نماینده شرکت ارتباطات بهداشتی بریتانیایی اسمارتباکس، گفت که این شرکت در ابتدا از ایزکیل درخواست کرده بود که یک فایل صوتی ۶۰ دقیقهای ارائه دهد.
با این حال، خانم ازکیل فقط یک کلیپ بسیار کوتاه و بیکیفیت پیدا کرد که از یک ویدیوی خانوادگی مربوط به دهه ۱۹۹۰ گرفته شده بود. این کلیپ فقط ۸ ثانیه طول داشت، تحریف شده بود و حاوی نویز پسزمینه تلویزیون بود.
آقای پول مجبور شد به فناوری توسعهیافته توسط ElevenLabs، یک تولیدکننده گفتار هوش مصنوعی مستقر در نیویورک، روی آورد. این فناوری قادر به بازتولید گفتار واقعگرایانه با دادههای بسیار کم است.
آقای پول از یک ابزار هوش مصنوعی برای جدا کردن صدا از صدای ضبط شده قدیمی استفاده کرد، سپس از ابزار دیگری - که با دادههای صدای واقعی آموزش دیده بود - برای ایجاد محصول نهایی استفاده کرد.
نتیجه، خانم ازیکیل را عمیقاً تحت تأثیر قرار داد. صدای بازسازیشده بسیار شبیه صدای واقعی او بود، صدایی که لهجهی لندنیِ متمایزی داشت و کمی نوک زبانی صحبت میکرد که قبلاً از آن خوشش نمیآمد.
طبق گزارش انجمن MND بریتانیا، از هر ده نفر مبتلا به این بیماری، هشت نفر پس از تشخیص، مشکلات گفتاری را تجربه میکنند. با این حال، صداهای تولید شده توسط کامپیوتر فعلی اغلب به دلیل نداشتن ریتم و احساس مورد انتقاد قرار میگیرند.
آقای پول اظهار داشت که پیشرفت فعلی در فناوری هوش مصنوعی، توانایی آن در ایجاد صداهای انسانی و رسا است و از این طریق به صداهای کامپیوتری که قبلاً یکنواخت بودند، "روح میبخشد". او تأکید کرد که شخصیسازی صداها همچنین راهی برای حفظ هویت فردی است.
در حال حاضر، به افرادی که به دلیل بیماریهایی مانند MND در معرض خطر از دست دادن توانایی صحبت کردن هستند، اغلب توصیه میشود که صدای خود را در اسرع وقت ضبط کنند تا هویت شخصی خود را حفظ کرده و برای اهداف ارتباطی آینده از آن استفاده کنند.
با این حال، قبل از اینکه گوشیهای هوشمند فراگیر شوند، به دست آوردن فایلهای صوتی مناسب کار آسانی نبود.
منبع: https://www.vietnamplus.vn/ai-tai-tao-giong-noi-cho-mot-phu-nu-anh-mat-kha-nang-noi-25-nam-post1057350.vnp






نظر (0)