
Illustration: Universität Oxford
Laut Nature haben Wissenschaftler eine neue Technik namens „Mind Captioning“ entwickelt, die auf der Grundlage der Gehirnaktivität genaue Beschreibungen dessen erzeugen kann, was eine Person sieht oder sich vorstellt.
Die Methode nutzt nicht-invasive funktionelle Magnetresonanztomographie (fMRI) und könnte neue Wege zum Verständnis der Art und Weise eröffnen, wie das menschliche Gehirn die Welt interpretiert.
Die in der Fachzeitschrift „Science Advances“ veröffentlichte Studie zeigte, dass das System Bilder oder Szenen, die die Teilnehmenden betrachteten, „lesen“ und in vollständige Sätze übersetzen konnte. Experten zufolge könnte die Technologie Menschen, die aufgrund von Schlaganfällen oder neurologischen Erkrankungen ihre Sprechfähigkeit verloren haben, helfen, effektiver zu kommunizieren.
Im Rahmen des Experiments analysierte das Team um den Wissenschaftler Tomoyasu Horikawa (NTT Communications Science Laboratory, Japan) mithilfe eines Deep-Language-Modells mehr als 2.000 Videoclips und wandelte jede Beschreibung in eine digitale „Bedeutungssignatur“ um.
Anschließend trainierten sie ein weiteres Modell, um die Gehirnaktivitätsmuster zu erkennen, die den einzelnen Signaturen entsprachen, während die Teilnehmer die Videos ansahen.
Nach dem vollständigen Training kann das Modell fMRT-Daten einer Person, die sich ein neues Video ansieht, auswerten und vorhersagen, was diese Person sieht. Ein weiteres Textgenerierungsmodell sucht dann nach einem Satz, der dieser „semantischen Signatur“ am besten entspricht.
In einem Beispiel sahen die Teilnehmer eine Szene, in der eine Person von einem Wasserfall sprang. Nach mehreren Durchgängen verfeinerte die KI die Beschreibung schrittweise von „einem reißenden Wasserlauf“ zu „einer Person, die über einen tiefen Wasserfall an einem Berghang springt“.
Das Experiment zeigte auch, dass das System selbst dann noch genaue Beschreibungen erzeugen konnte, wenn die Teilnehmer lediglich Videos wiedergaben, die sie gesehen hatten. Dies beweist, dass das Gehirn Bilder beim Sehen und Erinnern mithilfe ähnlicher Mechanismen speichert und wiedergibt.
Forscher sagen, die Technik könne die Kommunikation für Menschen mit Gehirn-Computer-Schnittstellen verbessern, indem Gedanken direkt in Sprache übersetzt werden, ohne dass implantierte Geräte erforderlich sind.
Experten warnen jedoch auch vor dem Risiko eines Eingriffs in die Privatsphäre, sollte diese Technologie missbraucht werden. Derzeit funktioniert die Methode nur mit Zustimmung des Teilnehmers und kann keine „privaten Gedanken“ lesen.
Quelle: https://tuoitre.vn/dot-pha-ai-doc-suy-nghi-ghi-phu-de-cho-nao-nguoi-20251107071355395.htm






Kommentar (0)