(CLO) Meta, die Muttergesellschaft von Facebook, gab am Freitag bekannt, dass sie eine Reihe neuer KI-Modelle auf den Markt bringt, darunter einen „selbstlernenden Evaluator“, der menschliche Eingriffe in den KI-Entwicklungsprozess reduzieren kann.
Die Ankündigung erfolgte, nachdem Meta das Tool im August in einer Forschungsarbeit vorgestellt hatte. Darin wurde beschrieben, wie es eine „Gedankenketten“-Technik ähnlich den neuen Modellen von OpenAI nutzt, um präzise Urteile über die Reaktionen von KI-Modellen zu treffen. Die Technik zerlegt komplexe Probleme in einfachere logische Schritte und trägt so zur Verbesserung der Genauigkeit in Bereichen wie Naturwissenschaften , Programmierung und Mathematik bei.
Meta-AI-Symbol. Foto: Reuters
Die Metaforscher verwendeten zum Trainieren dieses Bewertungsmodells ausschließlich KI-generierte Daten und eliminierten so in dieser Phase vollständig menschliche Eingriffe.
Die Möglichkeit, KI zur Bewertung der KI selbst zu verwenden, birgt laut zwei Meta-Forschern das Potenzial für die Entwicklung autonomer KI-Agenten, die aus ihren eigenen Fehlern lernen können.
Viele Experten auf dem Gebiet der künstlichen Intelligenz stellen sich diese intelligenten digitalen Agenten als digitale Assistenten vor, die in der Lage sind, eine Vielzahl von Aufgaben ohne menschliches Eingreifen auszuführen.
Selbstverbessernde Modelle könnten den Prozess des „Reinforcement Learning from Human Feedback“ überflüssig machen, der hochqualifizierte Experten erfordert, um Daten zu kennzeichnen und die Richtigkeit komplexer mathematischer und schriftlicher Antworten zu überprüfen. Dieser Prozess ist derzeit sehr teuer und ineffizient.
„Wir hoffen, dass die KI mit zunehmender Überlegenheit gegenüber dem Menschen auch besser darin wird, ihre eigene Arbeit zu überprüfen und dabei sogar die menschlichen Fähigkeiten übertrifft“, sagte Jason Weston, einer der Forscher des Projekts.
„Die Fähigkeit zu lernen und sich selbst einzuschätzen ist der Schlüssel zur Entwicklung von KI auf übermenschliches Niveau“, fügte er hinzu.
Neben Meta haben auch andere Unternehmen wie Google und Anthropic Forschungsergebnisse zum Konzept von RLAIF (Reinforcement Learning from Feedback AI) veröffentlicht. Im Gegensatz zu Meta geben diese Unternehmen ihre Modelle jedoch selten öffentlich frei.
Cao Phong (laut Reuters)
[Anzeige_2]
Quelle: https://www.congluan.vn/meta-phat-hanh-mo-hinh-ai-co-the-tu-hoc-va-tu-phat-trien-post317675.html
Kommentar (0)