Nel bel mezzo di una corsa globale all'intelligenza artificiale che sta investendo miliardi di dollari in potenza di calcolo, Baidu, spesso definita la "Google cinese", ha suscitato grande scalpore lanciando ufficialmente il suo modello di linguaggio di programmazione ERNIE 5.1.
L'aspetto più sorprendente non risiede solo nelle sue superiori capacità di elaborazione, ma anche nel suo notevole valore economico : il costo di addestramento di questo modello è inferiore di circa il 94% rispetto a quello di sistemi di intelligenza artificiale di dimensioni simili. Ciò è considerato una nuova soluzione al problema dell'ottimizzazione delle risorse nella prossima generazione di intelligenza artificiale.

Tecnologia di compressione di rete e strategia "addestra una volta, addestra tutti".
Per capire perché Baidu sia riuscita a ridurre i costi in modo così incredibile, bisogna esaminare come hanno realizzato ERNIE 5.1.
Anziché seguire il percorso tradizionale di addestramento di un modello completamente nuovo da zero, Baidu ha adottato un metodo di "pre-addestramento elastico multidimensionale". Nello specifico, ERNIE 5.1 non è un'entità completamente indipendente, ma è sviluppato sulla base del suo predecessore, ERNIE 5.0 (lanciato a gennaio 2026).
Baidu ha utilizzato un framework di training elastico chiamato "Once-For-All". Invece di eseguire sessioni di training separate e costose per ogni diversa dimensione del modello, l'azienda ottimizza un'intera "famiglia" di modelli di varie dimensioni in un'unica esecuzione.

Questi modelli condividono i pesi ma differiscono per profondità, ampiezza e numero di blocchi esperti attivati. Dalla vasta architettura di ERNIE 5.0, con circa 2,4 trilioni di parametri, Baidu ha estratto una sottorete ottimizzata per creare ERNIE 5.1.
Il risultato è un modello semplificato con un numero totale di parametri pari a circa un terzo di quello originale. In particolare, il numero di parametri operativi, ovvero le parti che partecipano effettivamente all'elaborazione del feedback in una conversazione, è stato dimezzato.
La possibilità di ereditare la vasta base di conoscenze dal modello "madre" senza dover ripetere l'intero e costoso processo di formazione è la chiave che consente a Baidu di risparmiare fino al 94% del proprio budget.
Inoltre, Baidu ha completamente ristrutturato il suo sistema di apprendimento per rinforzo. Invece di collegare rigidamente gli aggiornamenti del modello, la generazione del feedback e la valutazione delle esecuzioni, li ha separati in sottosistemi indipendenti, coordinati da un'unità di controllo centrale.
Ciò consente a ciascun componente di funzionare sull'hardware più adatto, garantendo che un collo di bottiglia in una fase non rallenti l'intero processo.
Per affrontare il problema della distorsione computazionale nei modelli mixed-expert (MoE), Baidu ha anche implementato una libreria di calcolo a bassa precisione standardizzata, che ha dimezzato l'instabilità senza ridurre la velocità di elaborazione.
Affrontare l'"effetto altalena" con un processo di formazione in quattro fasi.
Una sfida intrinseca nell'addestramento di modelli di intelligenza artificiale di grandi dimensioni è l'"effetto altalena". Quando gli sviluppatori cercano di insegnare all'IA più competenze contemporaneamente, il miglioramento in un'area spesso porta a un declino in un'altra.
Ad esempio, man mano che un modello acquisisce maggiore competenza matematica, le sue capacità di scrittura creativa potrebbero risentirne negativamente.
Per ovviare a questo problema, Baidu ha istituito un processo di perfezionamento in quattro fasi chiamato MOPD (Multi-Teacher On-Policy Distillation).

La prima fase inizia con un addestramento supervisionato standardizzato su un ampio set di dati.
Nella seconda fase, Baidu addestra in parallelo diversi modelli esperti separati per aree quali la programmazione, il ragionamento logico e le attività degli agenti, ognuno con i propri segnali di valutazione.
Nella terza fase, un singolo modello "studente" apprenderà simultaneamente da tutti questi "insegnanti" esperti, generando le proprie risposte e confrontandole con i risultati degli esperti.
La fase finale prevede un apprendimento per rinforzo generale per dialoghi aperti e compiti creativi.
Secondo Baidu, quest'ultimo passaggio è cruciale perché il processo di elaborazione che va dall'insegnante allo studente a volte produce risposte eccessivamente rifinite ma prive di diversità.
Grazie a questo processo, ERNIE 5.1 raggiunge un equilibrio nei livelli di competenza, impedendo che un'area venga eccessivamente privilegiata e oscuri le altre.
Prestazioni di alto livello e ambizione di dominare il mercato globale.
Gli sforzi di ottimizzazione di Baidu hanno prodotto risultati concreti nelle classifiche più prestigiose. Su LMArena Search Arena, dove i modelli di intelligenza artificiale vengono valutati da utenti reali attraverso attività di ricerca web in tempo reale, ERNIE 5.1 ha raggiunto un punteggio di 1.223 al 9 maggio.
Questo punteggio la colloca al 4° posto a livello globale e le conferisce il primato tra tutti i modelli sviluppati in Cina.

In test intensivi di conoscenza e ragionamento, ERNIE 5.1 si è avvicinato alle prestazioni dei principali modelli occidentali a codice chiuso, come Gemini 3.1 Pro di Google.
Nella competizione matematica AIME26, questo modello ha raggiunto un tasso di accuratezza del 99,6% utilizzando strumenti di ragionamento, classificandosi secondo solo a Gemini 3.1 Pro.
In particolare, nelle attività che richiedono "capacità di agenzia", come l'elaborazione di fogli di calcolo complessi o la navigazione web automatizzata in più fasi, ERNIE 5.1 ha superato DeepSeek-V4-Pro, il modello che in precedenza deteneva il record in Cina.
La storia dell'efficacia di ERNIE 5.1 ricorda l'impatto di DeepSeek R1 all'inizio del 2025, quando la startup dimostrò che era possibile raggiungere prestazioni paragonabili a OpenAI o1 con un costo inferiore del 98%.
Tuttavia, mentre DeepSeek si concentra sull'efficienza del ragionamento, ERNIE 5.1 compie una svolta fin dalla fase di addestramento iniziale.
Il messaggio che Baidu sta inviando è chiaro: i laboratori cinesi di intelligenza artificiale sono costantemente alla ricerca di modi innovativi per "fare di più con meno", anziché limitarsi a investire maggiore potenza hardware nel sistema.
Attualmente, ERNIE 5.1 ha avviato una diffusione capillare su oltre 10 piattaforme e agenzie creative in Cina. Gli utenti possono sperimentare questo modello attraverso applicazioni come la piattaforma di gioco di ruolo Isekai Zero, lo strumento per la creazione di cortometraggi Storymaster o l'applicazione grafica Diting Huanliu.
Fonte: https://khoahocdoisong.vn/quai-vat-ai-ernie-51-cua-baidu-van-hanh-with-lower-cost-than-94-post2149100260.html










Commento (0)