„Potwór sztucznej inteligencji” Baidu ERNIE 5.1 działa przy kosztach niższych o 94%.

Flagowy produkt firmy Baidu – ERNIE, niedawno zaktualizowany do wersji 5.1, zadziwia światową społeczność technologiczną swoimi niespotykanymi dotąd możliwościami oszczędzania kosztów.

Báo Khoa học và Đời sống•15/05/2026

W obliczu globalnego wyścigu w dziedzinie sztucznej inteligencji, w ramach którego inwestuje się miliardy dolarów w moc obliczeniową, Baidu, często nazywane „chińskim Google”, wywołało niemałą szok, oficjalnie wprowadzając na rynek swój model dużego języka ERNIE 5.1.

Najbardziej uderzającym aspektem są nie tylko jego doskonałe możliwości przetwarzania, ale także imponująca wartość ekonomiczna : koszt szkolenia tego modelu jest o około 94% niższy niż w przypadku systemów AI o podobnej skali. Jest to postrzegane jako nowe rozwiązanie problemu optymalizacji zasobów w kolejnej generacji AI.

Technologia kompresji sieci i strategia „wyszkol raz, wyszkol wszystkich”.

Aby zrozumieć, dlaczego Baidu udało się obniżyć koszty w tak niewiarygodnym stopniu, należy przyjrzeć się sposobowi, w jaki zbudowano ERNIE 5.1.

Zamiast podążać tradycyjną ścieżką trenowania zupełnie nowego modelu od podstaw, Baidu przyjęło metodę „wielowymiarowego, elastycznego treningu wstępnego”. ERNIE 5.1 nie jest w pełni niezależnym bytem, lecz został opracowany w oparciu o fundamenty swojego poprzednika, ERNIE 5.0 (wprowadzonego na rynek w styczniu 2026 r.).

Baidu wykorzystało elastyczną platformę szkoleniową o nazwie „Once-For-All”. Zamiast przeprowadzać oddzielne i kosztowne sesje treningowe dla każdego rozmiaru modelu, firma optymalizuje całą „rodzinę” modeli o różnych rozmiarach w jednym przebiegu.

2ffca8ca25c14b56a38a3c3a7917bb8etplv-73owjymdk6-jj-mark-v1-0-0-0-0-5o6y6yer5oqa5pyv56s-5yy6ieagrwfzeuxmtq-q75.jpg — Metoda treningu „elastyczności wielowymiarowej” obniża koszt Erniego 5.1 o 94%.

Modele te mają tę samą wagę, ale różnią się głębokością, szerokością i liczbą aktywowanych bloków eksperckich. Z potężnej architektury ERNIE 5.0, obejmującej około 2,4 biliona parametrów, Baidu wyodrębniło zoptymalizowaną podsieć, aby stworzyć ERNIE 5.1.

Rezultatem jest uproszczony model, w którym całkowita liczba parametrów stanowi zaledwie około jedną trzecią pierwotnej liczby. W szczególności liczba parametrów operacyjnych, czyli tych części, które faktycznie uczestniczą w przetwarzaniu informacji zwrotnej w rozmowie, została zmniejszona o połowę.

Przejęcie ogromnej bazy wiedzy od „modelu macierzystego” bez konieczności powtarzania całego kosztownego procesu szkoleniowego jest kluczem do oszczędności, jakie Baidu może osiągnąć w budżecie sięgającym 94%.

Ponadto Baidu całkowicie przebudowało swój system uczenia się przez wzmacnianie. Zamiast sztywno łączyć aktualizacje modeli, generowanie informacji zwrotnych i ocenę przebiegu, rozdzieliło je na niezależne podsystemy, koordynowane przez centralną jednostkę sterującą.

Dzięki temu każdy komponent może działać na najodpowiedniejszym sprzęcie, co gwarantuje, że wąskie gardło na jednym etapie nie spowolni całego procesu.

Aby rozwiązać problem błędów obliczeniowych w mieszanych modelach eksperckich (MoE), Baidu wdrożyło również standardową bibliotekę obliczeniową o niskiej precyzji, która zmniejszyła niestabilność o połowę bez obniżania szybkości przetwarzania.

Aby uporać się z „efektem huśtawki”, zastosuj czteroetapowy proces szkoleniowy.

Nieodłącznym wyzwaniem w trenowaniu dużych modeli sztucznej inteligencji jest „efekt huśtawki”. Gdy programiści próbują uczyć sztuczną inteligencję wielu umiejętności jednocześnie, poprawa w jednym obszarze często prowadzi do pogorszenia w innym.

Na przykład, im bardziej modelka radzi sobie z matematyką, tym gorzej może być jej zdolność do kreatywnego pisania.

Aby temu zaradzić, Baidu wprowadziło czteroetapowy proces udoskonalania, który nazywa MOPD (Multi-Teacher On-Policy Distillation).

0b5a83e4e4334df8a56ae72d29199bfdtplv-73owjymdk6-jj-mark-v1-0-0-0-0-5o6y6yer5oqa5pyv56s-5yy6ieagrwfzeuxmtq-q75.jpg — Czteroetapowy proces szkolenia Baidu.

Pierwsza faza rozpoczyna się od standaryzowanego, nadzorowanego szkolenia na dużym zbiorze danych.

W drugiej fazie Baidu równolegle szkoli wiele odrębnych modeli eksperckich w takich obszarach jak programowanie, rozumowanie logiczne i zadania agentów, z których każdy ma własne sygnały oceny.

Na trzecim etapie pojedynczy model „ucznia” będzie uczył się jednocześnie od wszystkich tych ekspertów-nauczycieli, generując własne odpowiedzi i porównując je z wynikami ekspertów.

Ostatni etap obejmuje ogólne uczenie się przez wzmacnianie w celu prowadzenia otwartych dialogów i zadań twórczych.

Według Baidu ten ostatni krok jest kluczowy, ponieważ proces przekazywania informacji od nauczyciela do ucznia prowadzi czasem do uzyskania odpowiedzi, które są zbyt dopracowane i mało zróżnicowane.

Dzięki temu procesowi ERNIE 5.1 osiąga równowagę poziomów umiejętności, zapobiegając nadmiernemu priorytetyzowaniu któregokolwiek obszaru i przyćmieniu innych.

Wiodąca wydajność i ambicja dominacji na rynku globalnym.

Działania optymalizacyjne Baidu przyniosły konkretne rezultaty w zakresie wiarygodnych rankingów. W teście LMArena Search Arena, gdzie modele sztucznej inteligencji są oceniane przez prawdziwych użytkowników za pomocą zadań wyszukiwania w czasie rzeczywistym, ERNIE 5.1 osiągnął wynik 1223 punktów (stan na 9 maja).

Ten wynik plasuje go na 4. miejscu na świecie i na szczycie listy wszystkich modeli opracowanych w Chinach.

ernie-5-1-01-lmarena-search-ranking-1778639140714-1778639141083628747758-4531.jpg — Ernie 5.1 od razu znalazł się w pierwszej czwórce rankingu LMArena.

W intensywnych testach wiedzy i rozumowania ERNIE 5.1 zbliżył się wydajnością do wiodących zachodnich modeli o zamkniętym kodzie źródłowym, takich jak Google Gemini 3.1 Pro.

W konkursie matematycznym AIME26 model ten osiągnął 99,6% dokładność przy stosowaniu narzędzi do rozumowania, zajmując drugie miejsce po Gemini 3.1 Pro.

W szczególności w zadaniach wymagających „możliwości agencyjnych”, takich jak przetwarzanie złożonych arkuszy kalkulacyjnych lub automatyczne przeglądanie stron internetowych w wielu krokach, ERNIE 5.1 przewyższył DeepSeek-V4-Pro — model, który wcześniej dzierżył rekord w Chinach.

Historia skuteczności ERNIE 5.1 przypomina wpływ DeepSeek R1 na początku 2025 r., kiedy to startup udowodnił, że możliwe jest osiągnięcie wydajności porównywalnej z OpenAI o1 przy kosztach niższych o 98%.

Jednak podczas gdy DeepSeek skupia się na efektywności rozumowania, ERNIE 5.1 dokonuje przełomu już na początkowym etapie szkolenia.

Przesłanie, które wysyła Baidu, jest jasne: chińskie laboratoria zajmujące się sztuczną inteligencją nieustannie znajdują innowacyjne sposoby, aby „zrobić więcej mniejszym kosztem”, zamiast po prostu polegać na zwiększaniu mocy sprzętowej systemu.

Obecnie ERNIE 5.1 jest szeroko wdrażany na ponad 10 platformach kreatywnych i w agencjach w Chinach. Użytkownicy mogą zapoznać się z tym modelem za pośrednictwem aplikacji takich jak platforma RPG Isekai Zero, narzędzie do tworzenia filmów krótkometrażowych Storymaster czy aplikacja graficzna Diting Huanliu.

Odszyfruj, Dekoder

Źródło: https://khoahocdoisong.vn/quai-vat-ai-ernie-51-cua-baidu-van-hanh-with-lower-cost-than-94-post2149100260.html