DeepSeek wprowadza na rynek narzędzie oparte na sztucznej inteligencji, które może zdobyć złoty medal w międzynarodowym konkursie matematycznym

Rozwiązywanie złożonych problemów za pomocą języka naturalnego, rozwiązań i jasnych, spójnych argumentów… nie jest łatwe, nawet dla uczniów z dobrą matematyką. Jednak DeepSeek stworzył model sztucznej inteligencji DeepSeekMath-V2, który jest w stanie to zrobić.

DeepSeek ra mắt công cụ AI có khả năng giành HCV kỳ thi toán quốc tế - 1 — Firma DeepSeek była pod wrażeniem stworzenia modelu sztucznej inteligencji (AI) zdolnego do rozwiązywania problemów na poziomie egzaminów międzynarodowych (ilustracja: AI).

W ewaluacjach DeepSeekMath-V2 uzyskał wyniki na poziomie złotych medali w rozwiązywaniu problemów na Międzynarodowej Olimpiadzie Matematycznej (IMO) w 2025 r. i Chińskiej Olimpiadzie Matematycznej (CMO) w 2024 r.

Podczas testu IMO-ProofBench oceniającego zdolność modeli sztucznej inteligencji do interpretacji matematycznej i rozumowania, DeepSeekMath-V2 firmy DeepSeek osiągnął znakomite wyniki w porównaniu z innymi modelami sztucznej inteligencji, takimi jak DeepMind firmy Google, Grok firmy xAI lub GPT-5 firmy OpenAI.

Warto zauważyć, że model sztucznej inteligencji DeepSeek uzyskał również wynik 118/120 w konkursie Putnam Math Competition w 2024 r., podczas gdy najwyżej sklasyfikowana osoba w tym konkursie uzyskała zaledwie 90 punktów. Konkurs Putnam jest uważany za najtrudniejszy i najbardziej prestiżowy konkurs matematyczny dla studentów uniwersyteckich na świecie , odbywający się co roku w grudniu.

Wiele zadań w konkursach międzynarodowych czasami nie wymaga podania dokładnej liczby, a wynik zależy od rozumowania użytego do znalezienia rozwiązania. Jednak DeepSeekMath-V2 nadal wykazuje zdolność do ścisłego rozumowania w języku naturalnym, podobnie jak ludzie, co pomaga temu modelowi sztucznej inteligencji uzyskać wysoki wynik.

DeepSeek twierdzi, że aby pomóc swojemu modelowi sztucznej inteligencji w znajdowaniu trafnych odpowiedzi i mocnych argumentów, zbudował dwa duże modele językowe i porównał je ze sobą. Jeden model działa jako „dowódca” generujący argumenty matematyczne i dowody, a drugi jako „sędzia” weryfikujący przedstawione argumenty.

Ten sposób pracy pomaga eliminować słabe hipotezy i argumenty, koncentrując się na optymalizacji rozwiązania w celu znalezienia poprawnej odpowiedzi i prowadzeniu solidnej argumentacji.

DeepSeekMath-V2 jest rozwijany jako oprogramowanie typu open source, co pozwala społeczności na modyfikowanie kodu źródłowego i wykorzystywanie go do różnych celów.

DeepSeek twierdzi, że przełomowe odkrycia dokonane dzięki DeepSeekMath-V2 położą podwaliny pod budowę bardziej wydajnych i niezawodnych systemów sztucznej inteligencji.

DeepSeek to chińska firma technologiczna, która zrobiła furorę na całym świecie, gdy pod koniec stycznia wypuściła na rynek model AI R1, zapewniający szybką i dokładną reakcję.

Największą zaletą R1 jest to, że DeepSeek wydało zaledwie około 6,5 miliona dolarów na opracowanie i wyszkolenie tego modelu sztucznej inteligencji, zamiast wydawać miliardy dolarów, jak amerykańskie firmy technologiczne, na szkolenie i obsługę własnych modeli sztucznej inteligencji.

Co więcej, R1 został opracowany i obsługiwany przez DeepSeek w oparciu o układy AI starszej generacji, ponieważ chińskie firmy objęte embargiem rządu USA nie mogą zamawiać zaawansowanych układów AI. Mimo to R1 nadal wykazuje imponującą wydajność przetwarzania i szybkość reakcji na żądania użytkowników.

Pojawienie się DeepSeek sprawiło, że Stany Zjednoczone utraciły monopol w wyścigu o rozwój modeli sztucznej inteligencji, a jednocześnie otworzyły nowy wyścig. Zamiast koncentrować się wyłącznie na inteligencji i możliwościach przetwarzania, firmy technologiczne zaczęły zwracać większą uwagę na problem efektywności ekonomicznej w procesie rozwoju modeli sztucznej inteligencji.

Source: https://dantri.com.vn/cong-nghe/deepseek-ra-mat-cong-cu-ai-co-kha-nang-gianh-hcv-ky-thi-toan-quoc-te-20251130154751624.htm