![]() |
Повідомляється, що DeepSeek досі використовує чіпи Nvidia, продаж яких заборонено в Китаї, для розробки своєї майбутньої моделі штучного інтелекту. Фото: Bloomberg . |
Згідно з новим звітом The Information , китайський стартап у сфері штучного інтелекту DeepSeek використовував чіпи Nvidia, продаж яких заборонено в країні, для розробки своєї майбутньої моделі штучного інтелекту.
Зокрема, у звіті з посиланням на анонімні джерела зазначалося, що найсучасніші чіпи Blackwell від Nvidia були контрабандою ввезені до Китаю через країни, які мають дозвіл на їх продаж. Крім того, сервери, що містили ці чіпи, були навіть демонтовані перед прибуттям до Китаю.
Спроба контрабандою вивезти чіпи Blackwell, провідну американську технологію штучного інтелекту, для розробки моделей демонструє сильну залежність китайської індустрії штучного інтелекту від американського обладнання.
Незважаючи на значні інвестиції китайського уряду у виробництво чіпів, вітчизняні альтернативи все ще недостатньо конкурентоспроможні з найкращими продуктами Nvidia на світовому ринку.
Компанія Deepseek щойно анонсувала свою модель DeepseekMath-V2, яка отримала золоті медалі на низці престижних математичних змагань. Цей крок ставить китайську компанію у пряму конкуренцію з провідними американськими лабораторіями штучного інтелекту, які є лідерами у сфері лінгвістичного моделювання та мислення.
Згідно з технічною документацією, DeepseekMath-V2 отримала золоті медалі на Міжнародній математичній олімпіаді (IMO) 2025 року та на китайському конкурсі CMO 2024 року. У конкурсі Патнема модель набрала 118 балів зі 120, що значно перевищує позначку в 90 балів, досягнуту учасником-людиною з найвищим балом в історії. Ці результати демонструють її здатність вирішувати складні задачі.
Китайська компанія пояснила, що обмеження попередніх моделей штучного інтелекту полягало в тому, що хоча вони могли надавати правильні відповіді, вони не могли представити коректне рішення.
Щоб подолати це, DeepseekMath-V2 використовує багатоетапний процес, який включає оцінку правильності, перевірку контраргументів та надання кінцевого результату. Цей метод роботи дозволяє системі самостійно перевіряти та уточнювати рішення в режимі реального часу, уникаючи ситуацій, коли висновок правильний, але міркування хибні.
Примітно, що в документації Deepseek не згадується використання в моделі зовнішніх інструментів, таких як комп'ютери чи інтерпретатори коду. Тестова схема показує, що всі результати були згенеровані повністю природною мовою.
Джерело: https://znews.vn/deepseek-bi-to-post1610172.html







Коментар (0)