01.ai의 창립자이자 전 구글 차이나 대표인 리카이푸는 중국 본토 기업들은 적은 양의 데이터로 훈련된 모델을 구축함으로써 컴퓨팅 성능은 낮추고 하드웨어를 최적화함으로써 비용을 절감한다고 말했습니다.

UC 버클리 스카이랩과 LMSYS가 최근 발표한 순위에 따르면, 스타트업 01.ai의 Yi-Lingtning 모델은 x.AI의 Grok-2와 공동 3위를 차지했으며, OpenAI와 Google에 이어 3위를 차지했습니다. 이 순위는 사용자의 질의 응답 점수를 기반으로 합니다.

2d82e5b153faa85bf01e3f82affa4e298ec4f24e.avif.jpg
AI 비용 절감은 중국이 미국과 경쟁할 수 있는 한 가지 방법입니다. 사진: FT

01.ai와 DeepSeek는 저렴하고 고도로 숙련된 인력을 고용하는 한편, 모델을 훈련하기 위해 소규모 데이터 세트에 집중하는 전략을 채택한 중국 본토의 AI 회사입니다.

파이낸셜 타임스(FT)에 따르면 Yi-Lightning의 추론 비용은 토큰 100만 개당 14센트인 반면, OpenAI의 GPT o1-mini는 26센트입니다. 한편, GPT 4o의 추론 비용은 토큰 100만 개당 최대 4.40달러입니다. 응답 생성에 사용되는 토큰 수는 각 쿼리의 복잡성에 따라 달라집니다.

Yi-Lightning 설립자는 다양한 사용 사례에 맞춰 미세 조정하기 전에 "초기 교육"에 300만 달러를 투자했다고 밝혔습니다. Lee는 "최고의 모델을 만드는 것이 아니라" "5~10배 더 저렴한" 경쟁력 있는 모델을 구축하는 것이 목표였다고 말했습니다.

01.ai, DeepSeek, MiniMax, Stepfun이 적용한 방법은 "전문가 모델링"이라고 합니다. 이는 간단히 말해 도메인별 데이터 세트에서 학습된 여러 신경망을 결합하는 것입니다.

연구자들은 이러한 접근 방식을 빅데이터 모델과 동일한 수준의 지능을 달성하면서도 컴퓨팅 성능은 낮출 수 있는 핵심적인 방법으로 보고 있습니다. 그러나 이 접근 방식의 어려움은 엔지니어가 하나의 일반 모델이 아닌 "여러 전문가"를 활용하여 학습 과정을 조율해야 한다는 것입니다.

고급 AI 칩을 구하는 데 어려움이 있어 중국 기업은 전문가 모델을 훈련하는 데 사용할 고품질 데이터 세트를 개발하는 데 주력하면서 서구 경쟁사와 경쟁하게 되었습니다.

이씨는 01.ai가 책을 스캔하거나 WeChat 메시징 앱에서 기사를 수집하는 등 오픈 웹에서 접근할 수 없는 비전통적인 데이터 수집 방법을 가지고 있다고 말했습니다.

창업자는 중국이 미국보다 더 나은 위치에 있으며, 저렴한 기술 인재 풀이 거대하다고 믿는다.

(FT, 블룸버그에 따르면)

소셜 미디어 대기업 Meta가 자체 평가 학습(STE) 기능을 갖춘 새로운 AI 모델을 발표했습니다. 이 모델을 통해 AI 개발 과정에서 인간의 개입을 줄일 수 있습니다.