새로운 AI가 '딥시크보다 낫다'는 것은 사실 과대광고일 뿐인가?

그러나 마누스가 이전의 AI 에이전트 중 거의 누구도 달성하지 못했던 뛰어난 기능을 갖추고 있다는 점은 부인할 수 없습니다. 사진: 자오바오(Zaobao )

3월 6일, 중국 스타트업 모니카가 개발한 AI 시스템인 마누스가 공식 출시되었습니다. 단 며칠 만에 마누스는 전 세계적으로 뜨거운 논쟁의 물결을 일으켰습니다.

"아이디어를 행동으로 옮길 수 있는 일반 AI"인 마누스는 ChatGPT나 클로드와 같은 기존 챗봇을 뛰어넘는 것으로 알려져 있습니다. 이 AI는 사용자가 정보를 검색하고, 콘텐츠를 생성하고, 작업을 완료하는 데 필요한 모든 단계를 수행하는 데 도움을 줍니다.

마누스란 무엇이고 왜 화제를 모으고 있나요?

예를 들어, 사용자가 Manus에 기후 변화에 대한 연구 논문을 작성해 달라고 요청하면 Manus는 텍스트를 생성하고, 정보를 검색하고, 논문을 작성하고, 차트와 대화형 시각적 요소를 만듭니다. 마지막으로, 사용자에게 추가 요청 없이 모든 것을 완전한 제품으로 패키징합니다.

이는 주식 분석, 프로그래밍 코드 작성, 온라인 과정 구축, 자세한 여행 계획 수립 등 다른 여러 작업에도 적용될 수 있습니다. 모니카의 챗봇은 그녀가 웹을 탐색하고, 도구를 사용하고, 결과를 집계하는 동안 그녀의 작업 진행 상황을 표시할 수 있습니다. 덕분에 사용자는 AI가 취하는 각 단계를 명확하게 볼 수 있습니다.

이 영상은 소셜 미디어에서 큰 인기를 끌었는데, Manus AI가 여러 작업을 동시에 수행했기 때문입니다. 사진: 바르시.

개발팀은 Manus가 GAIA 규모에서 OpenAI의 DeepResearch를 능가했다고 주장합니다. 이는 일반 AI 보조원이 실제 업무를 수행하는 능력을 평가하기 위한 벤치마크입니다.

OpenAI의 DeepSearch 시스템도 비슷한 연구 기능을 갖추고 있지만, 초기 사용자들은 Manus가 자신들이 경험해 본 자동화 AI 시스템 중 가장 진보된 시스템이라고 말합니다.

데모 영상에서 마누스는 50개의 서로 다른 화면을 넘나들며 X와 Telegram 등의 소스에서 정보를 수집하고, 그 과정에서 스크린샷도 찍습니다.

마누스의 한계는 어디인가?

현재 Manus는 제한된 테스트를 통해서만 출시되었으며, 사용자는 초대 코드가 있어야만 접속할 수 있습니다. 아직 공식적인 출시일은 없지만, 마누스의 급속한 성장으로 인해 많은 사람들이 머지않아 광범위한 출시가 이루어질 것으로 예측하고 있습니다. 또한, 모니카는 개발자들이 Manus를 프로젝트에 통합할 수 있도록 이 모델을 오픈 소스로 출시할 계획입니다.

Manus AI에 대한 초기 사용자 경험은 매우 긍정적이었습니다. 사진: DeryaTR.

허깅 페이스의 제품 책임자는 이 제품을 "제가 테스트해 본 AI 도구 중 가장 인상적"이라고 불렀습니다. AI 정책 연구원인 딘 볼은 마누스를 "가장 정교한 AI 컴퓨터 시스템"이라고 설명합니다.

이 AI의 공식 Discord 채널도 단 며칠 만에 138,000명이 넘는 멤버를 확보했습니다. 중국의 Xianyu 앱에서는 플랫폼에 접속할 수 있는 초대 코드가 수천 달러에 판매되고 있습니다.

하지만 모든 사람이 마누스의 잠재력에 확신을 갖는 것은 아닙니다.

일부 테스트에 따르면 이 AI는 완전히 새로운 기술이 아니며 Anthropic의 Claude와 Alibaba의 Qwen과 같은 기존 AI 모델을 결합하고 개선한 것일 수 있습니다. TechCrunch 에 따르면, 이러한 주장은 Manus가 진정한 혁신인지 아니면 기존 기술을 교묘하게 조합한 것인지에 대한 의문을 제기합니다.

"인간:" 및 "비서:"와 같은 시뮬레이터와 채팅할 때 오류가 발생합니다. 사진: 알렉산더 도리아.

실제 리뷰는 마누스에 대한 다른 관점을 제공합니다. AI 스타트업 플레이아스의 공동 창립자인 알렉산더 도리아는 이 시스템을 테스트하는 동안 많은 오류를 겪었다고 말했습니다. 예를 들어, AI가 무한 루프에 빠져 작업을 완료하지 못하는 경우가 있었습니다.

"Manus는 Claude 3.7 버전인 것 같습니다. "Human:" 및 "Assistant:" 대화 스타일을 사용할 때 즉시 주입 오류가 발생하여 무한 루프에 빠지고, Human 및 Assistant 대화 스타일로 전체 파일을 생성할 수 없습니다.

대신 계속해서 충돌이 발생하고 주입을 통해 콘텐츠를 만드는 방법에 대한 예만 출력합니다. 이와 대조적으로 Qwen이나 DeepSeek의 특별 토큰은 정상적으로 처리됩니다."라고 리뷰에 적혀 있습니다.

X의 일부 사용자는 Manus가 사실에 기반한 질문에 답할 때 실수를 했으며, 인터넷에서 쉽게 찾을 수 있는 데이터 출처를 정확한 데이터 출처에 인용하지 못하는 경우도 있다는 것을 발견했습니다.

TechCrunch의 기술 작가인 카일 위거스는 마누스에게 간단한 작업을 수행하도록 요청해 보았지만, 예상과 다른 결과가 나왔습니다. 지역 패스트푸드 레스토랑에서 튀긴 닭고기 샌드위치를 주문하라는 요청을 받았을 때, AI는 10분이 지나고 나서 작동을 멈췄습니다. 두 번째 시도에서 마누스는 메뉴에서 적절한 항목을 찾았지만 주문이나 결제 과정을 완료할 수 없었습니다.

뉴욕에서 도쿄로 가는 항공편을 예약하라는 요청을 받았을 때, 이 AI는 단순히 예약 웹사이트 링크 목록을 반환했습니다. 그 중 일부는 결함이 있습니다. 근처 식당에 테이블을 예약해 달라는 요청도 실패했습니다. 나루토에서 영감을 받은 격투 게임을 프로그래밍하는 작업을 맡았을 때, AI가 실수를 해서 30분이 넘은 후에 작동이 중단되었습니다.