알파벳(Alphabet Inc.)의 자회사인 구글은 4월 4일 자사의 인공지능(AI) 모델을 훈련하는 데 사용하는 슈퍼컴퓨터에 대한 새로운 세부 정보를 공개하면서, 이러한 시스템이 경쟁사인 엔비디아(Nvidia Corp.)의 동급 시스템보다 더 빠르고 에너지 효율성이 높다고 강조했습니다.
구글은 텐서 프로세싱 유닛(TPU)이라는 애플리케이션별 집적 회로를 개발했습니다. 이는 구글의 4세대 TPU입니다. 구글은 AI 학습의 90% 이상에 이 칩을 사용합니다. AI 학습은 모델에 데이터를 입력하여 사람처럼 텍스트 질의에 답하거나 이미지를 생성하는 등의 작업에 유용하게 만드는 과정입니다.
같은 날 출간된 과학 저널에서 구글은 4,000개가 넘는 칩을 연결하여 슈퍼컴퓨터를 구성한 방법을 자세히 설명했는데, 여기에는 컴퓨터를 연결하는 데 도움이 되는 광학 스위치가 직접 개발되었습니다.
이러한 연결 개선은 AI 슈퍼컴퓨터 기업 간 경쟁의 핵심 요소입니다. 구글의 Bard나 OpenAI의 ChatGPT 챗봇과 같은 최첨단 기술을 구동하는 다국어 합성곱 모델이 단일 칩에 담기에는 너무 커지고 있기 때문입니다. 이러한 대규모 언어 모델은 수천 개의 칩에 저장된 후 몇 주 이상에 걸쳐 통합되어 지능형 정보 처리 모델을 학습시킵니다.
지금까지 가장 포괄적인 다국어 모델인 Google의 PaLM은 4,000개 칩을 탑재한 슈퍼컴퓨터 2대에서 50일 이상 학습되었습니다.
구글은 자사의 슈퍼컴퓨터가 칩 간 연결을 더 빠르고 쉽게 재구성하여 문제를 방지하고 성능 향상을 위한 조정을 가능하게 한다고 밝혔습니다. 이 슈퍼컴퓨터는 A100 칩을 기반으로 개발되어 4세대 TPU와 동시에 출시된 엔비디아의 동급 시스템보다 1.7배 빠르고 1.9배 더 에너지 효율적입니다.
슈퍼컴퓨터의 세부 사항은 이제 막 공개되었지만, 이 최첨단 시스템은 2020년부터 미국 오클라호마주 메이스 카운티에 있는 구글 데이터 센터에 배치되어 있습니다.
구글은 스타트업 미드저니(Midjourney)가 구글의 슈퍼컴퓨터를 사용해 자사 모델을 훈련시켰으며, 이 모델은 텍스트 형태의 몇 단어로 구성된 요청에 따라 새로운 이미지를 생성한다고 덧붙였습니다.
VNA
[광고_2]
원천
댓글 (0)