따라서 테스트한 인공 지능 모델 중 가장 성능이 좋은 OpenAI의 GPT-4-Turbo 활용 프로필을 전체적으로 활용하고 번역하고 79%에 성공하고, 종종 현실적인 인물이나 사건에 대한 "환각"을 실현했습니다.
"그런 수준의 뛰어난 성과는 절대 용납할 수 없습니다." 라고 패스트로누스 AI의 공동 우월한 아난드 카나판이 표시됩니다. "자동화가 실제 운영에 적용되려면 진짜 훨씬 더 높아야 합니다."
연구 결과는 금융과 같이 반대하는 것이 농민 산업 분야의 계열이 고객 서비스나 연구와 같은 운영에 최첨단 기술을 통합하고자 할 때 AI 모델이 직면하는 몇 가지 과제를 강조합니다.
금융 데이터 "환상"
ChatGPT가 팬텀 말에 복귀된 것으로, 주요 숫자를 빠르게 추출하고 그 외에 제표 분석을 수행하는 기능은 챗봇의 가장 유망한 응용 분야 중 하나로 통합되어 있습니다.
SEC 제출에는 중요한 데이터가 인증 요약 또는 질문에 빠른 금융 업계에서 우수한 것을 점할 수 있습니다.
블룸버그 LP는 금융 데이터를 자체적으로 AI 모델을 개발했으며, 경영대학원 교수들은 ChatGPT가 금융 헤드라인을 분석할 수 있는지 연구해 왔습니다.
지금, JP모건은 AI 기반 자동 투자 도구도 개발하고 있습니다. 맥킨지의 향후 전망에 따라, 생성적 AI는 은행업을 연간 수조 달러 규모로 성장시킬 수 있습니다.
하지만 아직 길이가 멉니다. OpenAI GPT GPT Bing Chat Bing Chat Bing Chat빠르게 요약했습니다. 전문가들은 AI가 내 연결 부분을 포함하고 있도록 하기 위해 블록을 알아냈습니다.
같은 데이터, 다른 답변
LLM을 실제 제품에 통합하는 데 있어 어려운 점 중 하나는 없다고 생각하지 않는다는 것입니다. 즉, 동일한 결과를 입력할 수 없습니다. 따라서 기업은 AI가 올바르게 작동하고, 테마에서 벗어나는 것과 관련된 결과를 제공할 수 있는지 확인하기 위해 더욱 더 테스트를 수행해야 합니다.
SEC 제출 자료에서 추출한 1만 개 이상의 질문과 답변으로 구성된 FinanceBench라는 데이터 세트를 구축했습니다. 이 데이터 세트에는 원본과 함께 해당 파일에서 원본을 찾을 수 있는 위치 정보도 포함되어 있습니다.
모든 답을 글에서 직접 얻을 수 있는 것은, 일부 질문에는 부담이나 가벼움이 필요합니다.
Open AI 4 모델이 포함되었습니다.
그 결과, GPT-4-Turbo는 SEC의 기본 제출물에 권한을 부여받았을 때, 사람이 AI가 답을 찾을 수 있도록 마우스로 텍스트를 제한하는 전투고 전투가 그쳤을 때(데이터에 접근할 수 있는 경우와 88%).
Meta가 개발한 오픈 소스 AI 모델인 Llama 2는 "환각"이 가장 많았고, 기본의 일부에 접근했을 때 70%의 답변을 틀렸을 때, 단 19%만 맞췄습니다.
Anthropic의 Claude 2는 관련 SEC 제출 자료의 거의 전체가 질문과 포함된 "긴 부분"에서 좋은 성과를 얻었습니다. 현재 질문에 75%가 답변하였고, 21%는 오답, 3%는 답변을 받았습니다. GPT-4-Turbo 또한 긴 플레이에서 좋은 성과를 보였으며, 질문의 79%에 번역을, 17%에 대한 답변을 기록했습니다.
(CNBC에 따르면)
빅테크 기업들의 AI 스타트업 투자 경쟁
AI 기술, 전자상거래 시작에 혁신을 일으키다
AI, 변환하는 데 성공했습니다.
[광고_2]
원
댓글 (0)