비지도 학습은 인간이 정답을 주지 않아도 방대한 양의 데이터를 통해 스스로 진행하는 학습을 뜻합니다. 언어 모델은 인터넷에 존재하는 기사, 전자책, SNS 포스팅, 블로그 등의 다양한 경로를 통해 데이터를 수집합니다. 수집한 데이터를 기반으로 최적의 답을 찾아 응답하는 것이죠.
GPT-4.5는 모델이 스스로 학습할 수 있는 데이터 양과 연산 능력을 늘려 비지도 학습 능력을 강화했습니다. OpenAI는 GPT-4.5가 비지도 학습의 최전선에 있는 모델이라고 소개하죠. 더 나은 비지도 학습을 통해 성능이 어떻게 개선되었을까요?
GPT-4.5는 비지도 학습을 통해 세계에 대해 더 잘 알게 되었습니다. 세계에 대한 광범위한 지식으로 더 정확한 응답이 가능해졌죠. OpenAI에서 진행한 SimpleQA* 정확도 측정에서 GPT-4.5는 62.5%의 정확도를 보였습니다. GPT-4o는 38.2%에 불과하면 굉장히 높은 수치입니다. GPT-4o에서 추론 기능을 확대한 OpenAI o1와 비교해 봐도 15%p 높죠.
인공지능이 잘못된 응답을 생성하는 것을 AI 할루시네이션이라고 합니다. GPT-4.5는 비지도 학습을 통해 환각률을 낮췄죠. SimpleQA 환각률 측정에서는 37.1%의 환각률을 보였는데요. GPT-4o는 61.8%, OpenAI o1은 44%로, 이에 비해 현저히 낮은 수치를 기록했습니다.
아래 이미지에서 볼 수 있듯이, GPT-4.5는 ‘함대에 불을 지르는 트로이 여인들’, GPT-4o는 ‘함대에 불태우는 크니도스의 여인들’이라고 응답했는데요. GPT-4o의 대답도 그럴듯하지만, 옳은 답은 아니었습니다. GPT-4.5는 더욱 정확하게 제목을 알려주죠.
*SimpleQA: 간단하지만 도전적인 지식 문제로, LLM의 사실성을 측정한다.
🤔 GPT-4.5와 OpenAI o1 모델은 어떤 점이 다를까?
1. 학습 방식
GPT-4.5는 비지도 학습을 통해 대량의 텍스트 데이터를 익히며, 확률적으로 문장을 생성합니다. 반면, o1은 추론 기반 모델로, 사전에 학습된 정보를 바탕으로 논리적인 답을 도출하죠. 다시말해, GPT-4.5는 문맥을 예측해 자연스럽게 글을 쓰는 데 강하고 o1은 정확한 정보를 찾아주는 역할을 합니다.
2. 목적
GPT-4.5는 창의적인 글쓰기, 번역, 요약 등 자연어 생성에 특화되어 있습니다. o1은 논리적 추론과 정확한 정보 제공을 목표로 하며, 사실 검증이나 분석에 강합니다.
이전 GPT 응답을 살펴보면, ‘AI다운’ 응답을 종종 받곤 했죠. 예를 들어 위로를 바라는 메시지에 과도하게 많은 정보성 대답이 돌아온 것처럼요. 그에 비해 GPT-4.5는 인간이 의미하는 바를 더 잘 이해하고 미묘한 단서나 암묵적인 기대를 더 큰 뉘앙스와 ‘EQ*’로 해석합니다. 광범위한 정보를 제공할 때와 추가 대화를 요청할 때를 잘 알게 된 것이죠.
*EQ: Emotional intelligence, 감정 지능
더 강력한 미적 직관과 창의성을 갖춰, 글쓰기와 디자인을 돕는 데 초점이 맞춰져 있습니다. 인간이 직접 참여한 테스트에서도 GPT-4o에 비해 GPT-4.5를 선호하는 쿼리의 비율이 높았습니다.
GPT-4.5와 GPT-4o의 성능을 비교했습니다. 모든 부분에서 GPT-4.5 모델이 더 나은 수치를 보이는 것을 볼 수 있죠.
GPT-4.5는 현재 ChatGPT Pro, Plus, Team 사용자가 사용할 수 있는데요. 3월 중순 안으로 Enterprise 및 Edu 사용자까지 사용 범위를 늘릴 예정입니다.
새로운 GPT, GPT-4.5의 성능을 요약하여 알려드렸습니다. 사람의 감정까지 헤아릴 수 있게 된 AI, 앞으로는 어떻게 발전하게 될까요?