지난 13일. 구글의 연례 개발자 콘퍼런스 하루 전이죠. 오픈 AI가 기습적으로 챗GPT의 새 모델을 공개했습니다.
새 모델의 이름은 GPT-4o(지피티 포오라고 읽습니다😁). 여기서 ‘o’는 “모든”, “전체의”라는 뜻을 전달하는 접두사인 ‘Omni’의 약자인데요, GPT-4o가 텍스트뿐만 아니라 이미지, 음성 등 ‘모든’ 형태의 입력을 이해하고 처리할 수 있는 능력이 있다는 걸 강조하려는 의도가 담긴 이름입니다.
사람처럼 보고 듣고 말할 수 있는 인공지능의 등장이라니. 많은 분들이 영화 <HER>을 떠올리셨을 텐데요, 이를 의식하기라도 한 듯 오픈 AI의 CEO인 샘 알트먼은 발표가 끝난 뒤에 X(구 트위터)에 ‘her’이라는 메시지를 남겼습니다.
자, 그럼 지금 테크 업계에서 가장 뜨거운 감자인 GPT-4o에 대해서 보다 자세히 살펴볼까요?
목차
새 모델이 등장했으니 이전 모델인 GPT-4와의 차이점을 한번 비교해 봐야겠죠? 오픈AI 공식 사이트의 설명에 따르면, “GPT-4o는 가장 빠르고 저렴한 모델, GPT-4는 이전의 고지능 모델입니다.” 이렇게만 봐서는 감이 잘 안 오는데요. 둘의 차이점을 보다 이해하기 쉽게 정리해 봤습니다.
더 사람 같다 : 위에서도 언급했듯이, 가장 중요한 차이는 GPT-4o가 보고, 듣고, 말할 수 있다는 것입니다. 핸드폰 카메라를 통해서 사람의 표정을 읽을 수 있고, 사람과 대화하는 것과 유사한 속도로 대화를 할 수 있습니다. (GPT-4o는 232밀리 초안에 응답할 수 있는데, 이건 인간끼리 대화가 오가는 속도랑 비슷한 수치라고 해요.)
더 빠르다 : GPT-4o의 응답 속도는 GPT-4 Turbo보다 2배 빠릅니다. 지능은 비슷한 수준이라고 합니다. 비유하자면 아이큐는 비슷한데, 일머리는 더 좋은 것이죠. 답변을 생성하는데 드는 컴퓨팅 비용도 50% 정도 더 저렴하다고 합니다.
한국어도 잘 한다 : 기존 GPT 이용자라면 한국어로 질문했을 때와 영어로 질문했을 때 답변의 속도와 퀄리티가 현저히 차이 난다는 걸 알고 계셨을 텐데요, GPT-4o는 영어 외 언어 능력도 개선됐다고 합니다. 직접 한국어로 질문을 해봤는데 답변의 퀄리티는 여전히 영어로 질문했을 때만 못하지만, 답변 속도는 확 체감될 만큼 빨라졌더라고요.
그럼 이번엔 챗GPT-4o와 음성으로 대화하는 방법을 살펴볼까요.
1.먼저, ChatGPT 앱을 스마트폰에 설치합니다. 앱은 iOS와 Android에서 모두 사용할 수 있습니다.
2.앱을 설치한 후, OpenAI 계정으로 로그인합니다.
3.음성 대화를 시작하려면 화면 하단의 헤드폰 아이콘을 탭 합니다.
4.질문을 하면, ChatGPT가 응답합니다. 대화는 자동으로 진행되며, 따로 터치하지 않아도 대화할 수 있습니다.
Chat-GPT 앱을 스마트폰에 설치하고, 로그인하고, 하단의 헤드폰 아이콘을 탭 하기만 하면 끝이라니, 정말 간단하죠? 사용방법은 다음 링크에서 동영상으로도 확인하실 수 있어요.
5월 17일 오전 기준으론, 한국에서는 유료 플랜 사용자만 사용할 수 있습니다. 공식 사이트에서는 무료 플랜에서도 GPT-4o를 사용할 수 있다고 밝히고 있지만, 아무래도 지역에 따라 적용 시점에 차이가 있는 것 같네요😅
오픈AI의 CEO 샘 알트먼은 GPT-4o 공개 이후 블로그에 남긴 글에서 GPT-4o에 대해서 두 가지 포인트를 강조했습니다. 첫 번째는 무료라는 것(아직 한국에서는 유료 버전에서만 사용할 수 있긴 하지만)이고, 두 번째는 GPT-4o가 컴퓨터와 인간이 상호작용하는 새로운 방식이라는 것입니다.
첫째, 우리 임무의 핵심 부분은 매우 유능한 AI 도구를 사람들의 손에 무료로(또는 저렴한 가격으로) 제공하는 것입니다. 광고나 그와 유사한 것 없이 ChatGPT에서 세계 최고의 모델을 무료로 사용할 수 있게 된 것을 매우 자랑스럽게 생각합니다.
...(중략)둘째, 새로운 음성(및 비디오) 모드는 제가 사용해 본 최고의 컴퓨터 인터페이스입니다. …컴퓨터와 대화하는 것이 나에게는 결코 자연스럽지 않았습니다. 이제는 그렇습니다.
-샘 알트먼(오픈AI CEO)
인터페이스의 변화는 혁신의 역사와 궤를 같이합니다. 그래픽 사용자 인터페이스(GUI)는 PC의 시대를 열었고, 아이폰의 터치스크린은 모바일 시대를 열었죠. ‘모두가 무료로 접근 가능한, 사람 같은 인공지능’인 GPT-4o는 과연 새로운 시대를 열 수 있을까요? 그 새로운 시대는 과연 어떤 모습일까요?
스파르타코딩클럽이 준비한 이야기, 재밌으셨나요?
AI가 가져올 미래에 대해서 어떤 예측도 섣불리 하기 어려운 불확실성의 시대지만, 이 변화를 피할 수 없다는 것 하나만큼은 분명해 보입니다.
스파르타코딩클럽은 이 변화에 더 많은 사람들이 참여할수록 위험은 줄고, 재밌는 일들은 더 많이 생겨날 거라고 믿고 있어요. 인공지능이 세상에 가져오는 변화가 모두의 삶을 나은 방향으로 개선시킬 수 있도록, 지금 서 있는 위치에서 할 수 있는 일을 계속 고민할게요. 또 소식 전하겠습니다 :)
누구나 큰일 낼 수 있어
스파르타코딩클럽
👉인공지능 활용법을 배우고 싶으신가요? AI/GPT강의 모아보기
👉AI 임직원 교육, 기업 맞춤형으로 제공받기
참고한 사이트
https://blog.samaltman.com/gpt-4o
https://help.openai.com/en/articles/7102672-how-can-i-access-gpt-4-gpt-4-turbo-and-gpt-4o
https://openai.com/index/hello-gpt-4o/
https://platform.openai.com/docs/models
Editor | 이상우