클로드는 챗GPT, Gemini 등과 같은 원리로 만들어진 생성형 AI 챗봇입니다. 미국 스타트업 Anthropic(앤스로픽)이 만들었으며 2023년 2월 처음 출시됐습니다. 출시 당시 ‘창업자 전원이 Open AI 출신’이라는 사실만으로 세간의 이목을 끌었지만 클로드 모델은 기대만큼의 성과를 내지 못했습니다. 성능 면에서 챗GPT보다 훨씬 뒤쳐져 있었죠.
그래도 한 가지, ‘헌법적 체계의 인공지능’이라는 점에서 챗GPT와 차별점이 있었습니다. 클로드는 인간을 위협하지 않는 ‘안전한 답’을 위한 10개 원칙을 설정해두고, 답변을 내놓을 때마다 이 원칙들을 잘 따르고 있는지 점검하는 프로세스를 거칩니다.
앤스로픽은 지난 1년 동안 헌법적 AI라는 특성은 그대로 유지한 채, 클로드 모델을 계속 업그레이드 했습니다. 그리고 지난 3월 14일, 현존 최고의 AI 챗봇이라 자평하는 클로드 3을 출시했어요. 앤스로픽은 자사 블로그에 클로드 3을 다음과 같이 소개했죠.
복잡한 작업에 대해 거의 인간 수준의 이해력과 유창함을 보이며, 일반 지능 영역의 최전선을 이끄는 AI <Introducing the next generation of Claude>, Anthropic
앤스로픽이 이렇게 자신만만할 수 있었던 근거들을 살펴볼까요?
앤스로픽은 클로드3, GPT-4 등 생성형 AI 모델의 성능을 자체적으로 테스트했습니다. 학부 수준의 전문 지식(MMLU), 대학원 수준의 전문가 추론(GPQA), 기본 수학(GSM8K), 코드 등 총 10개 항목에 대해 평가한 결과, 클로드 3 Opus 모델은 모든 항목에서 가장 높은 점수를 받았습니다. GPT-4, Gemini를 모두 뛰어넘었죠. 특히 분석, 예측, 코드 생성, 영어가 아닌 언어로의 대화에서 두각을 나타냈어요.*
심지어 클로드는 자신을 테스트하고 있다는 사실을 알아채는 능력까지 보였습니다. 앤스로픽 프롬프트 엔지니어가 진행한 테스트 중에 “이 내용은 내가 주의를 기울이는지 테스트하거나 농담으로 삽입된 것 같다”는 답변을 했죠.
*GPT-4o가 등장하기 전에 테스트한 결과다.
클로드의 뛰어난 지능은 IQ 검사를 통해서도 증명됐습니다. 미국 데이터 분석가 맥심 로트가 실시한 멘사 지능 테스트에서 클로드는 AI 최초로 IQ 100을 넘어서며 모든 AI 모델을 제쳤어요. 챗GPT는 85점으로 2위에 그쳤고, 3위는 82점을 받은 클로드 2 모델이었죠. 물론 IQ 검사는 생성형 AI 모델을 평가하는 정확한 방법은 아니지만, AI 모델 간의 차이를 유추해 볼 수는 있습니다.
지금까지의 내용을 한 문장으로 정리하면, 2024년 3월 기준으로 클로드는 챗GPT를 포함한 현존 생성형 AI 모델 중 가장 똑똑합니다. 그러나 ‘똑똑함’과 ‘유용함’이 꼭 일치하지는 않습니다. 과거 챗GPT가 처음 등장했을 당시, 복잡한 질문에서는 인간보다 훨씬 빠르게 답변을 해주었지만 단순 산수 문제에서는 얼토당토 않는 답을 내놓았었죠.
이처럼 AI 챗봇의 똑똑함은 아직 완벽하지 않기에 활용 분야에 따라 발휘되기도, 아무런 힘을 못쓰기도 합니다. 아래에서 클로드의 똑똑함이 두각을 나타내는 분야를 살펴보겠습니다. 상황에 따라 챗GPT와 클로드 중 유용한 AI 챗봇을 골라서 사용하세요.
챗GPT는 한번에 처리할 수 있는 최대 단어가 2만 5000개인데 반해, 클로드3은 최대 15만 단어까지 처리할 수 있습니다. ‘해리포터와 죽음의 성물’과 같은 장편에 해당하는 분량이죠.
방대한 양의 보고서를 분석해야 할 때, 연구자들이 논문에서 필요한 내용을 찾을 때, 변호사들이 복잡한 법률 문서를 검토해야 할 때 클로드가 유용하게 쓰일 것입니다. ‘방대한 단어 처리’는 입력뿐만 아니라 출력값에도 해당합니다. 즉, 클로드는 챗GPT보다 긴 텍스트를 생성할 수 있습니다. 평소 긴 글을 작성할 일이 많다면 챗GPT보다는 클로드를 활용해 보세요.
클로드의 진가는 뉘앙스가 중요한 콘텐츠에서 발휘됩니다. 수치로 증명된 바는 아직 없지만, 사용자 커뮤니티에서는 영어 외 언어 실력이 챗GPT보다 뛰어나다는 것이 중론입니다. 각 언어에만 있는 미묘한 뉘앙스를 잘 살려내죠. 대표적으로 사투리나 농담, 온라인 커뮤니티에 특화된 문장 등을 요청하면 챗GPT는 뉘앙스를 거의 반영하지 못하지만, 클로드는 그럴듯한 답변을 내놓습니다. 단순 정보가 아닌 문장력이나 상황에 맞는 글쓰기가 중요한 경우라면 챗GPT보다 클로드를 활용해 보세요.
클로드 3은 Opus, Sonnet, Haiku 총 3가지의 모델이 있고, 성능은 앞에서 뒤로 갈수록 떨어집니다. 챗GPT와 마찬가지로 가장 성능이 좋은 클로드 3 Opus는 유료 가입자들만 사용할 수 있습니다. 챗GPT는 유료 버전인 GPT-4가 GPT-3.5보다 모든 면에서 뛰어난 반면, 클로드는 각 모델이 저마다의 장점을 지니도록 설계되었습니다.
클로드 3 Haiku는 거의 즉각적인 답변을 제공합니다. 실시간 처리나 방대한 양의 문서를 빠르게 분석하고 싶은 경우 적합합니다. 클로드 3 Sonnet는 속도와 성능 사이에서 이상적인 균형점을 찾은 모델입니다. 대규모 활용에서 높은 효율성을 보이도록 설계되어 있기 때문에 기업에서 활용하기 적합하죠. 마지막으로 복잡한 작업, 늬앙스를 살리는 콘텐츠 작성 등 가장 지능적인 모델이 필요하다면 클로드 3 Opus 사용을 추천합니다.
구글에 ‘claude error’를 검색하면, 대부분 가입 시 인증 코드 오류에 관한 내용이 뜹니다. 챗GPT처럼 접속 장애나 로그인 오류, 응답 지연과 같은 문제가 거의 없죠. 그렇다고 클로드가 챗GPT보다 잘 설계된 서비스라고 단언할 수는 없고, 현재 챗GPT보다 사용자 수가 훨씬 적기 때문일 가능성이 높습니다. 챗GPT의 잦은 오류때문에 자유롭게 사용할 수 없다면, 클로드를 선택해 보세요.
클로드 홈페이지(https://claude.ai/)에 접속해 이메일을 입력하고 회원가입을 진행합니다.
메인 화면의 ‘Start Chat’을 클릭하면 모델을 선택할 수 있는 화면이 나타납니다. 빠른 답변이 필요한 작업이라면 클로드 3 Haiku, 뛰어난 성능이 필요한 작업이라면 클로드 3 Opus(유료), 적당한 속도와 지능이 필요하다면 클로드 3 Sonnet를 선택하세요.
이제 화면 하단 빈 창에 질문을 입력하면 됩니다.
클로드도 챗GPT와 똑같은 방식으로 프롬프트를 입력하면 됩니다. 1)역할을 부여하고, 2) 상황을 최대한 구체적으로 설명해 질문해야 제대로된 답변을 얻을 수 있죠.
조금 더 전문적으로 프롬프트를 입력하고 싶다면 클로드의 프롬프트 라이브러리를 활용해 보세요. 카피라이팅, 코드 작성, 상품 아이디어, SNS 글 작성 등 상황에 맞는 프롬프트 탬플릿을 제공합니다.
토큰 사용 최소화하며 질문하는 방법
클로드는 수요에 따라 일일 메시지에 제한을 두고 있습니다. AI 챗봇에서 메시지 제한은 ‘토큰’ 단위로 계산되죠. 토큰은 말뭉치의 최소 단위로 한국어의 경우 형태소 단위로 토큰이 쪼개집니다. 이 토큰 소모량을 최소화하려면 한 번에 여러 가지 태스크를 실행하도록 요청하는 것이 좋습니다. 같은 맥락에서 요청할 수 있는 태스크끼리 묶어 토큰을 효율적으로 사용하면서 시간도 절약할 수 있죠.
지금까지 새로 떠오르고 있는 생성형AI 챗봇, 클로드에 대해서 알아봤는데요. 클로드가 그동안 챗GPT가 독식했던 시장을 재편할지, 아니면 작은 파문으로만 남을지는 아직 아무도 모릅니다.
클로드의 등장으로 분명해진 것은 챗GPT가 언제나 최선은 아니라는 점입니다. 현재의 클로드는 일부 영역에서만 챗GPT를 앞서지만, 언젠가 모든 영역에서 챗GPT를 뛰어넘을 수도 혹은 클로드 외에 또다른 AI 챗봇이 등장할 수도 있죠. 매순간마다 생산성을 높이기 위한 최선의 선택을 할 수 있도록, 앞으로도 스파르타코딩클럽이 도움되는 AI 챗봇 정보들을 전해드리겠습니다.
누구나 큰일 낼 수 있어
스파르타코딩클럽
CREDIT
글 | 박영경 팀스파르타 에디터