- OpenAI o1은 단순 사전학습을 넘어 실시간 추론에 초점을 맞춘 새로운 모델 시리즈(첫 모델은 o1-preview와 o1-mini)입니다.
- o1은 STEM 과제에서 GPT-4o보다 뛰어난 성능을 보이며, IMO 예선에서 83%의 점수를 기록했고, Codeforces에서는 89번째 백분위수에 올랐습니다.
- o1은 체인 오브 쏘트(chain-of-thought) 추론을 기본적으로 사용해, 속도는 느리지만 복잡한 과제에서 훨씬 더 정확합니다.
- o1은 탈옥(jailbreak)이 훨씬 어렵게 설계되어, 공격적 안전성 테스트에서 84/100점을 기록해 GPT-4o의 22점보다 월등합니다.
ChatGPT 팬들의 오랜 추측 끝에, OpenAI의 최신 Strawberry LLM이 공개됐습니다. 하지만 이름은 GPT-5가 아닙니다.
Q*와 Strawberry 같은 암호 같은 코드명으로 불리던 이 최신 모델 시리즈는 마침내 OpenAI o1이라는 이름으로 정해졌습니다.
OpenAI의 새 모델에서 가장 큰 변화는 향상된 추론 능력입니다. OpenAI는 o1이 이전 모델보다 더 오랜 시간 사고하도록 훈련되어 인간 지능에 한층 가까워졌다고 설명했습니다.
OpenAI o1이란 무엇인가요?
OpenAI o1은 2024년 9월 12일에 공개된 OpenAI의 최신 대형 언어 모델 시리즈로, 현재 o1-preview와 o1-mini 두 가지 모델이 포함되어 있습니다.
o1과 기존 모델의 가장 큰 차이점은 고도화된 추론 능력입니다. 아직 전체 버전이 출시되진 않았지만, 프리뷰와 미니 모델만으로도 수학, 과학, 코딩 테스트에서 GPT-4o를 압도합니다.
OpenAI o1 모델 종류
9월 출시에는 o1-preview와 o1-mini 두 가지 모델이 포함되었습니다. 이들은 OpenAI가 새로운 LLM을 계속 개선하며 추가로 공개할 첫 모델입니다.
차이점은? o1-mini는 더 작고, 프리뷰 모델보다 80% 저렴합니다. 고급 추론이 필요하지만 폭넓은 지식이 필요하지 않은 작업에 적합하며, 코딩이나 수학 과제에 특히 잘 맞습니다.
OpenAI o1의 지능은 어느 정도인가요?
OpenAI는 o1의 추론 능력을 보여주는 다양한 STEM 벤치마크 결과를 공개했습니다. 예를 들면:
- 물리, 화학, 생물학 벤치마크 테스트에서 박사과정 학생과 비슷한 성과를 보임.
- 미국 수학 올림피아드 예선에서 미국 상위 500위 학생에 해당하는 성적 기록.
- 코딩 대회인 Codeforces에서 89번째 백분위수에 진입.
o1의 추론 능력에 대한 자세한 내용은 OpenAI의 연구 발표에서 확인할 수 있습니다.
연쇄적 사고 추론이란 무엇인가요?
o1 모델은 체인 오브 쏘트 추론을 사용합니다. 이는 요청을 더 길고 꼼꼼하게 단계별로 분석하는 방식입니다.
o1 모델에 프롬프트를 주면 즉시 답하지 않고, 각 단계를 논리적으로 차근차근 따져봅니다. 각 정보와 그 의미를 신중히 고려한 뒤 다음 행동을 결정하며, 전체 과정을 모두 사고한 뒤에야 답변을 제공합니다. 그래서 응답 시간이 길어집니다.
o1은 GPT-4o와 어떻게 다른가요?
1) 추론 능력
o1의 일반 지능의 핵심은 새로운 추론 능력입니다. Altman은 Gates와의 대화에서 “아마도 가장 중요한 진보는 추론 능력에 있을 것”이라며, “현재 GPT-4는 매우 제한적으로만 추론할 수 있다”고 밝혔습니다.
추론은 인간에게도 어려운 영역입니다. OpenAI o1은 이를 처음으로 본격적으로 구현한 모델입니다.
o1 모델은 사전학습 데이터에 의존하지 않고 실시간으로 추론할 수 있습니다. 이 때문에 과학, 수학, 코딩 과제에서 이전 OpenAI 모델보다 뛰어납니다.
2) 탈옥이 더 어려움
LLM의 인기가 높아지고 강력해지면서 안전성 문제가 커지고 있는데, OpenAI는 o1 시리즈 개발 과정에서 미국과 영국의 AI 안전 연구소, 미국 정부와 협력해 보안에 집중했습니다.
중요한 진전으로, o1 시리즈는 이전 모델보다 탈옥(안전장치 우회)이 훨씬 어렵습니다.
가장 어려운 탈옥 테스트 중 하나에서 o1-preview는 100점 만점에 84점을 받았고, GPT-4o는 22점에 그쳤습니다.
3) 새로운 명명 규칙
새 모델의 이름이 가장 흥미로운 변화는 아니지만, 의도적으로 의미 있는 변화입니다.
OpenAI o1은 'GPT'라는 이름을 처음으로 벗어났습니다. 이는 회사가 '사전학습 패러다임'에서 '추론 패러다임'으로 전환하는 첫 단계임을 의미합니다.
새 모델은 사전학습 데이터에 의존하지 않고 실시간으로 사고하는 데 시간을 씁니다.
4) STEM 문제 해결 능력 향상
추론 능력이 좋아지면 수학 실력도 향상됩니다.
o1과 GPT-4o 모두 국제 수학 올림피아드 예선 문제를 풀도록 요청받았습니다. GPT-4o는 13%를, o1은 83%를 해결했습니다.
5) 더 긴 대기 시간
실시간 추론은 학습 데이터 참고 및 응답 생성보다 시간이 더 걸립니다. OpenAI o1-preview에 질문하면 다른 모델에 비해 대기 시간이 훨씬 길어집니다.
하지만 추론을 외부에 맡길 수 있다는 점에서, 이 정도의 대가는 감수할 만합니다. 시리즈의 다음 모델이 출시되면 속도도 개선될 전망입니다.
누가 o1을 사용할 수 있나요?
9월 12일부터 ChatGPT Plus 및 Team 사용자는 ChatGPT에서 o1 모델을 이용할 수 있습니다.
OpenAI는 o1-mini를 무료 사용자에게도 제공할 예정이나, 구체적인 일정은 아직 공개되지 않았습니다.
현재 주간 메시지 제한은 o1-preview가 30회, o1-mini가 50회이지만 곧 상향될 예정입니다.
o1은 어떤 용도로 사용해야 하나요?
o1의 강화된 추론 능력은 수학, 과학, 코딩 등 복잡한 문제 해결에 특히 유용합니다. OpenAI의 설명에 따르면:
OpenAI o1의 한계점
프리뷰 단계인 이 모델은 아직 GPT-4o의 모든 기능을 갖추지 못했습니다. 웹에서 정보를 검색하거나 파일·이미지 업로드 기능이 필요하다면, o1의 후속 모델이 나올 때까지는 GPT-4o를 사용해야 합니다.
OpenAI o1 프롬프트 작성법
o1의 향상된 추론 능력 때문에, OpenAI의 프롬프트 작성 권장사항도 이전 모델과 달라졌습니다.
프롬프트는 간단하게 작성하세요. o1은 똑똑한 모델이므로 GPT-4 시리즈만큼 자세한 안내가 필요하지 않습니다. 체인 오브 쏘트 입력은 피하세요 – 이미 내부적으로 추론하고 있습니다.
GPT 기반 AI 에이전트 구축
AI 에이전트가 OpenAI의 모든 업데이트와 자동으로 동기화된다면 어떨까요?
Botpress는 완전히 개방적이고 확장 가능한 AI 에이전트 플랫폼입니다. 개발자는 이 플랫폼을 통해 어떤 기능이든, 어떤 워크플로우든 챗봇과 AI 에이전트를 구축할 수 있습니다.
저코드 설정부터 무한한 커스터마이징과 확장성까지 지원하는 유일한 플랫폼인 Botpress는 챗봇에 최신 GPT 버전의 성능을 자동으로 적용할 수 있게 해줍니다 – 별도의 작업 없이도 가능합니다.
지금 바로 시작하세요. 무료입니다.
자주 묻는 질문
1. “o1”은 무엇의 약자인가요? 앞으로 o2, o3처럼 이름이 붙나요?
“o1”은 “OpenAI 1”을 의미하는 것으로 보이며, 새로운 모델 패밀리의 시작을 알립니다. 이를 바탕으로, 앞으로 “o2”, “o3” 등 순차적으로 이름이 붙을 것으로 예상됩니다.
2. OpenAI가 “GPT” 명명 방식을 버린 이유는 무엇인가요?
OpenAI는 “GPT”에서 “o1”로 명명 방식을 바꿨습니다. 이는 일반 사전학습 언어 모델에서 실시간 추론과 상호작용에 최적화된 모델로 초점을 전환했음을 알리기 위함입니다.
3. OpenAI o1은 GPT-4의 후속작인가요, 아니면 완전히 새로운 제품군인가요?
OpenAI o1은 GPT-4의 직접적인 후속작이 아니라, 실시간 추론과 효율성에 초점을 맞춘 새로운 제품군의 시작입니다. 다만, GPT-4 및 GPT-4o의 발전을 바탕으로 개발되었습니다.
4. o1이 GPT-4보다 다국어 입력을 더 잘 처리하나요?
OpenAI는 o1과 GPT-4의 다국어 성능을 공식적으로 비교하지 않았지만, o1이 추론과 최신 기능에 최적화되어 있어 앞으로의 버전에서는 다국어 입력 처리 능력이 더 향상될 가능성이 있습니다.
5. o1이 무료 사용자에게 언제 일반 공개되나요?
OpenAI는 무료 이용자에게 'o1-mini'라는 버전이 출시될 예정임을 확인했지만, 현재까지 공식적인 일반 출시 날짜는 발표되지 않았습니다.





.webp)
