몇 달간의 추측 끝에 OpenAI의 최신 스트로베리 LLM 릴리스가 출시되었지만 GPT-5라고 부르지 않습니다.
이전에는 Q*, Strawberry와 같은 비밀스럽고 흥미로운 코드명으로 불렸던 최신 모델 시리즈가 마침내 OpenAI o1이라는 이름으로 확정되었습니다.
OpenAI 새 모델의 가장 큰 업데이트는 향상된 추론 능력입니다. OpenAI o1은 이전 모델보다 더 많은 시간을 생각하도록 훈련되어 인간의 지능에 더 가까워졌다고 설명합니다.
OpenAI o1이란 무엇인가요?
OpenAI o1은 OpenAI 에서 2024년 9월 12일에 출시한 최신 대형 언어 모델 시리즈로, 현재 o1-preview와 o1-mini의 두 가지 모델로 구성되어 있습니다.
o1과 이전 모델의 가장 큰 차이점은 고급 추론 기능입니다. 아직 정식 버전이 출시되지는 않았지만 프리뷰와 미니 모델은 이미 수학, 과학, 코딩 테스트에서 GPT-4o를 뛰어넘었습니다.
OpenAI O1 모델
9월 출시에는 o1-프리뷰와 o1-미니 두 가지 모델이 포함되었습니다. 이 모델들은 OpenAI 에서 새로운 LLM 을 개선하면서 계속 출시될 일련의 모델 중 첫 번째 모델입니다.
차이점은 무엇인가요? o1-mini 모델은 프리뷰 모델보다 더 작고 80% 저렴합니다. 고급 추론이 필요하지만 광범위한 지식이 필요하지 않은 작업을 위해 제작되었습니다. 코딩이나 수학이 필요한 작업에 완벽하게 적합합니다.
OpenAI o1은 얼마나 스마트한가요?
OpenAI 는 다음을 포함하여 o1의 추론 능력을 보여주는 STEM 벤치마크 목록을 선전했습니다:
- 물리학, 화학, 생물학에 대한 벤치마크 테스트에서 박사 과정 학생과 비슷한 성과를 보였습니다.
- 미국 수학 올림피아드 미국 예선에서 상위 500위 안에 드는 학생.
- 경쟁 코딩 테스트인 코드포스에서 89번째 백분위수 순위에 올랐습니다.
o1의 추론 능력에 대한 자세한 내용은 OpenAI 의 연구 자료에서 확인할 수 있습니다.
연쇄 사고 추론이란 무엇인가요?
o1 모델은 요청을 세분화하는 더 길고 철저한 방법인 연쇄적 사고 추론을 사용합니다.
O1 모델에 프롬프트가 주어지면 즉시 응답하지 않으므로 대기 시간이 길어집니다. 대신, 각 단계별로 추론하여 각 정보와 그 의미를 신중하게 고려한 후 다음 행동 방침을 결정합니다. 질문에서 요구되는 일련의 모든 단계를 모두 고려할 때까지 답변을 제공하지 않습니다.
o1은 GPT-4o와 어떻게 다른가요?
1) 추론 능력
일반 지능의 중심에는 o1의 새로운 추론 능력이 있습니다. "아마도 가장 중요한 발전 영역은 추론 능력일 것입니다."라고 알트먼은 게이츠와 의견을 나눴습니다. "현재 GPT-4는 극히 제한된 방식으로만 추론할 수 있습니다."
추론은 어려운 것으로 악명이 높습니다. 인간에게도 말이죠. 그리고 OpenAI o1은 이를 최초로 주장한 모델입니다.
o1 모델은 사전 학습 데이터에 의존하지 않고 실시간으로 추론할 수 있습니다. 그렇기 때문에 새 모델은 이전 모델( OpenAI )보다 과학, 수학, 코딩 작업에 더 효과적입니다.
2) 탈옥하기 더 어려워짐
LLMs 의 인기와 영향력이 커지면서 안전에 대한 우려가 커지고 있는 가운데, 보안은 OpenAI의 최근 개발의 핵심 초점이었습니다. 이 회사는 o1 시리즈를 개발하는 동안 미국 및 영국 AI 안전 기관과 파트너십을 맺고 미국 정부와 협력하여 실사를 진행했습니다.
중요한 진전으로, O1 시리즈는 이전 모델보다 탈옥(안전 조치 우회)이 훨씬 더 어렵습니다.
가장 어려운 탈옥 테스트 중 하나에서 o1-preview 모델은 100점 만점에 84점을 받은 반면, GPT-4o는 22점이라는 저조한 점수를 받았습니다.
3) 새로운 이름 지정 규칙
새로운 이름( OpenAI LLM )이 가장 흥미로운 것은 아니지만, 의도적으로 의미 있는 변화를 시도한 것입니다.
OpenAI O1은 'GPT'라는 명칭을 버린 최초의 모델로, 이전 모델들이 '사전 학습 패러다임'의 일부였던 반면, 새로운 '추론 패러다임'의 첫 번째 단계라고 회사 측은 주장하고 있습니다.
새로운 모델은 사전 학습 데이터에 의존하지 않고 실시간으로 추론하는 데 시간을 소비합니다.
4) STEM 문제 해결 능력 향상
추론 능력이 향상되면 수학 실력도 향상됩니다.
o1과 GPT-4o는 모두 국제 수학 올림피아드 예선 시험을 보도록 요청받았습니다. GPT-4o는 13%의 문제를 풀었고, o1은 83%의 문제를 풀었습니다.
5) 더 긴 대기 시간
실시간으로 추론하는 것은 학습 데이터를 참조하고 응답을 생성하는 것보다 시간이 오래 걸립니다. OpenAI o1-preview에 질문하면 다른 모델에 비해 훨씬 더 오래 기다리게 됩니다.
하지만 추론을 아웃소싱할 수 있다는 점을 고려하면 작은 대가를 치르는 셈입니다. o1 모델의 속도는 시리즈의 다음 모델이 출시되면 개선될 가능성이 높습니다.
누가 o1을 사용할 수 있나요?
9월 12일부터 ChatGPT Plus 및 Team 사용자는 ChatGPT 에서 o1 모델에 액세스할 수 있습니다.
OpenAI 는 정확한 날짜는 밝히지 않았지만 무료 사용자들에게도 o1-mini를 제공할 것이라고 발표했습니다.
현재 주간 요금 한도는 01-프리뷰의 경우 30개, o1-미니의 경우 50개이지만 곧 늘어날 예정입니다.
O1을 어떤 용도로 사용해야 하나요?
o1의 향상된 추론 기능은 수학, 과학, 코딩의 복잡한 문제를 푸는 데 특히 유용합니다. OpenAI 에서 설명합니다:
OpenAI o1의 제한 사항
미리보기 버전으로, 이 모델에는 아직 GPT-4o의 모든 기능이 포함되어 있지 않습니다. LLM 을 사용하여 웹에서 정보를 검색하거나 파일 또는 이미지를 업로드하려면 이후 o1 모델이 출시될 때까지 GPT-4o를 사용해야 합니다.
문의 방법 OpenAI o1
OpenAI의 프롬프트 제안은 향상된 추론 기능으로 인해 이전 모델과 비교하여 o1에서 변경되었습니다.
프롬프트를 단순하게 유지하세요. 스마트 모델이므로 GPT-4 시리즈만큼 많은 안내가 필요하지 않습니다. 즉, 모델이 이미 내부적으로 추론하고 있으므로 일련의 생각 입력을 피하세요.
GPT- 기반 AI 에이전트 구축
AI 에이전트가 모든 OpenAI 업데이트와 자동으로 동기화되면 어떻게 되나요?
Botpress 는 완전히 개방적이고 확장 가능한 AI 에이전트 플랫폼입니다. 개발자는 stack 에서 모든 워크플로우에 걸쳐 모든 기능을 갖춘 챗봇과 AI 에이전트를 구축할 수 있습니다.
간단한 코드 설정부터 무한한 사용자 지정 및 확장성까지 제공하는 유일한 플랫폼인 Botpress 을 사용하면 별도의 노력 없이도 최신 GPT 버전의 강력한 기능을 챗봇에 자동으로 적용할 수 있습니다.
↪CF_200D↩오늘 구축 시작하기. 무료입니다.