오픈AI는 새로운 인공지능(AI) 추론(reasoning) 모델 ‘o3-mini’를 출시했다고 1일(현지시각) 밝혔다. 해당 모델은 오픈AI의 추론 모델 계열인 ‘o’ 시리즈의 최신작으로, 강력하면서도 저렴한 것이 특징이다.
오픈AI에 따르면, 일반적인 대형 언어 모델과 달리, o3-mini는 답변을 제공하기 전 스스로 사실 검증을 수행한다. 이를 통해 AI 모델이 흔히 겪는 오류를 줄이는 것이 가능하다는 설명이다. 오픈AI는 o3-mini가 수학, 코딩, 과학(STEM) 문제 해결에 최적화됐으며, 기존 o1 시리즈(o1 및 o1-mini)와 유사한 성능을 보이면서도 속도가 빠르고 비용이 낮다고 강조했다.
오픈AI는 “외부 테스트에서 사용자들은 o3-mini의 답변을 o1-mini보다 더 선호한 것으로 나타났다”면서 “오픈AI는 o3-mini가 어려운 현실 문제에 대한 A/B 테스트에서 o1-mini보다 주요 오류 발생률을 39% 줄였다”고 밝혔다. 응답 속도는 평균적으로 24% 빨라졌으며, 보다 명확한 답변을 제공하는 것으로 평가됐다.
o3-mini는 챗GPT를 통해 즉시 이용할 수 있다. 챗GPT 플러스 및 팀(Team) 요금제 사용자는 하루 150회의 요청이 가능하다. 챗GPT 프로(Pro) 사용자는 무제한으로 사용할 수 있으며, 챗GPT 엔터프라이즈(Enterprise) 및 챗GPT 교육(Edu) 버전에서는 일주일 후부터 제공될 예정이다.
또 오픈AI는 개발자를 위해 o3-mini의 API도 제공한다고 밝혔다. API를 통해 사용자는 ‘낮음’, ‘중간’, ‘높음’ 3단계로 추론 강도를 조절할 수 있다. 모델의 가격은 100만 입력 토큰당 0.55달러, 100만 출력 토큰당 4.40달러로 책정됐다. 이는 o1-mini 대비 63% 저렴한 수준이다.
특히 오픈AI는 o3-mini가 특정 테스트에서 중국 AI 기업 딥시크의 R1 추론 모델을 능가한다고 주장했다. 예를 들어, AI의 복잡한 지시 이해 능력을 측정하는 AIME 2024 테스트에서 o3-mini는 R1보다 높은 점수를 기록했다. 하지만 박사 수준의 물리·생물·화학 문제를 다루는 GPQA 다이아몬드(Diamond) 테스트에서는 R1이 우위를 보인 것으로 나타났다.
오픈AI는 “o3-mini는 비용과 성능의 균형을 갖춘 모델”이라며 “중간 수준의 추론 강도로 설정할 경우 o1과 동등한 성능을 유지하면서도 더 빠른 응답 속도를 제공한다”고 설명했다.
이밖에 오픈AI는 o3-mini가 기존 o1 시리즈보다 더 안전하다고 강조했다. 회사 측은 “모델이 응답을 생성할 때 오픈AI의 안전 정책을 고려하도록 설계됐다”며 “GPT-4o 대비 보안성과 ‘탈출 방지(jailbreak prevention)’ 성능이 크게 향상됐다”고 덧붙였다. o3-mini는 챗GPT에서 검색 기능과 함께 작동해 최신 정보를 제공할 수 있으며, 오픈AI는 이를 ‘프로토타입’ 단계로 보고 지속적인 개선을 진행할 계획이다.
https://n.news.naver.com/mnews/ranking/article/009/0005436785?ntype=RANKING