**번역본뉴스입니다. 오역이 있을수 있습니다.
우리는 프리미엄 플래그십 모델인 Sol, 일상적인 업무를 위한 균형 잡힌 모델인 Terra, 그리고 빠르고 저렴한 모델인 Luna로 구성된 GPT-5.6 시리즈의 제한적 프리뷰를 시작합니다. Terra는 GPT-5.5와 경쟁할 만한 성능을 제공하면서도 비용은 2배 더 저렴하며, Luna는 가장 낮은 비용으로 강력한 기능을 제공합니다.
GPT-5.6 Sol은 현재까지 당사에서 구축한 가장 견고한 안전 스택을 탑재하여 출시됩니다. 우리는 고위험 활동, 민감한 사이버 요청, 반복적인 오용에 대한 보호 조치를 강화했으며, 시스템의 취약점을 찾고 압박 테스트를 진행하며 실제 공격에 대비해 시스템을 단단하게 다지는 데 수주일을 보냈습니다.
우리는 광범위한 접근 권한 제공의 가치를 믿으며, 향후 수주 내에 GPT-5.6 Sol, Terra, Luna를 일반 공급(Generally Available)할 계획입니다. 미 정부와의 지속적인 협력의 일환으로, 우리는 오늘의 출시를 앞두고 우리의 계획과 모델의 기능들을 사전에 공유하여 프리뷰를 진행했습니다. 정부의 요청에 따라, 우리는 더 광범위하게 출시하기 전, 정부와 참여 사실이 공유된 소수의 신뢰할 수 있는 파트너 그룹을 대상으로 제한적 프리뷰를 시작합니다. 이 프리뷰 기간 동안, 우리는 더 광범위한 이용 가능성을 향해 나아가면서 테스트를 지속하고 파트너들과 긴밀히 조율할 것입니다. 우리는 이러한 형태의 정부 접근 프로세스가 장기적인 기본값이 되어야 한다고 생각하지는 않습니다. 이는 최고의 도구를 필요로 하는 사용자, 개발자, 기업, 사이버 방어자 및 글로벌 파트너들로부터 도구를 격리하기 때문입니다. 우리가 이 단기적인 단계를 밟는 이유는 행정부와 협력하여 사이버 행정명령 프레임워크와 향후 모델 출시를 위한 반복 가능한 프로세스를 개발하는 동안, 이것이 향후 수주 내에 더 광범위한 출시로 나아갈 수 있는 가장 확실한 경로라고 믿기 때문입니다.
기능 및 역량 (Capabilities)
GPT-5.6 Sol은 당사에서 선보이는 가장 강력한 모델입니다. 모델의 성능을 미리 보여드리기 위해, 코딩, 생물학, 사이버 보안 분야에서 향상된 에이전트 역량(Agentic capabilities)을 강조하는 일련의 평가 결과를 공유합니다. 추가적인 안전 및 대비 평가 결과는 당사의 시스템 카드(새 창으로 열림)에서 확인하실 수 있습니다. 모델이 광범위하게 공급될 때 더 확장된 평가 결과 모음을 공유할 예정입니다.
GPT-5.6을 통해 우리는 Sol이 깊이 있게 추론할 수 있는 가장 충분한 시간을 부여하기 위해 새로운 '최대 추론 노력(max reasoning effort)' 설정을 도입합니다. 아울러 복잡한 작업을 가속화하기 위해 서브 에이전트(Subagents)들을 활용함으로써 단일 에이전트의 역량을 뛰어넘는 새로운 '울트라 모드(Ultra mode)'를 선보입니다.
코딩 워크플로의 경우, GPT-5.6 Sol은 계획 수립, 반복 수정, 그리고 도구 조율을 요구하는 명령줄 워크플로를 테스트하는 Terminal-Bench 2.1에서 새로운 최고 기록(State of the art)을 세웠습니다.
TerminalBench 2.1

GPT-5.6 Sol은 생물학 워크플로에서도 광범위한 향상을 보여줍니다. 장기적인 유전체학 및 계량 생물학 분석을 평가하는 GeneBench v1에서, 더 적은 토큰을 사용하면서도 GPT-5.5보다 더 강력한 결과를 달성했습니다.
GeneBench v1

GPT-5.6 Sol은 사이버 보안을 위해 당사가 제작한 가장 유능한 모델입니다. 이 모델은 취약점 연구 및 익스플로잇(Exploitation)을 포함한 장기적인 보안 과제에서 성능-효율성 프론티어(한계선)를 이동시킵니다. ExploitBench에서 GPT-5.6 Sol은 단 약 3분의 1의 출력 토큰만을 사용하고도 Mythos Preview와 경쟁할 만한 성능을 냅니다. 오픈AI 및 다른 프론티어 연구소들과 협력하여 UC 버클리 연구원들이 생성한 벤치마크인 ExploitGym에서, GPT-5.6 Sol, Terra, Luna 모델 모두 추론을 증가시킴에 따라 사이버 역량에서 강력한 향상을 입증했습니다.
ExploitBench

ExploitGym

더 강력한 사이버 기능과 더 강력한 안전장치
우리는 각 모델의 역량에 맞춰진 설정을 가진, 당사 역사상 가장 견고한 안전장치를 적용하여 GPT-5.6 Sol, Terra, Luna를 개발했습니다. 모델의 역량이 더욱 강화됨에 따라, 우리는 코드 리뷰, 취약점 연구, 패치 개발, 디버깅, 보안 교육, 방어적 테스트와 같은 정당한 작업에 대한 접근 권한을 보존하는 동시에, 실제 세계의 적대적인 압박에 점진적으로 견뎌낼 수 있도록 안전장치를 설계했습니다. 우리의 목표는 유익한 사용을 불필요하게 제한하지 않으면서, 금지된 공격적 활동을 더 어렵고 불확실하며 탐지하기 쉽게 만드는 것입니다. 모델과 안전장치에 대한 당사의 평가를 바탕으로, 우리는 금지된 공격적 사용을 의미 있게 제약하는 한편, 정당한 방어 작업에 상당한 이점을 줄 것으로 기대합니다.
GPT-5.6 Sol은 엔드투엔드(End-to-end) 공격을 안정적으로 수행하는 것보다 사람들이 취약점을 찾고 수정하도록 돕는 데 더 뛰어난 성능을 발휘합니다. 이러한 역량이 계속해서 고도화됨에 따라, 우리의 우선순위는 이러한 도구들이 약점을 찾고 패치를 개발하며 더 광범위하게 시스템을 강화하는 데 도구를 사용할 수 있는 방어자들에게 도달하고 그들에게 이익을 주도록 보장하는 것입니다.
GPT-5.6 Sol은 당사의 대비 프레임워크(Preparedness Framework) 하에서 사이버 크리티컬(Cyber Critical) 임계값을 넘지 않습니다. 크로미움(Chromium) 및 파이어폭스(Firefox)가 포함된 평가에서, 이 모델은 버그와 익스플로잇 프리미티브(익스플로잇을 구성하는 빌딩 블록)를 식별해 냈지만, 테스트된 조건 하에서 자율적으로 기능적인 풀체인(Full-chain) 익스플로잇을 생성하지는 못했습니다. 그럼에도 불구하고, 벤치마크 임계값이 모델이 사용되거나 다른 도구들과 결합할 수 있는 모든 방식을 포착할 수는 없습니다. 그러한 불확실성과 모델의 더 광범위한 단계적 역량 변화가 바로 우리가 모델의 증가된 역량에 더 강력한 안전장치와 단계적 출시를 결합하는 이유입니다. 당사의 안전장치에 대한 더 자세한 정보는 GPT-5.6 프리뷰 시스템 카드(새 창으로 열림)에서 공유하고 있습니다.
다층 구조의 안전장치 스택 (A layered safeguard stack)
단 하나의 안전장치로는 단호하거나 적응력이 뛰어난 오용에 대처하기에 충분하지 않습니다. GPT-5.6 프리뷰 전반에 걸쳐 우리는 모델마다 정확한 구성이 다르게 적용되는 다층 구조의 안전장치를 사용하며, 실제 세계의 공격에 대해 압박 테스트를 진행합니다. 여기에는 모델 내에 학습된 보호 조치, 생성 중 실시간 체크, 계정 수준의 신호, 차별화된 접근 권한, 모니터링, 집행 및 지속적인 테스트가 포함됩니다.
GPT-5.6은 사용자가 자신의 의도를 숨기려 하거나 모델을 탈옥(Jailbreak)하려고 시도하는 경우를 포함하여, 금지된 사이버 지원 요청을 거부하도록 학습되었습니다. 이러한 모델 수준의 안전장치는 모델이 도움을 주어야 할 일과 주지 말아야 할 일 사이에 첫 번째 경계선을 구축합니다.
실시간 사이버 및 생물학 오용 분류기는 출력이 생성될 때 이를 평가함으로써 또 다른 레이어를 제공합니다. 더 높은 위험을 가진 케이스의 경우, 잠재적인 위반이 탐지되면 생성이 일시 중단될 수 있으며, 이때 더 큰 규모의 추론 모델이 대화와 그 컨텍스트를 검토합니다. 출력이 허용되지 않는 것으로 평가되면, 사용자에게 도달하기 전에 차단됩니다.
플래그가 지정된 활동은 당사의 콘텐츠 보존 및 검토 관련 약관 및 정책에 따라, 관련 대화 및 리스크 신호 전반에 걸친 계정 수준의 검토를 트리거할 수도 있습니다. 단일 대화 너머를 살펴보는 것은 우리의 시스템이 지속적인 악의적 행동과, 유사한 기술적 개념이 완전히 다른 컨텍스트에서 나타날 수 있는 정당한 이중 용도(Dual-use) 보안 작업을 구분하는 데 도움을 줍니다.
이러한 레이어들이 결합하여 전체적인 접근 방식을 그 어떤 단일 안전장치 단독보다 더 견고하게 만듭니다. 모델의 행동은 유해한 답변의 가능성을 줄이고, 실시간 시스템은 생성 중에 개입할 수 있으며, 계정 수준의 검토는 더 광범위한 패턴을 식별할 수 있고, 차별화된 접근 권한은 가장 민감한 역량을 기본적으로 널리 제공하지 않으면서도 중요한 방어 작업을 보존합니다.
특히 프리뷰 기간 동안 사용자는 일부 요청을 차단하거나 거부하는 안전장치를 마주할 수 있습니다. 추가 검토를 위해 생성이 일시 중단되기 때문에 일부 요청은 시간이 더 오래 걸릴 수 있습니다. 방어 활동과 공격 활동이 처음에는 매우 유사해 보일 수 있는 이중 용도 분야 등에서, 안전장치가 정당한 작업에 간혹 개입할 수 있습니다.
그것이 바로 이번 프리뷰가 테스트하도록 설계된 목적의 일부입니다. 우리는 안전장치가 오용을 제약하는지 여부뿐만 아니라, 정당한 사용자들이 정상적인 작업을 여전히 안정적이고 효율적으로 완료할 수 있는지 이해하고자 합니다. 프리뷰 기간 동안의 피드백은 우리가 불필요한 차단과 지연을 줄이고, 안전장치가 컨텍스트를 해석하는 방식을 개선하며, 더 광범위한 출시 전에 더 매끄러운 경험을 만드는 데 도움을 줄 것입니다.
우리는 또한 안전을 고도화하는 동시에 기업의 개인정보 보호 요구사항을 지원하기 위해, 개인정보를 보존하는 탐지 기법, 고객이 직접 운영하는 안전 제어 기능, 그리고 고객·사용자·또는 워크로드의 리스크에 맞게 조정된 접근 권한 등을 포함한 장기적인 접근 방식을 엔터프라이즈 고객들과 함께 작업하고 있습니다.
자동화된 레드팀 수행을 통한 견고함 향상
안전장치는 공격자들이 전술을 바꿀 때도 효과적으로 유지되어야 합니다. 고정된 기지의 알려진 공격 세트에만 작동하는 보호 조치는 프론티어 모델에 충분할 만큼 견고하지 않습니다.
이것이 바로 우리가 취약점을 찾고 안전장치를 더 빠르게 개선하기 위해 자체 모델을 사용하여 그 어느 때보다 안전 분야에 더 많은 지능과 컴퓨팅을 적용하고 있는 이유입니다. 우리는 단 하나의 좁은 설정이 아니라 여러 프롬프트나 컨텍스트 전반에서 작동할 수 있는 공격인 '유니버설 탈옥(Universal jailbreaks)'을 찾는 것을 목표로 하는 자동화된 레드팀 수행에 70만 시간 이상의 A100급 GPU 시간을 투입했습니다. 이러한 더 어렵고 일반적인 공격에 집중함으로써 우리는 고정된 기지의 알려진 실패 세트를 넘어 안전장치를 테스트할 수 있었습니다. 이는 또한 인간의 테스트만으로는 커버할 수 없는 훨씬 더 많은 공격 패턴을 탐색하고, 실패 패턴을 더 일찍 식별하며, 약점을 발견하고 이를 해결하는 데 걸리는 경로를 단축할 수 있게 해줍니다.
자동화된 레드팀 수행에 더해, 우리는 서드파티 테스터들과 협력하여 광범위한 인간 전문가 레드팀 수행을 진행했으며, 이는 프리뷰 기간에도 계속될 것입니다. 인간 레드팀 수행은 우리의 시스템이 예상하지 못할 수 있는 방식으로 모델을 오용하려는 창의적인 전문가들을 상대로 안전장치를 테스트함으로써 자동화된 작업을 보완합니다.
그 어떤 평가도 모든 제품 구성, 다단계 공격, 또는 실제 워크플로를 대변할 수는 없습니다. 따라서 우리는 새로 발견된 탈옥 기법을 재현, 평가, 우선순위 지정 및 치료하기 위한 신속 대응 프로세스를 유지하며, 이를 지속적인 평가 항목에 추가하여 향후 유사한 실패에 대비해 테스트할 수 있도록 하고 있습니다.
이용 가능 여부 및 가격 정책
프리뷰 기간 동안 GPT-5.6 모델들은 초기에 API와 Codex를 통해 선정된 소수의 신뢰할 수 있는 파트너 및 기관들에게 제공될 것입니다. 우리는 곧 ChatGPT, Codex, API를 사용하는 사람들에게 이 모델들을 더 광범위하게 제공할 계획입니다.
GPT-5.6과 함께 도입된 이 새로운 명명 시스템에서, 숫자는 모델의 세대를 식별하는 반면 Sol, Terra, Luna는 자체적인 주기에 따라 발전할 수 있는 지속적인 역량 등급을 식별합니다. 이 제품군은 함께 사용자들과 개발자들에게 지능, 속도, 비용 전반에 걸쳐 더 명확한 선택지를 제공합니다.
GPT-5.6의 가격은 세 가지 모델 크기에 걸쳐 100만(1M) 토큰당으로 책정됩니다.
-
Sol: 입력 $5 / 출력 $30
-
Terra: 입력 $2.50 / 출력 $15
-
Luna: 입력 $1 / 출력 $6
GPT-5.6은 또한 명시적인 캐시 브레이크포인트 지원과 30분의 최소 캐시 수명을 포함하여, 더 예측 가능한 프롬프트 캐싱(Prompt caching)을 도입합니다. GPT-5.6 및 이후 모델의 경우, 캐시 쓰기(Cache writes) 비용은 모델의 미캐시 입력 요율의 1.25배로 청구되는 반면, 캐시 읽기(Cache reads)는 기존의 90% 캐시 입력 할인 혜택을 계속 받습니다.
우리는 또한 오는 7월 세레브라스(Cerebras)에서 초당 최대 750토큰의 속도로 GPT-5.6 Sol을 출시하여, 전례 없는 속도로 고객들에게 프론티어 지능을 제공할 예정입니다. 우리가 용량을 확장함에 따라 초기에는 일부 선택된 고객들로 접근이 제한될 것입니다.
우리는 이 프리뷰 기간을 통해 계속해서 배우고, 곧 더 많은 사람들에게 GPT-5.6 Sol, Terra, Luna를 선보일 수 있게 되기를 기대합니다.
-
우리는 모델의 프로덕션 동작을 살펴보고 오프라인으로 시뮬레이션하여 지연 시간과 API 비용을 추정합니다. 이러한 추정치는 도구 호출 세부 사항, 샘플링된 토큰 및 입력 토큰을 고려합니다. 실제 결과는 크게 다를 수 있으며, 당사의 시뮬레이션에 포착되지 않은 많은 요인에 따라 달라집니다. 우리는 빠른 API 속도에서 지연 시간을 시뮬레이션하고, 일반 API 가격에서 비용을 시뮬레이션합니다.
-
모든 모델은 5개의 시드와 추론 연속성을 가진 ExploitBench API 하네스를 사용하여 평가됩니다.
-
우리는 공개 API보다 더 빠르게 답변을 출력하는 알파 API에서 ExploitGym을 실행한 다음, 공개 API와 일치하도록 스케일을 재조정했습니다. 공개 API에 예상되는 속도로 지연 시간의 스케일을 재조정할 때, 평가 실행 시에는 올바르게 준수되었음에도 불구하고 일부 추정 지연 시간이 2시간 및 6시간 시간 제한을 초과하는 현상이 발생합니다. 시간에 민감한 작업을 위해 더 빠른 속도를 얻을 수 있도록, 우리는 API에서 우선 처리(priority processing)를, Codex에서 빠른 모드(fast mode)를 제공합니다.
-
출력 토큰, 지연 시간 또는 비용이 보고되지 않은 모델은 수평 점선으로 플롯됩니다.
--------------------------------------------------------------------------------------광고(Advertising)--------------------------------------------------------------------------------------------------------