
**번역본뉴스입니다. 오역이 있을수 있습니다.
사람이 만든 이미지와 AI가 생성한 이미지를 구분하는 것은 충분히 쉬운 일이었습니다. 불과 2년 전만 해도, 이미지 모델을 사용해 멕시코 식당의 메뉴판을 만들려고 하면 “enchuita”, “churiros”, “burrto”, “margartas”와 같은 새로운 요리 이름들을 지어내지 않고서는 불가능했습니다.
이제 제가 최신 ChatGPT Images 2.0 모델에게 멕시코 음식 메뉴판을 요청하면, 고객들이 무언가 잘못되었다고 눈치채지 못할 정도로 식당에서 즉시 사용할 수 있는 결과물을 만들어냅니다. (다만, 13.50달러로 책정된 세비체 가격을 보면 생선의 품질에 의구심이 들 수도 있겠네요.)

이미지 출처: ChatGPT Images 2.0
비교를 위해, 2년 전 DALL-E 3에서 얻은 결과물을 보여드리겠습니다 (당시 ChatGPT는 이미지를 생성하지 못했습니다):

이미지 출처: Microsoft Designer (DALL-E 3)
AI 이미지 생성기들은 역사적으로 철자 표기에 어려움을 겪어왔는데, 이는 일반적으로 노이즈로부터 이미지를 재구성하는 방식으로 작동하는 확산 모델(diffusion models)을 사용했기 때문입니다.
Lesan AI의 설립자이자 CEO인 아스멜라쉬 테카 하드구(Asmelash Teka Hadgu)는 2024년 테크크런치(TechCrunch)와의 인터뷰에서 “확산 모델은 [...] 주어진 입력을 재구성합니다. 이미지 속의 글자는 매우, 매우 작은 부분이라고 가정할 수 있으므로, 이미지 생성기는 더 많은 픽셀을 차지하는 패턴을 학습하게 됩니다”라고 말했습니다.
이후 연구자들은 이미지가 어떻게 보여야 할지에 대해 예측을 수행하며 LLM과 더 유사하게 작동하는 자기회귀 모델(autoregressive models)과 같은 다른 이미지 생성 메커니즘을 탐구해 왔습니다.
안타깝게도 OpenAI는 이번 주 언론 브리핑에서 ChatGPT Images 2.0에 어떤 종류의 모델이 탑재되었는지에 대한 질문에 답변을 거부했습니다.
Disrupt에서 당신의 다음 투자자나 포트폴리오 스타트업을 만나보세요
당신의 다음 라운드, 다음 채용, 다음의 획기적인 기회. 10,000명 이상의 창업자, 투자자, 기술 리더들이 모여 250개 이상의 전략적 세션, 강력한 네트워킹, 그리고 시장을 정의하는 혁신을 선보이는 TechCrunch Disrupt 2026에서 찾아보세요. 지금 등록하고 최대 410달러를 절약하세요.
캘리포니아주 샌프란시스코 | 2026년 10월 13-15일
지금 등록하기
하지만 회사는 새 모델이 “사고 능력(thinking capabilities)”을 갖추고 있다고 설명했습니다. 이를 통해 웹 검색, 하나의 프롬프트로 여러 이미지 생성, 그리고 생성물을 재검토하는 능력을 갖추게 되었으며, 덕분에 Images 2.0은 다양한 크기의 마케팅 자산뿐만 아니라 다중 패널의 만화 컷도 생성할 수 있습니다.
또한 OpenAI는 Images가 일본어, 한국어, 힌디어, 벵골어와 같은 비라틴 문자 렌더링에 대해 더 강력한 이해도를 가지고 있다고 밝혔습니다. 모델의 지식 학습 컷오프는 2025년 12월이며, 이는 최신 뉴스가 포함된 특정 프롬프트를 얼마나 정확하게 생성할 수 있는지에 영향을 미칠 수 있습니다.
OpenAI는 보도자료를 통해 “Images 2.0은 이미지 생성에 있어 전례 없는 수준의 구체성과 충실도를 제공합니다. 더 정교한 이미지를 개념화할 수 있을 뿐만 아니라, 지침을 따르고 요청된 세부 사항을 유지하며, 이미지 모델들이 자주 실패하는 미세한 요소들—작은 텍스트, 아이콘, UI 요소, 밀집된 구성 및 미묘한 스타일 제약—을 최대 2K 해상도로 효과적으로 구현해 낼 수 있습니다”라고 밝혔습니다.
이러한 기능들로 인해 이미지 생성 속도가 ChatGPT에 질문을 입력하는 것만큼 빠르지는 않지만, 다중 패널 만화와 같은 복잡한 결과물을 생성하는 데에도 여전히 몇 분밖에 걸리지 않습니다.
모든 ChatGPT 및 Codex 사용자는 화요일부터 Images 2.0을 사용할 수 있게 되며, 유료 사용자는 더 고급 결과물을 생성할 수 있습니다. 회사는 또한 gpt-image-2 API를 제공할 예정이며, 가격은 결과물의 품질과 해상도에 따라 결정될 것입니다.
--------------------------------------------------------------------------------------광고(Advertising)--------------------------------------------------------------------------------------------------------