오늘 뉴스레터는 CD Projekt Red의 완전 AI 생성 게임 발언, Steam AI 낙인 데이터, Unreal과 PUBG의 AI 도구, Claude Code 비용 논의, Codex 보안, 삼성의 Codex 도입, Roblox 안전 조치, NaukNauk의 장난감 영상 투자, 플레이어블 게임 연구를 다룬다.

밤사이 달라진 것

  • GamesRadar+는 Edge Knowledge 뉴스레터 인터뷰를 인용해 CD Projekt Red 공동 CEO Michał Nowakowski가 완전 AI 생성 게임의 등장을 예상하면서도 AI 중심 프로토타입 공장식 접근에 의문을 제기했다고 전했다.
  • Steam AI 낙인 데이터는 어제 Game Oracle과 PC Gamer의 리뷰 수 분석을 크게 다룬 뒤에도 계속 배경으로 봐야 할 신호다.
  • Unreal Engine 5.8, UE6, PUBG Ally, Roblox 안전 조치는 게임 제작과 배포의 서로 다른 지점을 보여준다.
  • Business Insider의 Claude Code 비용 인터뷰, WIRED의 OpenAI 보안 에이전트 보도, 삼성의 Codex 도입, Claude 서비스 불안정은 에이전트 도구가 비용, 보안, 기업 도입, 안정성 문제까지 끌어안고 있음을 보여준다.
  • 연구 묶음은 한 가지 질문으로 돌아온다. AI 시스템이 그럴듯한 코드만 내놓는 것이 아니라 게임을 만들고, 실행하고, 플레이하고, 살펴보고, 고칠 수 있는가.

주요 항목

CD Projekt가 AI 프로토타입 공장을 전면에 올렸다

오늘 가장 직접적인 AI 게임 소식은 GamesRadar+가 6월 21일 보도한 CD Projekt Red 공동 CEO Michał Nowakowski 인터뷰다. 그는 완전 AI 생성 게임이 나올 것이라고 보면서, 한 주에 수십 개 프로토타입을 만들고 그중 몇 개를 곧 출시하겠다는 AI 중심 스튜디오들과 대화한 적이 있다고 말했다.

그의 의문은 AI가 게임 팀에 아무 도움도 줄 수 없다는 말이 아니다. 핵심은 제품 품질이다. 빠른 프로토타입 수량에 맞춘 스튜디오가 플레이어의 관심을 얻을 만큼 독창적이고 완성도 있는 게임을 만들 수 있느냐다. 이미 플레이어는 출시작, 데모 행사, 플랫폼 피드, 추천 알고리즘 사이에서 너무 많은 선택지를 마주한다.

최근 Wonder News는 Steam 라벨, 개발자 교육, Roblox 안전, 에이전트 연구를 각각 전면에 다뤘다. CD Projekt 발언은 AI 게임 논의를 다시 실제 출시물과 스튜디오 전략 쪽으로 돌린다.

Steam AI 낙인 데이터는 오늘의 배경이다

Ross Burton의 Game Oracle 분석을 다룬 PC Gamer 보도는 이번 주 가장 뚜렷한 수치 신호 중 하나다. Game Oracle은 2025년 1월부터 10월까지 출시된 유료 Steam 게임 9,879개를 살펴봤고, 스팸성 출시작, 미출시작, 무료 게임을 제외했다. 이 표본에서 17.9%가 AI 사용을 공개했다.

가장 눈에 띄는 주장은 리뷰 수 감소다. Game Oracle은 퍼블리셔 지원, 개발사 경험, 게임 유형, 출시 월을 통제한 뒤 AI 사용을 공개한 게임의 첫 달 리뷰 수가 약 53% 적다고 추정했다. 리뷰 수를 판매 대리 지표로 보는 방식은 유용하지만 완벽하지는 않다.

그래서 오늘은 이 데이터를 다시 중심으로 세우지 않고 묶음 안에 남겼다. CD Projekt 항목은 빠른 AI 게임 제작이 독창성과 주목도에 어떤 영향을 주는지 묻는다. Steam 데이터는 AI 사용이 매장 페이지에 보일 때 플레이어가 어떻게 반응하는지 묻는다.

Unreal과 PUBG는 서로 다른 AI 게임 표면을 보여준다

Epic의 UE5.8 글에 따르면 이번 버전은 Mesh Terrain, Procedural Vegetation Editor 개선, 더 빠른 캐릭터·애니메이션 작업, MetaHuman 군중·캡처 기능, Lumen Lite, 모바일 작업 흐름 개선, Unreal 프로젝트를 LLM이 이해하도록 돕는 실험적 MCP 플러그인을 포함한다. Epic은 UE5.8을 UE6 준비 전 마지막으로 계획된 주요 UE5 릴리스라고 설명했다.

UE6 로드맵은 더 넓다. Epic은 UE5와 Unreal Editor for Fortnite를 합치고, 게임플레이 모델을 Verse와 Scene Graph 쪽으로 옮기며, Fortnite 의상 같은 콘텐츠 이동성을 실험하고, Claude·Gemini 등 모델과 연결되는 MCP 기반 엔진 기능을 넓히려 한다.

PUBG Ally는 플레이어가 직접 만나는 쪽이다. NVIDIA는 PUBG Arcade 베타가 2주 동안 진행되며, 즉각적인 전술 행동은 빠른 행동 트리가 맡고 인지 계층은 NVIDIA ACE가 맡는 구조라고 설명했다. 로컬 스택은 Parakeet 음성 인식, 20억 매개변수 Mistral-Nemo-Minitron 모델, KRAFTON 음성 합성을 포함하며 8GB 이상 VRAM을 가진 RTX GPU가 필요하다. TechRadar의 체험기는 이 베타가 완성된 증거가 아니라 현재 플레이 감각을 확인하는 테스트임을 보여준다.

에이전트 도구는 비용, 보안, 기업 도입으로 이동 중이다

Business Insider의 Boris Cherny 인터뷰는 에이전트 논의를 과장된 생산성 지표에서 떼어낸다. Claude Code를 만든 Cherny는 기업이 AI 투자 대비 효과를 따지는 것은 맞지만, 토큰 사용을 너무 일찍 앞단에서 조이면 직원들이 실험할 기회를 잃을 수 있다고 말했다. 그는 AI가 작성한 코드 비율도 팀이 에이전트에 더 많은 코드를 맡기는 순간 덜 유용한 지표가 된다고 봤다.

WIRED의 OpenAI 보도는 보안 에이전트 쪽을 더한다. OpenAI의 Patch the Planet은 Trail of Bits와 함께 시작했고 HackerOne, Calif와 협력해 오픈소스 유지관리자에게 무료 보안 컨설팅을 제공한다. WIRED는 OpenAI가 Codex Security 스캐너를 앱 플러그인으로 내놓고, 오픈소스와 비공개 코드에서 Codex Security 사용을 보조하고 있다고도 전했다.

삼성이 Device Experience 부문 전반에 ChatGPT Enterprise와 Codex를 도입했다는 보도는 게임 뉴스는 아니지만 개발 도구 도입 신호로 볼 수 있다. 반대로 6월 23일 Claude 오류율 상승 보도는 안정성 문제를 보여준다. 게임 제작 팀이 코딩 에이전트를 쓴다면 모델 성능뿐 아니라 도구 접속, 비용 관리, 보안 검토도 함께 봐야 한다.

플레이어블 게임 연구는 계속 움직이는 증거를 요구한다

GameCraft-Bench는 실제 엔진에서 끝까지 실행되는 게임 생성을 다루는 최근 논문 중 가장 뚜렷하다. 이 벤치마크는 15개 게임 계열에 걸친 Godot 과제 140개를 포함하고, 평가된 최상위 에이전트도 41.46%에 머물렀으며 대부분은 40% 아래였다고 보고했다. 에이전트가 메커닉의 형태를 알아보는 것과 완성된 플레이, 시각 피드백, 일관된 표현을 갖추는 것은 다르다는 뜻이다.

OpenGame은 웹 게임 쪽에서 같은 문제를 본다. Game Skill, GameCoder-27B, OpenGame-Bench를 통해 빌드 상태, 시각적 사용성, 의도 일치를 브라우저 실행과 VLM 판정으로 평가한다. GUI Agents for Continual Game Generation은 PlaytestArena와 Play2Code로 플레이테스터를 루프 안에 넣고, 해당 설정에서 Play2Code가 66.8% 루브릭 통과율을 냈다고 보고했다.

GamED.AI는 교육용 게임으로 범위를 좁힌다. 테스트 설정 안에서 90% 검증 통과율과 게임당 0.46달러 비용을 보고했다. AI GameStore는 LLM과 사람 검토를 함께 써서 AI 평가용 게임 환경을 만들고, 여러 VLM을 짧은 플레이 에피소드로 평가했을 때 대부분 게임에서 최고 모델도 인간 평균 점수의 10% 아래였다고 밝혔다. 별도 LLM 게임 개발 논문은 LLM을 게임 구성 요소로 넣으면 개인화와 변동성은 늘 수 있지만 정확성, 난이도 조절, 구조적 일관성 문제가 생긴다고 설명했다.

게임, 엔진, 스토어

  • CD Projekt Red: Nowakowski 발언은 완전 AI 생성 게임을 연구 데모가 아니라 스튜디오 전략 문제로 끌어올렸다.
  • 개발자 반응: GamesRadar+의 개발자 인터뷰는 노동, 동의, 저작권, 환경, 사기, 품질 우려를 구분해 보여주는 배경 자료다.
  • Steam AI 낙인: Game Oracle과 PC Gamer는 매장 페이지에서 확인 가능한 수치 신호를 제공하지만, 리뷰 수 분석은 상관관계와 대리 지표에 기대고 있다.
  • Unreal Engine 5.8: Mesh Terrain, PCG, Procedural Vegetation Editor, MetaHuman, Lumen Lite, 모바일 작업 흐름, MCP 플러그인은 실제 제작 도구 업데이트다.
  • Unreal Engine 6: Verse, Scene Graph, UEFN 통합, 콘텐츠 이동성, 모델 연결은 당장 전환할 기능이라기보다 긴 이동 경로다.
  • PUBG Ally: NVIDIA 베타는 현재 가장 분명한 실전 AI 팀원 테스트 중 하나이고, TechRadar 체험기는 아직 플레이 감각에 의문이 남아 있음을 보여준다.

모델, 에이전트, 개발 도구

  • Claude Code 비용: Cherny의 요점은 에이전트가 공짜 생산성이 아니라 토큰 비용과 실험 기회를 함께 관리해야 하는 도구라는 점이다.
  • Codex Security: OpenAI의 Patch the Planet은 코딩 에이전트를 버그 확인, 패치, 유지관리자 지원 같은 오픈소스 보안 작업 안으로 넣는다.
  • 삼성과 Codex: 삼성 도입 보도는 Codex가 스타트업이나 초기 개발자 도구 사용자를 넘어 기업 개발 환경으로 들어가고 있다는 신호다.
  • Claude 안정성: 6월 23일 오류율 상승 보도는 호스팅 모델에 의존하는 에이전트 작업이 서비스 상태의 영향을 받는다는 점을 보여준다.
  • NaukNauk: Axios는 장난감 사진과 프롬프트로 15~20초 영상을 만드는 앱이 2,000만 달러를 투자받았다고 보도했다. 카테고리에는 Pokémon, Star Wars, 브릭이 포함된다.

플레이어블 생성, 교육, 안전

  • GameCraft-Bench: Godot 벤치마크는 컴파일 성공보다 실행되는 게임플레이를 기준으로 삼는다.
  • OpenGame: 웹 게임 스택은 게임 생성을 설계, 디버깅, 실행, 시각 판정이 함께 필요한 일로 본다.
  • GUI 플레이테스트: PlaytestArena와 Play2Code는 플레이테스터를 생성 루프의 일부로 넣는다.
  • GamED.AI: 교육용 게임 생성은 범위가 좁지만 계약, 품질 게이트, 비용 보고 덕분에 결과를 살피기 쉽다.
  • AI GameStore: 인간용 게임을 넓은 평가 표면으로 쓰고, 여러 생성 게임에서 VLM이 인간 평균 점수에 크게 못 미친다고 보고했다.
  • LLM 게임 통합: 게임 안에 LLM을 넣으면 개인화가 늘 수 있지만 플레이 가능성도 함께 흔들릴 수 있다는 점을 짚는다.
  • Roblox 안전: Roblox의 전 세계 채팅용 얼굴 연령 확인과 새 연령대 계정 보도는 Roblox가 게임 플랫폼이자 어린 이용자가 많은 창작 환경이기 때문에 중요하다.

다음에 볼 것

  • 더 많은 대형 스튜디오가 완전 AI 생성 게임을 노동 문제가 아니라 주목도와 독창성 문제로 말하는지.
  • Steam AI 낙인 분석이 2026년 데이터로 재현되거나 반박되는지.
  • Epic이 UE6, Verse, Scene Graph, MCP 기반 창작 흐름의 일정을 더 분명히 밝히는지.
  • PUBG Ally 2주 베타가 6월 30일 전에 공개적인 플레이어 반응을 남기는지.
  • 기업의 코딩 에이전트 도입이 토큰 예산, 보안 검사, 모델 접속 안정성에 더 큰 부담을 주는지.
  • 플레이어블 게임 벤치마크가 리플레이 로그, 브라우저 또는 엔진 플레이테스트, 플레이어가 볼 수 있는 점수 기준으로 모이는지.

이 한국어 기사는 영어 원문을 번역한 것이며, 번역 과정에서 오류가 있을 수 있습니다. 이 글은 Wonder Bricks AI Agent의 도움을 받아 작성했으며 SunnyLabs가 편집했습니다.