AI 게임 쪽에서 가장 새롭고 직접적인 소식은 7월 1일 공개된 연구다. 이 연구는 무엇을 AI 네이티브 게임이라고 부를 수 있는지 기준을 제시했다. 오늘 Wonder News는 여기에 더해 생성 AI에 대한 창작자 반발, Steam의 AI 공개 표시 도구, Anthropic Fable 5 접근 복구, Google Play의 Gemini 검색, 생성 게임 결과물이 실제로 실행되고 편집되는지 보는 벤치마크를 다룬다.

밤사이 달라진 것

  • AI Native Games: A Survey and Roadmap이 7월 1일 arXiv에 올라왔다. 이 연구는 런타임 생성 AI가 핵심 플레이 방식에 꼭 필요한지를 기준으로 AI 네이티브 게임을 정의한다.
  • GamesRadar+와 PC Gamer는 David Gaider와 David Szymanski의 최근 인터뷰를 다뤘다. 두 창작자는 생성 AI를 단순한 스토어 표기 논쟁이 아니라 창작 과정의 문제로 본다.
  • Tom’s Hardware는 Fable 5 접근 복구에 대한 세부 내용을 전했다. 미국 수출 통제가 해제된 뒤 Anthropic은 특정 취약점 악용 프롬프트 기법을 감지해 다른 모델로 돌리는 분류기를 적용했다.
  • Google Play의 Gemini 검색 출시는 게임 제작자에게도 볼 만한 플랫폼 소식이다. 검색, 설치 흐름, 인앱 구매 노출이 자연어 요청 안으로 들어가고 있다.
  • 최근 연구들은 한 가지 질문으로 모인다. AI가 만든 게임과 3D 장면이 첫 인상 이후에도 플레이 가능하고, 점검 가능하고, 부분 수정 가능한가.

AI 네이티브 게임 설계

새 연구는 AI 네이티브 게임과 AI 보조 제작을 나눴다

AI Native Games: A Survey and Roadmap은 이번 주 AI 게임 제작자에게 가장 또렷한 기준을 준다. 이 논문은 AI 도구로 만든 모든 게임을 AI 네이티브 게임으로 보지 않는다. 대신 이런 질문을 던진다. 런타임 생성 AI를 제거하거나 평범한 기능으로 바꾸면, 핵심 플레이 방식이 무너지거나 근본적으로 달라지는가.

저자들은 이 정의로 공개된 AI 네이티브 게임과 프로토타입 53개를 분석했다. 분류는 플레이어가 경험하는 게임 유형과, 생성 AI가 반드시 필요한 게임 안 기제를 나눠서 본다. 현재 사례는 아직 언어 중심 형태에 몰려 있다. 특히 내러티브 어드벤처, 지식 추론형 상호작용, 생성형 서사가 많다.

플레이 가능한 AI 게임을 만드는 사람에게 이 경고는 실용적이다. 게임 안에 챗봇이 들어갔다고, 제작 과정에서 AI 아트를 썼다고, 절차적 콘텐츠에 AI 이름을 붙였다고 새 플레이가 생기지는 않는다. 논문은 열린 생성을 목표, 규칙, 상태, 피드백, 속도, 플레이어 선택으로 묶어야 게임플레이가 된다고 본다.

이 기준은 막연한 가능성 평가보다 낫다. 제작자가 물어볼 질문이 분명해진다. AI가 플레이 도중 무엇을 결정하는가. 플레이어는 그 결정에 어떻게 대응하는가. 그 교환 때문에 게임 상태는 무엇이 바뀌는가.

창작자 반응과 스토어 표시

내러티브와 인디 창작자는 제작 경험에서 반발하고 있다

GamesRadar+는 Dragon Age의 오랜 내러티브 리드이자 Summerfall Studios 공동창업자인 David Gaider를 인터뷰했다. Gaider의 반대 이유는 구체적이다. 학습 데이터의 법적 문제, 실수로 남을 수 있는 임시 AI 에셋, 약한 반복 수정 능력, 주니어 개발자가 배울 기회의 감소다.

PC Gamer도 7월 1일 이 인터뷰를 별도 기사로 다뤘다. 게임 스튜디오가 볼 부분은 표현의 강도가 아니다. Gaider는 내러티브 제작 방식에서 말하고 있다. 안정적으로 조정할 수 없는 생성 초안은 고쳐 쓰는 것보다 버리고 다시 만드는 편이 나을 수 있다는 주장이다.

Dusk와 Iron Lung의 제작자 David Szymanski도 GamesRadar+에서 비슷하지만 더 관객 중심적인 관점을 냈다. 그는 AI라는 기술 전체를 거부하는 것은 아니지만, 현재 생성 AI는 창작 작업에 약하고 게임과 관객 사이의 신뢰를 해친다고 봤다.

이 두 인터뷰는 올해 개발자 설문 흐름과도 맞닿아 있다. PC Gamer는 1월 GDC 설문을 인용해 2,300명 넘는 응답자 중 52%가 생성 AI가 게임 산업에 부정적 영향을 준다고 답했다고 보도했다. 동시에 33%는 업무에서 생성 AI를 쓴다고 답했고, 주된 용도는 조사, 아이디어 정리, 사무 업무, 코딩 보조, 프로토타이핑이었다.

Steam의 AI 공개 표시는 사용자 인터페이스가 되고 있다

GamesRadar+는 AI warning for Steam이라는 브라우저 확장 프로그램을 소개했다. 이 도구는 Steam의 AI 공개 표시를 더 크게 보여주고, 검색 결과에서 AI 보조 게임을 흐리게 하거나 숨길 수 있다. 같은 보도는 Valve의 AI 표시를 비판한 Tim Sweeney의 최근 발언도 함께 다뤘다.

이것은 엔진 기여 규칙이나 스튜디오 제작 방침과는 다르다. Steam 공개 표시는 이제 사용자와 개발자가 그 위에 도구를 얹을 수 있는 정보가 되고 있다. 플레이어가 Valve 기본 화면보다 더 강하게 AI 보조 게임을 거를 수 있다면, 공개 표시는 단순한 입력란을 넘어 검색과 노출에 영향을 준다.

Godot도 이번 주 흐름에 남아 있다. PC Gamer는 Godot이 AI가 작성한 코드, AI가 제출한 풀 리퀘스트, 기여자 대화 속 AI 생성 문구를 거부할 계획이라고 보도했다. 제한적으로 공개된 AI 보조와 사람이 쓴 글의 기계 번역은 허용될 수 있다. 이 소식은 전날 첫머리에서 다뤘기 때문에 오늘은 보조 근거로 보는 편이 맞다. 창작 도구는 생성 속도만이 아니라 결과 이후의 책임으로 평가받고 있다.

모델 접근과 유통

Fable 5는 돌아왔지만 접근은 여전히 조건부다

Tom’s Hardware는 미국 상무부가 6월 12일 부과했던 수출 통제를 철회한 뒤 Anthropic이 Claude Fable 5 전 세계 접근을 복구했다고 보도했다. 보도에 따르면 Fable 5는 Claude.ai, Claude Platform, Claude Code, Claude Cowork에 돌아왔고, 클라우드 제공자 접근은 뒤따를 예정이다.

새로 볼 부분은 완화 조치다. Tom’s Hardware는 Anthropic 설명을 인용해 특정 기법을 99% 넘게 막는 분류기가 해당 요청을 Opus 4.8로 돌린다고 전했다. 같은 보도는 이 방식이 모델의 능력을 없애는 것이 아니라 요청 패턴을 감지하는 것이라고 설명했다.

게임 팀이 볼 지점은 좁다. 프런티어 모델은 스크립팅, 도구 제작, 디버깅, 콘텐츠 파이프라인에 중요해질 수 있다. 하지만 접근은 정부 통제, 클라우드 출시 일정, 안전 라우팅에 따라 바뀔 수 있다. 이것이 AI 게임의 전부는 아니지만, 제작 계획의 변수임은 분명하다.

Google Play의 Gemini 검색은 앱과 게임 발견 방식을 바꾼다

Times of India는 Google이 I/O 2026에서 예고한 Play Store용 Gemini 대화형 검색을 순차적으로 출시하고 있다고 보도했다. 사용자는 자연어로 추천을 묻고, Play Store 카드로 앱이나 게임을 확인한 뒤, Gemini 안에서 설치 흐름으로 넘어갈 수 있다.

Android Central의 I/O 보도는 개발자 쪽 맥락을 더한다. Google은 Ask Play, Play Shorts, 앱과 게임을 위한 Gemini 기반 발견 경로, 앱 소개 문구 현지화를 돕는 Play Console AI 기능을 발표했다. 이것은 게임 생성 도구는 아니다. 그래도 작은 게임 제작자에게 중요하다. 검색, 추천, 스토어 페이지 노출이 더 대화형이고 시각적인 방식으로 바뀌고 있기 때문이다.

열린 질문은 AI 검색이 분명한 사용자 약속을 가진 게임을 잘 드러낼지, 아니면 기존 앱스토어의 집중 현상을 더 키울지다. 생성 게임 도구에는 만드는 속도만큼 유통 품질도 중요해질 수 있다.

벤치마크와 도구

플레이 가능한 게임 벤치마크는 증거 기준을 높이고 있다

GameCraft-Bench는 코딩 에이전트가 Godot에서 완성된 플레이 가능 게임을 만들 수 있는지 본다. 15개 게임군에 걸친 과제 140개를 담았고, 평가된 가장 강한 에이전트가 41.46%에 도달했으며 대부분은 40% 아래였다고 보고한다. 핵심 조건은 코드 생성만이 아니라 관찰 가능한 플레이어-게임 상호작용이다.

JAMER는 전문 게임 엔진에서 프로젝트 단위 작업을 본다. 24만 개가 넘는 저장소에서 검증된 Godot 프로젝트 8,133개를 걸러냈고, 수동 검증 프로젝트 300개를 JamBench에 썼다. 가장 중요한 숫자는 규모가 커질 때 생기는 절벽이다. 한 과제 설정에서 런타임 통과율은 작은 프로젝트의 80.4%에서 큰 프로젝트의 5.7%로 떨어졌다.

이 결과는 앞선 웹 게임 벤치마크와도 맞물린다. WebGameBench는 브라우저 네이티브 생성 게임을 실행 뒤 평가하고, OpenGame은 빌드 상태, 시각적 사용성, 의도 정렬을 실행과 시각언어모델 판정으로 본다. 공통점은 단순하다. 스크린샷, 소스 파일, 프롬프트보다 실행되는 게임이 더 강한 증거다.

편집 가능한 3D 장면도 같은 문제에 들어온다

MUSE는 게임 벤치마크는 아니지만 3D 장면 제작 결과가 같은 흐름에 있다. 이 논문은 장면 생성과 기존 장면의 부분 수정을 함께 다루는 메모리 기반 다중 에이전트 시스템을 제안한다. 제한된 생성 사례 145개, 보존형 편집 사례 1,584개, 편집 테스트 240개를 제시했고, 편집 테스트에서 99.9% 보존율과 0.6% 의도치 않은 변경률을 보고했다.

AI 생성 게임에서 편집 가능성은 부가 기능이 아니다. 플레이 가능한 프로토타입은 제작자가 방 하나, 소품 하나, 규칙 하나, 전투 하나를 바꿔도 나머지 세계가 다시 망가지지 않을 때 쓸모가 커진다. 그래서 장면 메모리, 국소 편집, 보존 확인이 첫 생성 품질만큼 중요해지고 있다.

시장과 도구 맥락

Tesana는 오늘 첫 소식은 아니지만 여전히 참고할 만한 스타트업 사례다. PC Gamer는 4월 AI 게임 제작 스타트업 Tesana가 첫 몇 주 동안 약 1만 명의 유료 사용자를 모았고, 더 많은 사람이 프롬프트로 게임을 만들게 하려 한다고 보도했다. Axios의 General Intuition 보도도 배경이다. 게임 데이터를 AI 학습에 쓰는 이 연구소는 6월 말 3억 2,000만 달러 규모의 시리즈 A 투자를 유치했다.

이 소식들은 AI 게임 주변의 자금과 사용 관심을 보여준다. 다만 오늘의 연구와 창작자 인터뷰가 던지는 질문에 답하지는 않는다. 그 게임에 규칙과 상태가 있는가. 반복 수정이 되는가. 생성 이후에도 계속 플레이할 이유가 있는가.

다음에 볼 것

  • AI Native Games의 정의가 런타임 AI 기제와 AI 보조 제작을 구분하는 공통 용어가 되는지.
  • Steam 사용자가 AI 공개 표시 필터를 충분히 많이 써서 찜 목록과 검색 노출에 영향을 주는지.
  • Tom’s Hardware가 일부 요금제의 사용 처리 방식이 바뀐다고 전한 7월 7일 이후에도 Fable 5 접근이 안정적인지.
  • Google Play의 Gemini 검색이 키워드 검색과 기존 순위표와 다른 방식으로 게임을 노출하는지.
  • GameCraft-Bench, JAMER, WebGameBench, OpenGame이 플레이 가능한 빌드를 포함한 비교 가능한 리더보드를 내놓는지.
  • MUSE 같은 3D 장면 편집 시스템이 독립 데모를 넘어 게임 엔진 워크플로와 연결되는지.

이 한국어 기사는 영어 원문을 번역한 것이며, 번역 과정에서 오류가 있을 수 있습니다. 이 글은 Wonder Bricks AI Agent의 도움을 받아 작성했으며 SunnyLabs가 편집했습니다.