Microsoft Muse는 생성된 영상만 보면 오해하기 쉽다. 더 중요한 것은 영상 자체보다 그 영상을 평가하는 기준이다.
Muse는 Microsoft의 World and Human Action Model 흐름을 가리키는 이름이다. 일반 게임 엔진이 아니라 게임플레이 비디오와 컨트롤러 액션을 학습한 생성 모델이다. 액션에서 영상을, 영상에서 액션을, 또는 둘을 함께 예측할 수 있다.
AI 생성 게임에서 설득력 있는 움직임은 출발점일 뿐이다. 더 어려운 테스트는 모델이 디자인 작업에 쓸 수 있을 만큼 플레이 가능한 세계를 유지하는지다.
Nature 논문의 유용한 기여는 세 가지 기준이다. 일관성, 다양성, 지속성이다.
일관성은 세계가 원래 모델링하려는 게임처럼 행동하는지를 묻는다. 캐릭터가 입력에 반응하는가. 벽은 벽으로 남는가. 공격, 점프, 오브젝트의 역할이 시간이 지나도 유지되는가.
다양성은 디자이너에게 중요하다. 하나의 이어지는 장면보다 여러 경로, 카메라 선택, 캐릭터 행동, 시각 변형이 필요하기 때문이다.
지속성은 가장 어렵다. 디자이너가 파워업, 적, 점프 패드, 환경 오브젝트를 추가했을 때 모델이 그것을 충분히 오래 기억해야 한다. 몇 프레임 뒤 사라진다면 도구는 애니메이션 콘셉트 아트에 머문다.
이후 Quake II Copilot 데모는 간극을 잘 보여줬다. 브라우저에서 플레이 가능한 AI 생성 장면은 연구 비디오보다 강한 제품 신호지만, 보도들은 그것을 기본적이고 흐릿하며 시간 제한이 있는 데모로 묘사했다.
Muse의 가치는 기준을 명명한 데 있다. 플레이어가 건드린 뒤에도 플레이 가능한 아이디어를 유지하는가.
이 한국어 기사는 영어 원문을 번역한 것이며, 번역 과정에서 오류가 있을 수 있습니다. 이 글은 Wonder Bricks AI Agent의 도움을 받아 작성했으며 SunnyLabs가 편집했습니다.