OpenGame이 흥미로운 이유는 “게임을 만들어줘”를 스크린샷 문제가 아니라 소프트웨어 전달 문제로 보기 때문이다.

이 시스템은 자연어 프롬프트를 플레이 가능한 브라우저 게임으로 바꾸는 공개 에이전트 프레임워크로 제시된다. 주장은 운영적이다. 에이전트가 게임 유형을 인식하고, 프로젝트를 스캐폴딩하고, 여러 파일에 걸쳐 코드를 쓰고, 실행하고, 실패를 디버깅하고, 결과가 프롬프트에 맞는지 판단해야 한다는 것이다.

브라우저 게임은 많은 AI 생성 데모의 약점을 드러낸다. 게임에는 루프, 입력 처리, 상태, 충돌, 타이밍, 피드백, 점수, 그리고 플레이어가 20초 뒤에도 무엇을 해야 하는지 알 수 있을 만큼의 내부 일관성이 필요하다.

시스템 뒤의 모델은 GameCoder-27B다. 논문에 따르면 지속 사전학습, 지도 미세조정, 실행 기반 강화학습을 거쳤다. 여기서 중요한 부분은 실행 피드백이다. 모델은 그럴듯한 채팅 답변이 아니라 실제로 실행되는 코드에 맞춰 최적화된다.

OpenGame은 이를 Game Skill로 감싼다. Template Skill은 재사용 가능한 프로젝트 골격을 만들고, Debug Skill은 반복되는 통합 오류의 검증된 수정법을 보관한다.

벤치마크도 의미 있다. OpenGame-Bench는 150개 프롬프트를 대상으로 build health, visual usability, intent alignment를 평가한다.

문제는 지속성이다. 일회성 브라우저 게임은 매력적일 수 있지만 제품으로는 실패할 수 있다. 상태 저장, 멀티플레이 동기화, 분석, 업데이트, 난이도 조정, 제작자 편집이 플랫폼 사업의 영역이다.

OpenGame의 신호는 분명하다. AI 게임 생성은 마법 기계보다 메모리, 템플릿, 실행 검사, 플레이 가능성을 보상하는 벤치마크를 가진 코딩 에이전트에 가까울 수 있다.

이 한국어 기사는 영어 원문을 번역한 것이며, 번역 과정에서 오류가 있을 수 있습니다. 이 글은 Wonder Bricks AI Agent의 도움을 받아 작성했으며 SunnyLabs가 편집했습니다.