NPC 추론도 LOD처럼 줄인다, AI LOD의 실험

새 AI 애니메이션 논문은 게임 엔진 관점에서 꽤 실용적인 질문을 던진다. 캐릭터가 카메라에서 멀리 떨어져 있다면, 그 캐릭터의 학습 기반 모션 모델을 왜 항상 최고 정밀도로 실행해야 할까?

6월 4일 제출된 “AI Level of Detail”은 게임 속 실시간 인간 동작 예측을 위해 거리 기반 정밀도 선택을 제안한다. 자세한 메시를 저렴한 메시로 바꾸는 대신, 머신러닝 추론 단계를 바꾼다. 가까운 NPC는 FP32를 쓴다. 중간 거리는 FP16을 쓴다. 먼 거리는 INT8을 쓴다.

작은 아이디어지만 의미가 있다. 학습 기반 애니메이션을 NPC에 붙은 마법이 아니라 프레임 예산의 일부로 다룬다.

논문은 Chen Li 연구진의 2018년 convolutional sequence-to-sequence 인간 동작 모델을 모션 예측기로 사용한다. 이 모델은 CMU Mocap 데이터로 학습되고, 모델 구조를 바꾸지 않은 채 세 가지 ONNX Runtime 버전으로 내보내진다. 제안된 런타임 선택기는 각 세션을 불러온 뒤 NPC와 카메라 사이의 거리를 읽고 알맞은 정밀도 단계로 추론을 보낸다.

보고된 숫자는 좁은 조건 안에서 읽어야 한다. Intel Core i7-14650HX 기반 CPU 전용 벤치마크에서 FP32 기준선은 포즈 시퀀스 8개 배치 기준 70.67ms로 제시됐다. FP16은 모델 크기를 거의 절반으로 줄이고, FP32 대비 오차가 매우 작은 상태에서 1.53배 지연 시간 개선을 보였다. INT8은 모델을 3.50MB로 줄이고 9.79배 속도 향상을 보고했지만, 오차가 더 크기 때문에 논문은 먼 거리 단계에만 배정한다.

작은 인지 실험도 있다. 참가자 15명이 가까운 거리와 먼 거리를 흉내 낸 확대 수준에서 스켈레톤 애니메이션을 비교했다. 논문은 각 단계가 의도한 거리 범위 안에서는 차이가 감지되지 않았고, INT8은 가까이 보였을 때 더 잘 드러났다고 설명한다.

이 정도면 AI LOD를 논의할 이유는 충분하다. 하지만 상용 준비가 끝났다고 말하기에는 부족하다.

게임 엔진은 이미 다른 영역에서 같은 예산 논리를 쓴다. Unity의 LOD 문서는 물체가 화면에서 작게 보일 때 렌더링 비용을 줄이는 방식으로 LOD를 설명한다. Unreal의 Animation Budget Allocator는 고정 예산 안에서 스켈레탈 애니메이션 작업을 줄이는 방법을 제공한다. ONNX Runtime과 TensorRT 문서는 양자화와 혼합 정밀도를 추론 배포의 일반적인 도구로 다룬다.

AI LOD는 이 세계들을 연결한다. 학습 기반 NPC 애니메이션이 흔해진다면, 스튜디오는 어떤 캐릭터에 비싼 추론을 쓰고 어떤 캐릭터에 저렴한 근사를 쓸지 정책을 가져야 한다. 그렇지 않으면 AI로 움직이는 군중은 렌더링, 물리, 입력, 오디오, 네트워크가 함께 써야 할 예산을 조용히 잡아먹을 수 있다.

거리는 첫 기준으로 괜찮다. 하지만 플레이어의 주의를 설명하는 전부는 아니다. 조준경에 잡힌 먼 보스는 가까운 배경 행인보다 중요할 수 있다. 머리 위에 퀘스트 표시가 뜬 NPC는 더 높은 정밀도가 필요할 수 있다. 군중 장면에서는 개별 스켈레톤이 작아도 타이밍 흔들림이 보일 수 있다. 카메라 컷 한 번으로 방금 전 먼 캐릭터가 클로즈업될 수도 있다.

논문도 몇 가지 한계를 분명히 한다. 전체 게임 엔진에 통합하지 않았다. GPU 벤치마크는 제외했다. GPU 양자화 성능이 하드웨어 지원에 크게 좌우되기 때문이다. 실험은 데이터셋 위의 고정 모션 예측기에서 이뤄졌고, 블렌딩, 역운동학, 전투 상태, 이동, 천 물리, 물리 연동, 네트워크 복제까지 포함한 상용 애니메이션 그래프가 아니다.

그래서 이 논문은 엔진 팀을 위한 벤치마크 제안으로 유용하다. 다음 실험은 실제 장면이어야 한다. 여러 캐릭터, 혼합 동작, 카메라 이동, 플레이어 주의 신호, 모바일과 콘솔 대상, 실제 프레임 예산이 필요하다. 인지 질문도 스켈레톤 클립만으로는 부족하다. 플레이어는 발 미끄러짐, 타격 타이밍, 몸짓의 명확성, 그리고 동작이 게임플레이 의도와 맞는지를 본다.

더 큰 아이디어는 설득력 있다. 게임 안의 AI 시스템도 메시만큼 LOD가 필요하다. 미래의 런타임은 주의도와 프레임 압박에 따라 모델 정밀도, 모델 크기, 틱 레이트, 클라우드 오프로딩, 행동 깊이를 바꿀 수 있다.

AI LOD는 그 문제에 깔끔한 이름을 붙였다. 이제 이 방법을 실제 게임 장면에서 깨뜨려 볼 차례다.

이 한국어 기사는 영어 원문을 번역한 것이며, 번역 과정에서 오류가 있을 수 있습니다. 이 글은 Wonder Bricks AI Agent의 도움을 받아 작성했으며 SunnyLabs가 편집했습니다.