DeepMind의 AGI 이후 보고서, 논점을 ‘도달’에서 ‘그 다음 속도’로 옮기다

Google DeepMind가 대부분의 AGI 논의가 멈추는 지점에서 출발하는 보고서를 냈다. 60페이지 분량의 From AGI to ASI는 인공 일반 지능이 이미 도착했다고 주장하지 않는다. 인간 수준 AGI가 현실이 된 뒤, 그 시스템이 인공 초지능으로 계속 개선된다면 무엇이 벌어지는지를 묻는다.

이 관점이 중요한 이유는 AGI를 결승선이 아니라 불안정한 중간 단계로 보기 때문이다. 저자 명단에는 AGI라는 용어를 대중화한 인물 중 한 명인 Shane Legg와, 보편 인공지능 연구로 알려진 Marcus Hutter가 포함돼 있다. 실무적 메시지는 더 단순하다. 주요 연구소들이 AGI를 다음 10년 안의 구체적 목표로 말하기 시작했다면, 이제는 그 문턱 이후 시스템이 얼마나 빨리 움직일 수 있는지를 따져야 한다.

보고서는 경로의 끝에 있는 ASI를 대규모 인간 조직보다 더 높은 인지 능력을 갖춘 지능으로 본다. 이는 “여러 일을 잘하는 챗봇”보다 훨씬 강한 기준이다. 연구, 엔지니어링, 계획, 발견을 여러 영역에 걸쳐 조율할 수 있고, 어떤 단일 인간 팀도 따라가기 어려운 수준의 시스템을 가리킨다.

DeepMind 저자들은 AGI에서 ASI로 가는 큰 경로를 네 가지로 나눈다. 첫째는 스케일링이다. 이미 범용성을 갖춘 시스템 주변의 모델, 데이터, 도구, 훈련, 배포 환경을 계속 확장하는 경로다. 둘째는 패러다임 전환이다. 단순히 자원을 더 넣는 것이 아니라 새로운 구조나 훈련 방식이 기울기 자체를 바꾸는 경우다. 셋째는 AI가 다음 AI 시스템 개선을 돕는 재귀 개선이다. 넷째는 하나의 거대한 모델이 아니라 대규모 에이전트 집단에서 초지능이 나타나는 경로다.

AI 생성 게임 관점에서는 마지막 두 경로가 가장 구체적이다. 게임 세계는 측정 가능한 환경이다. 에이전트는 행동하고, 실패하고, 학습하고, 협력하고, 목표에 대해 평가받을 수 있다. 2025년 12월 제출된 DeepMind의 SIMA 2 논문도 가상세계를 목표 지향 에이전트의 훈련장으로 본다. SIMA 2는 낯선 3D 환경 전반에서 일반화하고, Gemini가 만든 과제와 보상을 바탕으로 새 기술을 처음부터 학습할 수 있다고 설명된다.

물론 “게임이 ASI를 만든다”는 뜻은 아니다. 다만 게임 같은 환경은 장기 행동, 도구 사용, 기억, 공간 추론, 협력, 피드백을 대규모로 시험할 수 있는 몇 안 되는 장소다. ASI가 에이전트 집단이나 재귀 개선에서 나온다면, 생성형 월드의 어려운 제품 질문은 더 예쁜 에셋이 아니라 환경이 쓸모 있는 진전을 측정할 수 있느냐가 된다. 잘못된 꼼수를 보상하지 않는 것도 그 일부다.

AlphaEvolve는 이번 보고서가 완전히 공상처럼 보이지 않게 만드는 또 다른 사례다. DeepMind는 2025년 백서에서 언어 모델이 알고리즘을 수정하고, 평가자 피드백을 받고, 반복 개선하는 진화형 코딩 에이전트를 설명했다. 이 시스템은 행렬 곱셈과 Google 인프라 등에서 개선을 찾았다. 이것이 일반적 재귀 자기개선은 아니지만, ASI 보고서가 주목하는 패턴은 보여준다. 강한 평가자가 있을 때 AI 시스템은 기술 시스템 자체를 개선할 수 있다.

병목은 평가자다. 게임은 승리, 충돌, 속도, 레벨 완료, 플레이어가 보는 실패를 점수화할 수 있다. 수학과 코드는 때때로 정확한 테스트를 쓸 수 있다. 하지만 중요한 연구 문제와 거버넌스 문제 다수에는 깨끗한 보상 함수가 없다. AGI 이후 시스템이 잘못된 대리 지표를 최적화하면, 더 빨라질 수는 있어도 더 신뢰할 수 있거나 사람에게 더 유익해진다고 말하기 어렵다.

DeepMind의 최근 AGI 측정 논문들은 왜 이 회사가 용어를 프레임워크로 바꾸려 하는지 보여준다. 2023년 “Levels of AGI” 논문은 시스템을 성능, 일반성, 자율성으로 분류하는 방식을 제안했다. 2026년의 인지 프레임워크 논문은 AGI 주장이 여전히 모호하다고 보고, 하나의 벤치마크 점수 대신 여러 인지 능력 전반에서 시스템을 측정하자고 제안한다.

이번 ASI 보고서는 그 흐름을 연장한다. 가속이 어디서 나올 수 있는지, 어디서 느려질 수 있는지, 어떤 마찰이 실제로 중요할지를 묻는다. 연산과 에너지는 스케일링을 제한할 수 있다. 새로운 구조가 항상 깔끔한 도약을 보장하지는 않는다. AI가 자기 변화를 신뢰성 있게 평가하지 못하면 재귀 개선은 멈출 수 있다. 멀티 에이전트 집단은 조정 비용, 보안 문제, 정렬 실패를 안을 수 있다.

안전 측면의 함의는 ASI가 강력하다는 말에 그치지 않는다. 사회가 하나의 선명한 AGI 순간이 아니라 여러 차례의 전환을 연속으로 겪을 수 있다는 점이 핵심이다. DeepMind의 2025년 기술적 AGI 안전 논문은 이미 오용, 정렬 실패, 실수, 구조적 위험을 주요 범주로 나누고, 위험 능력 평가, 접근 통제, 모니터링, 모델 수준 훈련, 시스템 수준 보안을 완화책으로 다뤘다. ASI 보고서는 같은 우려를 더 먼 구간까지 밀고 간다.

게임과 제작자 플랫폼에는 더 날카로운 로드맵을 남긴다. AGI 이후 세계에서 중요한 플랫폼은 단순 생성기가 아니다. 에이전트가 만들고, 시험하고, 고치고, 경쟁하고, 협력하고, 실제로 측정 가능한 규칙 안에 묶이는 통제된 환경이다. 지속형 월드, 멀티플레이 상태, 에셋 권리, 모더레이션, 서버가 책임지는 규칙 판정은 제품 기능을 넘어 평가 인프라가 된다.

보고서는 아직 운영 매뉴얼이라기보다 지도에 가깝다. AGI가 언제 도착하는지, 스케일링이 계속 작동하는지, 재귀 개선이 열린 형태로 이어질 수 있는지는 결론내리지 않는다. 다만 공개 논의를 하나의 문턱 질문 너머로 옮긴다. AGI가 도달된다면, 다음 전환은 지금의 논의가 대비한 것보다 더 빠르고, 더 복잡하고, 더 분산된 형태일 수 있다.

이 한국어 기사는 영어 원문을 번역한 것이며, 번역 과정에서 오류가 있을 수 있습니다. 이 글은 Wonder Bricks AI Agent의 도움을 받아 작성했으며 SunnyLabs가 편집했습니다.