오늘 뉴스레터는 Google의 Gemini 3.5 Pro 지연 보도, 오픈소스 코딩 에이전트 조사, Arkansas의 Roblox·Discord 소송, Claude와 Codex 보안 흐름, 삼성의 Codex 도입, 창작 도구 투자, Unreal과 PUBG의 AI 도구, 최근 플레이어블 게임 벤치마크를 다룬다.
밤사이 달라진 것
- Business Insider는 Google이 Gemini 3.5 Pro의 6월 출시 계획을 미루고 7월을 목표로 하고 있다고 보도했다.
- 새 arXiv 논문은 공개 저장소에서 코딩 에이전트 사용 흔적을 더 넓게 측정했고, 풀 리퀘스트만 보면 빠지는 커밋 단위 신호를 제시했다.
- Arkansas의 Roblox·Discord 소송은 어린이와 청소년이 많이 쓰는 창작 플랫폼의 안전 논의에 법적 압박을 더했다.
- Claude Code 비용, Codex Security, 삼성의 기업용 Codex 도입, Claude 서비스 불안정은 에이전트 도구가 실제 도입 단계에서 맞닥뜨리는 문제를 보여준다.
- 게임 생성 연구는 코드를 컴파일하는 데서 멈추지 않고 실행, 플레이, 점검, 수정이 가능한지를 계속 묻고 있다.
주요 항목
Google의 다음 Gemini 모델은 7월로 밀렸다는 보도가 나왔다
Business Insider는 Google이 Gemini 3.5 Pro의 6월 출시 목표를 7월로 미뤘다고 보도했다. 보도에 따르면 Google은 초기 이용자 반응을 더 모으는 중이며, 이 모델은 일부 Antigravity 이용자와 LMArena에서 테스트되고 있다. 새 모델은 긴 작업과 에이전트 사용 사례를 개선하는 쪽으로 예상된다.
게임 출시 소식은 아니지만 AI 게임 도구에는 중요하다. 게임 생성 시스템은 점점 더 긴 프로젝트 계획을 붙잡고, 여러 파일을 고치고, 실행 결과를 해석하고, 도구 루프를 유지할 수 있는 모델에 의존한다. Google이 다음 프런티어 모델을 에이전트 동작과 토큰 사용 문제에 맞춰 다듬고 있다면, 게임 도구 제작자는 순위표뿐 아니라 출시 시점, 가격, 개발자 접근 방식을 봐야 한다.
다만 이 항목은 Google의 공식 발표가 아니라 보도다. Google이 제품 공지로 지연을 설명한 것은 아니다. 실제 평가는 Gemini 3.5 Pro가 출시된 뒤 Antigravity, Google AI Studio, API 흐름에서 무엇을 할 수 있는지에 달려 있다.
오픈소스 에이전트 흔적은 한 가지 신호보다 크다
Arsham Khosravani와 Audris Mockus의 새 arXiv 논문은 World of Code의 1억 8,000만 개 이상 저장소에서 코딩 에이전트 흔적을 살폈다. 논문은 봇 계정, 커밋 메시지, 설정 파일, 작성자 정체성 같은 신호가 각각 다른 활동 조각만 보여준다고 설명한다.
수치는 크다. 저자들은 여러 탐지 방법을 합치면 한 시점에서 Claude Code 커밋 850,157개를 찾았지만, 봇 계정만 보면 그중 28,154개만 잡혔다고 밝혔다. 회수율은 3.3%다. 2024년 12월부터 2026년 4월까지의 스냅샷에서 커밋으로 잡힌 에이전트 활동은 월 32만 커밋을 넘었다. Claude Code는 해당 표본에서 17,295개 프로젝트, 886,122개 커밋으로 가장 컸고, 설정 파일에만 남은 사용 흔적도 21,078개 프로젝트에서 보였다.
게임 도구 제작자에게 이 조사는 유용하다. 많은 AI 게임 프로젝트는 보기 좋은 공개 풀 리퀘스트로만 남지 않는다. 프로토타입, 에셋 파이프라인, 테스트 하네스, 로컬 편집기 에이전트는 커밋, 설정, 생성된 뼈대 코드에 흔적을 남길 수 있다. 한 가지 채널만 보면 에이전트 도입 규모와 성격을 잘못 읽기 쉽다.
Roblox와 Discord는 새 아동 안전 소송을 마주했다
Axios는 Arkansas 법무장관 Tim Griffin이 Los Angeles Superior Court에 Roblox와 Discord를 상대로 소송을 냈다고 보도했다. 소장은 두 회사의 제품 설계가 아동을 노리는 범죄자에게 도움이 됐고, 부모에게 안전성을 오해하게 했다고 주장한다. Axios에 따르면 Arkansas는 금지명령, 손해배상, 원상회복, 부당이익 반환을 요구하고 있다.
Roblox는 Axios에 보낸 입장에서 이 주장을 부인했다. 회사는 해당 소송이 플랫폼 작동 방식을 잘못 설명하고 자사의 안전 조치를 인정하지 않는다고 밝혔다. Discord도 Arkansas Advocate가 전한 입장에서 자사의 안전 투자와 플랫폼을 잘못 묘사했다고 반박했다.
Wonder News에서는 이 항목을 AI 생성의 큰 결론으로 다루기보다 플랫폼과 가족 신뢰 문제로 본다. Roblox는 어린 이용자가 많이 쓰는 창작 환경이고, 안전 정책은 AI 보조 제작, 채팅, 계정, 연령 제한 기능의 적용 방식에 영향을 준다. Roblox가 1월에 공개한 얼굴 연령 확인 채팅 정책은 오늘 소송을 읽는 구체적 배경이다.
에이전트 도구는 비용, 보안, 기업 도입을 지나고 있다
Business Insider의 Claude Code 인터뷰는 비용 논의를 이어간다. Boris Cherny는 기업이 AI 비용을 따지는 것은 맞지만, 가치 있는 흐름을 찾기 전에 실험 자체를 막으면 안 된다고 말했다. 그는 AI가 작성한 코드 비율 같은 단순 지표도 에이전트가 훨씬 많은 코드를 맡기 시작하면 덜 유용해진다고 봤다.
WIRED의 OpenAI 보도는 보안 쪽을 더한다. OpenAI의 Patch the Planet은 Trail of Bits와 함께 시작했고 HackerOne, Calif 같은 파트너와 오픈소스 유지관리자에게 무료 보안 컨설팅을 제공한다. WIRED는 OpenAI가 Codex Security 스캐너를 앱 플러그인으로 내놓고 오픈소스와 비공개 코드 사용을 보조했으며, 30개 넘는 프로젝트가 이미 참여 중이라고 전했다.
기업 도입 신호는 삼성이다. Economic Times는 삼성이 Device Experience 부문 전반에 ChatGPT Enterprise와 Codex를 전 세계적으로 도입하고 있다고 보도했다. 반대로 Claude 오류율 상승 보도는 현실적인 제약을 보여준다. 호스팅된 코딩 에이전트를 쓰는 팀은 서비스 안정성, 비용 정책, 보안 검토를 같이 받아들여야 한다.
게임 도구는 여전히 플레이 가능한 증거가 필요하다
Unreal Engine과 PUBG는 AI가 서로 다른 표면에서 쓰이는 사례라서 묶음에 남겼다. Epic의 UE5.8 글은 고급 월드 제작, 식생, 캐릭터, 애니메이션, 모바일, LLM 작업 흐름 업데이트를 소개했고, Unreal 프로젝트를 LLM 시스템이 이해하도록 돕는 실험적 MCP 플러그인도 포함했다. UE6 로드맵은 Verse, Scene Graph, 콘텐츠 이동성, Claude·Gemini 등 모델과의 MCP 통합을 말한다.
NVIDIA의 PUBG Ally 베타는 플레이어가 직접 만나는 쪽이다. NVIDIA는 2주 베타가 PUBG Arcade Duo Mode에 AI 팀원을 추가하고, 빠른 행동은 행동 트리가, 인지 계층은 NVIDIA ACE가 맡는다고 설명했다. 이는 에디터 안의 AI가 아니라 실제 게임 모드 안에서 AI 동료를 시험하는 사례다.
연구도 비슷한 방향을 보고 있다. PlayCoder는 LLM이 만든 GUI 앱이 컴파일은 되지만 끝까지 플레이되는지에서 실패할 수 있다고 보고, 다중 에이전트 수정 루프로 결과를 개선한다. ADK Arena는 LLM이 프레임워크 문서를 보고 에이전트를 만들고 테스트가 통과할 때까지 고치는 방식으로 에이전트 개발 키트를 평가한다. GameCraft-Bench, OpenGame, GUI Agents for Continual Game Generation, GamED.AI는 실행, 플레이테스트, 시각적 사용성, 공식화된 메커닉 계약에 가까운 평가를 이어간다.
모델, 에이전트, 개발 도구
- Gemini 3.5 Pro: 7월 목표 보도는 Google Antigravity나 긴 코딩 작업 벤치마크를 보는 에이전트 제작자에게 중요하다.
- 코딩 에이전트 조사: arXiv 논문은 풀 리퀘스트, 봇 계정, 커밋 메시지, 설정 파일이 각각 다른 활동을 놓친다고 말한다.
- Claude Code 비용: Cherny의 발언은 “AI가 코드를 얼마나 썼나”보다 팀이 오래 쓸 만한 흐름을 찾을 수 있는지가 중요하다는 쪽으로 질문을 바꾼다.
- Codex Security: Patch the Planet은 검증, 패치, 유지관리자 지원을 포함해 코딩 에이전트를 오픈소스 보안 관리 안으로 넣는다.
- 삼성과 Codex: 삼성 도입 보도는 기업용 코딩 에이전트가 스타트업과 초기 이용자 바깥으로 넓어지는 신호다.
- Sakana Fugu: 어제 별도 기사로 다룬 Fugu는 오늘 모델 오케스트레이션과 다중 에이전트 라우팅의 배경으로만 남겼다.
게임, 엔진, 창작 플랫폼
- Roblox와 Discord 소송: Arkansas의 소송은 어린 플레이어와 창작자가 쓰는 플랫폼의 안전 주장을 겨냥한다. Roblox와 Discord는 의혹을 부인했다.
- Roblox 연령 확인: Roblox의 얼굴 연령 확인 정책은 현재 채팅 안전 정책을 확인할 수 있는 1차 출처다.
- Unreal Engine 5.8: Mesh Terrain, PCG, MetaHuman, 모바일 작업 흐름, MCP 플러그인은 UE5.8을 구체적인 창작 도구 릴리스로 만든다.
- Unreal Engine 6: Verse, Scene Graph, 콘텐츠 이동성, 모델 통합은 지금 당장 현재 UE 작업 흐름을 대체하는 기능이 아니라 로드맵이다.
- PUBG Ally: NVIDIA 베타는 기존 상용 게임 모드 안에서 AI 팀원을 시험하는 비교적 뚜렷한 사례다.
- NaukNauk: Axios는 장난감 사진과 프롬프트로 15~20초 영상을 만드는 AI 앱이 2,000만 달러를 투자받았다고 보도했다. 놀이와 어린 이용자 가까이에 있는 창작 도구 신호다.
벤치마크, 연구, 측정
- PlayCoder: 이 논문은 GUI나 게임이 컴파일되는지와 실제로 끝까지 플레이되는지를 나눠 본다.
- ADK Arena: 프레임워크 선택은 중요하다. API 사용성과 검증 루프가 LLM이 에이전트를 만드는 데 드는 노력을 바꾸기 때문이다.
- GameCraft-Bench: Godot 벤치마크는 재생된 시연과 멀티모달 루브릭으로 실행 가능한 게임플레이를 본다는 점에서 계속 유용하다.
- OpenGame: 웹 게임 생성 과정을 구조 잡기, 코딩, 디버깅, 브라우저 실행, 시각 판정까지 이어지는 흐름으로 본다.
- GUI 플레이테스트: PlaytestArena와 Play2Code는 정적 테스트에만 의존하지 않고 GUI 플레이테스터를 생성 루프 안에 넣는다.
- GamED.AI: 교육용 게임 생성은 일반 게임 제작보다 범위가 좁지만, 메커닉 계약, 품질 게이트, 비용 수치를 확인할 수 있다.
다음에 볼 것
- Google이 Gemini 3.5 Pro 시점을 확인하고 개발자 접근, 가격, 컨텍스트, 에이전트 도구 세부사항을 공개하는지.
- 코딩 에이전트 도입 조사가 커밋, 설정, 봇, 풀 리퀘스트, 작성자 신호를 함께 쓰기 시작하는지.
- Arkansas의 Roblox·Discord 소송이 플랫폼 안전 기능, 연령 확인, 채팅 설계, 부모 감독 주장에 변화를 주는지.
- OpenAI의 Patch the Planet이 유지관리자가 실제로 받아들일 수 있는 공개 패치를 만들어 내는지.
- UE6의 모델 통합과 Verse 로드맵이 Blueprints, C++, 현재 UE5 제작 흐름에 의존하는 팀에게 실용적인 작업 방식이 되는지.
- 플레이어블 게임 벤치마크가 공유 가능한 리플레이 기록, 브라우저나 엔진 스모크, 플레이어가 볼 수 있는 점수 체계로 모이는지.
이 한국어 기사는 영어 원문을 번역한 것이며, 번역 과정에서 오류가 있을 수 있습니다. 이 글은 Wonder Bricks AI Agent의 도움을 받아 작성했으며 SunnyLabs가 편집했습니다.