구글 딥마인드의 <Genie 3>는 텍스트 한 줄로 완전한 세계를 생성하는 AI 월드 모델입니다. 텐센트의 <Hunyuan-GameCraft>도 AAA급 게임 환경을 실시간으로 재창조합니다. 나노 바나나의 출시로 모두가 일관성을 이야기합니다. 하지만 인공지능 기술은 이미 '이미지'를 넘어 '세계'를 이해하고 예측하는 역사적 변곡점에 서있습니다. 월드 모델은 단순한 비디오 생성이 아닙니다. 현재 상태와 사용자의 행동을 읽어 다음 순간을 예측하는, 마치 신이 우주의 법칙을 설계하듯 세계의 규칙을 학습하는 기술입니다. 즉, 실시간 상호작용이 가능하죠.
60 프레임의 일관성이 만든 가능성
얀(Yan)이 구현하는 1080p 60 FPS의 세계는 놀랍도록 섬세합니다. 스카이워크의 <Matrix-Game 2.0>이 GTA5 게임 데이터로 학습한 도시는 실제보다 더 실제 같습니다. 이들 월드 모델이 공통적으로 돌파한 것은 '시간적 일관성'이라는 난제입니다. 오토리그레시브 방식으로 매 프레임을 예측하면서도, KV 캐싱과 역사 조건 훈련으로 오류 축적을 최소화했죠. 물이 흐르고, 그림자가 움직이고, 캐릭터가 걷는 모든 순간이 물리 법칙과 인과관계를 따릅니다. 게임이 아닌 현실의 시뮬레이션입니다.
자율주행차가 미래를 보는 방식
호라이즌 로보틱스의 <Epona>는 주행 궤적을 입력받아 2분 후의 교통 상황을 예측합니다. 월드 모델은 게임을 넘어 생명과 직결된 영역으로 확장됩니다. 뉴플랜(NuPlan) 등의 데이터로 훈련된 이 모델은 NAVSIM 벤치마크에서 기존 플래너를 7.4% 상회하는 성능을 보였습니다. 차선 변경, 신호 대기, 보행자 회피까지. AI는 이제 도로라는 복잡한 세계의 규칙을 이해하고 미래를 그려냅니다. 시뮬레이션이 현실을 대체하는 것이 아니라, 현실을 더 안전하게 만드는 도구가 되고 있습니다.
창작자가 신이 되는 UGC 2.0 시대
다이내믹스 랩의 <Mirage>는 자연어로 환경을 실시간 변경합니다. "골목을 추가해"라고 말하면 골목이 생기고, "비를 내려"라고 명령하면 비가 내립니다. 월드 모델이 만든 가장 혁명적인 변화는 '창작의 민주화'입니다. 오디세이(Odyssey)는 360도 카메라 데이터로 실제 세계를 복제하고, 유메(Yume)는 키보드 입력만으로 무한한 세계를 탐험하게 합니다. 이제 누구나 자신만의 우주를 설계할 수 있습니다. 코딩 없이, 렌더링 없이, 오직 상상력만으로. 그렇게 누구나 세계를 만들 수 있다면, 무엇이 진짜 창조를 구분 짓게 될까요?
세계를 디자인하는 AI 디렉터스
월드 모델이 무한한 세계를 생성할 때, 진짜 질문은 '어떤 세계가 의미 있는가'입니다. 프롬은 이런 세계를 준비했습니다. AI의 생성 능력과 인간의 서사적 직관을 결합해, 단순한 시뮬레이션을 넘어 감동과 통찰을 담은 콘텐츠를 창조하는 일 말이죠. Genie 3가 만든 천 개의 평행우주 중 어느 것이 관객의 마음을 움직일까요? Matrix-Game이 생성한 도시 중 어디에 이야기가 숨어있을까요? AI가 생성한 수만 개의 세계 중 단 하나를 선택할 줄 아는 디렉터의 안목. 바로 그것이 프롬이 추구하는 가치입니다. 시작과 끝은 인간이 하되, 과정은 AI와 함께. 월드 모델의 시대, 우리는 창조자가 아닌 선택자가 되어가고 있습니다. 💌 살펴보기
인간은 생각하고, 기계는 기술한다.
AI 스토리텔링 랩 '프롬'은 주식회사 생각식당이 운영하는 인공지능과 인문지성을 연결하는 ‘AI 스토리텔링 실험실’이자, 좋은 AI 도구로 더 좋은 이야기를 만드는 ‘AI 콘텐츠 스튜디오’입니다.