[AI의 진화 시리즈 #3]
알파고와 뮤제로가 '특정 분야의 천재'였다면, 이제 소개할 **가토(Gato)**는 인공지능이 '만능 일꾼'으로 진화하는 중요한 변곡점입니다. 친근하면서도 핵심을 찌르는 문체로 안내해 드리겠습니다.

가토(Gato): 바둑 천재가 로봇 팔도 움직이고 채팅도 한다고?
안녕하세요! 지난 시간까지 우리는 규칙조차 스스로 배워버리는 똑똑한 AI '뮤제로'를 만나봤습니다. 그런데 말이죠, 지금까지의 AI들에게는 한 가지 치명적인 약점이 있었습니다. 바로 **'한 우물만 판다'**는 것이었죠.
바둑 AI는 바둑만, 번역 AI는 번역만 잘했습니다. 하지만 오늘 주인공 **가토(Gato)**는 이 고정관념을 완전히 깨버렸습니다.
🐱 이름은 고양이(Gato), 능력은 팔방미인!
스페인어로 '고양이'를 뜻하는 가토는 딥마인드가 2022년에 발표한 **'범용 에이전트(Generalist Agent)'**입니다. 가토의 가장 놀라운 점은 하나의 모델이 무려 604가지의 서로 다른 일을 동시에 수행한다는 거예요.
- 글쓰기: 사람과 자연스럽게 채팅을 나누고 질문에 답합니다.
- 눈(시각): 사진을 보고 무엇인지 설명(이미지 캡셔닝)합니다.
- 게임: 아타리 비디오 게임을 고득점으로 플레이합니다.
- 몸(행동): 실제 로봇 팔을 움직여 블록을 쌓습니다.
이 모든 것을 각각 다른 AI가 하는 게 아니라, 똑같은 신경망(가중치) 하나가 상황에 맞춰 수행합니다. 마치 낮에는 요리사, 밤에는 피아니스트, 주말에는 운동선수로 변신하는 초능력자 같죠?

🧩 비결은 "세상 모든 것을 토큰으로 만들기"
가토는 어떻게 이렇게 다재다능할 수 있을까요? 비결은 의외로 단순합니다. 가토는 세상의 모든 정보를 **'토큰(Token)'**이라는 공통 단위로 변환해서 받아들입니다.
- 텍스트도 토큰으로!
- 이미지 조각도 토큰으로!
- 로봇 팔의 움직임 값도 토큰으로!
가토에게는 일기를 쓰는 것이나 로봇 팔을 왼쪽으로 5cm 움직이는 것이나, 결국 **'다음에 올 토큰을 예측하는 일'**일 뿐입니다. 챗GPT가 다음 단어를 예측하며 문장을 이어가듯, 가토는 상황에 따라 단어를 내뱉거나 로봇 근육에 신호를 보냅니다.

🚀 "게임은 끝났다" (The Game is Over)
가토가 등장했을 때, 딥마인드의 한 연구원은 자신의 SNS에 **"게임은 끝났다(The Game is Over)"**라는 파격적인 말을 남겼습니다. 이제 인공일반지능(AGI, 인간과 대등한 범용 지능)으로 가는 길은 새로운 기술 개발이 아니라, 가토 같은 모델의 규모(Scale)를 키우는 문제만 남았다는 자신감이었죠.
물론 가토가 모든 분야에서 세계 최고는 아닙니다. 바둑은 알파제로보다 못할 수 있고, 채팅은 전용 모델보다 서툴 수 있죠. 하지만 **'하나의 뇌로 무엇이든 할 수 있다'**는 가능성을 보여주었다는 점에서 가토는 AI 역사에 한 획을 그었습니다.

💬 마무리 한마디
가토를 보면 인공지능이 점차 '도구'를 넘어 '존재'에 가까워지고 있다는 느낌이 듭니다. 화면 속에서 글자만 내뱉던 AI가 이제는 직접 로봇 팔을 움직여 물리적인 세상을 건드리기 시작했으니까요.
[다음 편 예고]
[AI의 진화 #4] RT-2: AI 비서가 이제는 심부름까지? 로봇에게 상식을 가르치다 가토가 로봇 팔을 '움직일 수 있다'는 걸 보여줬다면, 이제는 로봇이 우리의 말을 '알아듣고' 복잡한 심부름을 수행합니다. 구글의 최신 로봇 AI, RT-2 이야기를 기대해 주세요!
[추가 정보 분석]
알파제로와 뮤제로가 '특정 게임의 정점'을 찍는 진화였다면, **가토(Gato)**는 인공지능이 '만능 일꾼'으로 거듭나는 시대를 열었습니다. 딥마인드가 2022년에 공개한 가토는 인공일반지능(AGI)으로 향하는 중요한 이정표로 평가받습니다.
가토의 핵심 특징과 인공지능 역사에서의 의미를 정리한 내용입니다.
[분석] 바둑판을 넘어 세상 속으로, '가토(Gato)'가 제시한 범용 AI의 미래
그동안의 AI가 '특화된 천재'였다면, **가토(Gato)**는 '무엇이든 평균 이상으로 해내는 멀티 플레이어'입니다. 딥마인드는 가토를 통해 하나의 신경망이 얼마나 다양한 일을 동시에 수행할 수 있는지 그 한계를 시험했습니다.
1. 기술적 진화: "One Model, Hundreds of Tasks" (단일 모델의 다재다능함)
가토의 가장 놀라운 점은 동일한 가중치(Weights)를 가진 하나의 신경망으로 600가지가 넘는 서로 다른 작업을 수행한다는 것입니다.
| 구분 | 알파제로/뮤제로 | 가토 (Gato) |
| 성격 | 특정 분야의 전문가 (Specialist) | 다방면의 제너럴리스트 (Generalist) |
| 수행 작업 | 바둑, 체스, 게임 등 제어 중심 | 채팅, 이미지 캡셔닝, 로봇 조작, 게임 등 |
| 데이터 형태 | 게임 상태 정보 (수치) | 텍스트, 이미지, 로봇 관절 토크 등 (멀티모달) |
| 핵심 기술 | 강화학습 (RL) | 트랜스포머 (Transformer) + 멀티모달 학습 |

2. 가토의 3대 혁신 포인트
- 멀티모달(Multi-modal) 통합: 가토는 텍스트, 이미지, 비디오 게임의 버튼 입력, 심지어 실제 로봇 팔의 관절 움직임까지 모두 **'토큰(Token)'**이라는 단위로 변환하여 처리합니다. 마치 챗GPT가 문장을 생성하듯, 가토는 상황에 따라 문장을 쓸지, 로봇 팔을 움직일지, 게임기를 누를지를 결정합니다.
- 범용 에이전트의 실현: 가토는 무려 604개의 개별 작업을 학습했습니다. 이 중 450개 이상의 작업에서 전문가 수준의 50%가 넘는 성능을 기록했습니다. 이는 AI가 한 가지 기술을 배우기 위해 이전 지식을 삭제해야 했던 '파괴적 망각' 문제를 극복하고, 여러 능력을 한 몸에 담을 수 있음을 증명한 것입니다.
- 효율적인 모델 사이즈: 가토의 매개변수(Parameter)는 약 12억 개로, GPT-3(1,750억 개)에 비해 매우 작습니다. 하지만 이 작은 체구로도 로봇 제어와 언어 처리를 동시에 수행하는 효율성을 보여주었습니다.
3. 가토가 던진 메시지: "AGI의 문턱에 서다"

가토의 등장은 인공지능 커뮤니티에 "이제 규모(Scale)만 키우면 인공일반지능(AGI)에 도달할 수 있다"는 논쟁을 불러일으켰습니다.
- 로봇 공학의 혁신: 가토는 가상 세계뿐만 아니라 실제 물리적 환경에서 로봇 팔로 블록을 쌓는 능력을 보여주었습니다. 이는 AI가 디지털 세상을 넘어 현실 세계의 물리적 과제도 범용적으로 해결할 수 있음을 의미합니다.
- 지능의 정의 변화: 과거에는 '인간을 이기는 실력'이 지능의 척도였다면, 이제는 '얼마나 다양한 환경에 유연하게 적응하는가'가 새로운 지능의 기준이 되고 있습니다.
"가토는 이제 인공일반지능(AGI)으로 가는 게임이 '규모의 경쟁'으로 접어들었음을 선언한 모델이다."
— AI 전문가들의 평가
함께 보면 좋은 맥락:
가토는 이후 구글의 **RT-2(Robotics Transformer 2)**와 같은 모델로 이어지며, 로봇이 인간의 언어를 이해하고 스스로 판단하여 행동하는 '비전-언어-행동(VLA)' 모델의 시초가 되었습니다.
다음 단계가 궁금하신가요? [AI의 진화 #4] RT-2:AI 비서가 이제는 심부름까지? 기대해주세요~
'전설.설화' 카테고리의 다른 글
| 알파코드(AlphaCode): "코딩은 제가 할게요, 아이디어만 내세요!" (0) | 2026.03.20 |
|---|---|
| RT-2 말하면 움직인다 : 로봇에게 '상식 + 행동'을 부여하다 (0) | 2026.03.19 |
| 뮤제로(MuZero): "규칙이 왜 필요해?" 스스로 세상을 배우는 AI [AI의 진화 시리즈 #2] (0) | 2026.03.03 |
| 알파제로 (AlphaZero) : 인간의 지식을 버리고 '스스로' 신이 된 지능 [AI의 진화 시리즈 #1] (0) | 2026.03.02 |
| 프롤로그: 이세돌을 이긴 그날 이후, AI는 어디로 가고 있는가? [AI의 진화 시리즈 #0] (0) | 2026.03.02 |