로봇, 휴머노이드 기업들이 쓰는 현실적인 스택 기준
**휴머노이드 기업들이 쓰는 구조**를 현실적인 스택 기준으로 정리해보겠습니다. 핵심은 “하나의 AI 모델”이 아니라 **계층형 제어 스택**입니다.
카테고리: uploads | 읽기시간: 2분 | 원문: 다운로드
로봇, 휴머노이드 기업들이 쓰는 현실적인 스택 기준
휴머노이드 기업들이 쓰는 구조를 현실적인 스택 기준으로 정리해보겠습니다. 핵심은 “하나의 AI 모델”이 아니라 계층형 제어 스택입니다.
1) 공통 아키텍처 (산업 표준 형태)
대부분 아래 구조를 따릅니다:
[Perception / VLM]
↓
[Task Planning (LLM or symbolic)]
↓
[Policy (RL / BC / VLA)]
↓
[Whole-Body Control (WBC) / MPC]
↓
[Motor Control]
2) 회사별 접근 방식
① Tesla Optimus
특징: “자율주행 스택 재활용 + End-to-End 지향”
- Perception
- 카메라 기반 (FSD 스택)
- Vision Transformer 계열
- Planning
- Neural planner (명시적 LLM은 아직 제한적)
- Policy
- Imitation Learning + RL 혼합
- End-to-end leaning을 강하게 지향
- Control
- 전통 제어 + learned policy 결합
👉 핵심 전략:
> 자율주행처럼 “vision → action” 통합
② Figure AI (Figure 01)
특징: “LLM + VLA 적극 통합”
- OpenAI와 협력 (GPT 기반 reasoning)
- Perception
- Vision + multimodal model
- Planning
- LLM (고수준 의사결정)
- Policy
- VLA (Vision-Language-Action)
- Control
- WBC + learned controller
👉 핵심:
> “언어 이해 + 물리 행동” 통합
③ Boston Dynamics (Atlas)
특징: “전통 제어 + 일부 학습”
- Perception
- 제한적 (task-specific)
- Planning
- rule-based / trajectory planning
- Policy
- 거의 없음 (RL 일부만 사용)
- Control
- 매우 강력한:
- MPC
- Whole-body control
👉 핵심:
> 안정성 중심 (AI보다 control engineering)
④ Agility Robotics (Digit)
- Boston Dynamics와 Tesla 사이
- Policy
- RL 기반 locomotion
- Control
- WBC + MPC
👉 핵심:
> 산업 적용 (물류 등)에 최적화
3) 핵심 비교
| 영역 | Tesla | Figure | Boston Dynamics |
|---|---|---|---|
| 철학 | End-to-End | Multimodal AI | Classical Control |
| VLA 사용 | 제한적 | 적극적 | 거의 없음 |
| LLM | 거의 없음 | 핵심 | 없음 |
| RL | 있음 | 있음 | 일부 |
| WBC | 있음 | 있음 | 매우 강함 |
| 안정성 | 중간 | 초기 단계 | 매우 높음 |
4) 중요한 기술적 구분
(A) “Brain” vs “Body”
- Brain (AI)
- VLA
- RL policy
- LLM planner
- Body (Control)
- WBC
- MPC
- PID
👉 핵심:
> AI가 아무리 좋아도
> WBC/MPC 없으면 휴머노이드는 못 움직임
(B) 왜 VLA만으로 안 되는가
VLA는:
- 고수준 행동 생성에는 강함
하지만:
- 토크 제어
- 균형 유지
- 접촉 역학
👉 이런 건 못함
그래서:
> 반드시 low-level controller (WBC/MPC) 필요
5) 현재 트렌드 (2025~2026)
방향성 1
> VLA + RL + WBC 하이브리드
방향성 2
> LLM → High-level planner
방향성 3
> Simulation → Real transfer (Sim2Real)
6) 실무적으로 기억할 포인트
휴머노이드 AI에서 중요한 용어는 결국 4개로 정리됨:
- VLA / Foundation Model → 이해 & 명령
- Policy (RL/BC) → 행동 생성
- WBC / MPC → 물리 제어
- Planner (LLM/TAMP) → 작업 분해
7) 한 줄 핵심
> 휴머노이드 제어는
> “VLA 같은 AI 모델 하나”가 아니라
> AI + Control이 결합된 계층형 시스템이다.