휴머노이드 제어에서는 특정 하나의 표준 용어만 쓰이기보다는, **여러 계열의 AI/제어 패러다임**이 병행됩니다. 다만 업계/연구에서 자주 쓰는 핵심 용어들을 구조적으로 정리해보면 다음과 같습니다.

# 로봇 제어 파운데이션 모델

---

# 1) End-to-End 계열 (최근 트렌드)

## (1) VLA (Vision-Language-Action)

- 멀티모달 입력 → 행동 출력
- 대표:
  - RT-2 (Google)
  - PaLM-E

👉 휴머노이드 적용:

- “물건 집어”, “문 열어” 같은 고수준 명령 → 바로 행동 생성

---

## (2) Generalist Policy / Foundation Model for Robotics

- 하나의 모델이 여러 작업 수행
- 대규모 데이터 기반

다른 표현:

- **Robot Foundation Model**
- **Generalist Robot Policy**

👉 핵심:

> “하나의 모델로 다양한 태스크 처리”

---

## (3) Behavior Cloning (BC)

- 인간/시연 데이터를 그대로 학습
- imitation learning

👉 특징:

- 구현 쉬움
- 일반화는 제한적

---

# 2) Reinforcement Learning (강화학습 계열)

## (4) RL Policy / Control Policy

- 상태 → 행동을 결정하는 정책 π(a|s)

### 대표 알고리즘

- PPO (가장 많이 쓰임)
- SAC
- DDPG

👉 휴머노이드에서:

- 걷기 (locomotion)
- 균형 유지 (balance)
- 조작 (manipulation)

---

## (5) Hierarchical RL (HRL)

- 고수준 + 저수준 분리

예:

- High-level: “걸어서 문까지 이동”
- Low-level: “각 관절 제어”

👉 휴머노이드에서 매우 중요

---

# 3) Control + Model 기반 접근

## (6) MPC (Model Predictive Control)

- 미래 상태 예측 기반 최적 제어

👉 특징:

- 안정성 높음
- 물리 기반

---

## (7) Whole-Body Control (WBC)

- 휴머노이드 핵심 용어

### 역할:

- 모든 관절을 동시에 제어
- 균형 + 접촉 + 힘 제어

👉 예:

- 서기, 걷기, 물건 들기

---

# 4) Planning + Reasoning 계열

## (8) Task and Motion Planning (TAMP)

- 작업 계획 + 물리 움직임 결합

👉 예:

- “컵 잡고 → 테이블로 이동 → 내려놓기”

---

## (9) World Model

- 환경을 내부적으로 모델링

👉 최근 트렌드:

- latent space dynamics
- simulation-free planning

---

# 5) 실제 시스템 구조 (중요)

휴머노이드는 보통 하나의 모델로 안 끝남:

```
[Language / Task Model]
        ↓
[High-level Planner]
        ↓
[Policy (RL / VLA / BC)]
        ↓
[Whole Body Controller (WBC)]
        ↓
[Actuators]
```

👉 즉:

> AI 모델 + 전통 제어가 **계층적으로 결합**

---

# 6) 핵심 용어 요약 (실무에서 많이 쓰는 것)

휴머노이드 맥락에서 가장 중요한 키워드:

- **Policy (π)**
- **Locomotion Policy**
- **Manipulation Policy**
- **Whole-Body Control (WBC)**
- **MPC**
- **Behavior Cloning (BC)**
- **Reinforcement Learning (RL)**
- **VLA / Robot Foundation Model**

---

# 7) 한 줄 정리

> 휴머노이드 제어 AI는 특정 단일 용어가 아니라
> **Policy + Control + Planning을 결합한 계층형 시스템**으로 부른다.