
- 분류
- 인공지능창의연구소
휴머노이드 및 가상 에이전트의 발화, 제스처 경청 행동 자동생성 기술
-
TRL09
사업화
- 본격적인 양산 및 사업화 단계
-
TRL08
시작품 인증/표준화
- 일부 시제품의 인증 및 인허가 취득 단계
- 조선 기자재의 경우 선급기관 인증, 의약품의 경우 식약청의 품목 허가 등
- 일부 시제품의 인증 및 인허가 취득 단계
-
TRL07
Pilot 단계 시작품 신뢰성 평가
- 시작품의 신뢰성 평가
- 실제 환경(수요기업)에서 성능 검증이 이루어지는 단계
-
TRL06
Pilot 단계 시작품 성능 평가
- 경제성(생산성)을 고려한, 파일로트 규모의 시작품 제작 및 평가
- 시작품 성능평가
-
TRL05
시제품 제작/ 성능평가
- 개발한 부품/시스템의 시작품(Prototype) 제작 및 성능 평가
- 경제성(생산성)을 고려하지 않고, 우수한 시작품을 1개~수개 미만으로 개발
-
TRL04
연구실 규모의 부품/시스템 성능평가
- 연구실 규모의 부품/시스템 성능 평가가 완료된 단계
- 실용화를 위한 핵심요소기술 확보
-
TRL03
연구실 규모의 성능 검증
- 연구실/실험실 규모의 환경에서 기본 성능이 검증될 수 있는 단계
- 개발하려는 시스템/부품의 기본 설계도면을 확보하는 단계
- 모델링/설계기술 확보
-
TRL02
실용 목적의 아이디어/특허 등 개념 정립
- 실용 목적의 아이디어, 특허 등 개념 정립
-
TRL01
기초 이론/실험
- 연구과제 탐색 및 기회 발굴 단계
기술설명
- 기술개요
○ 휴머노이드 로봇, 디지털 휴먼과 같은 자율 에이전트의 대화 상호작용을 위해 발화에 적합한 제스처 모션과 사람 발화를 들을 때의 자연스러운 경청(Active Listening) 행동 실시간 자동 생성 기술

<휴머노이드>
- 특징 및 장점
○ 고품질 제스처 모션 생성
- - Diffusion Transformer 기반 생성으로 자연스러운 모션 생성
- - 대규모 학습을 통한 일반화 능력 확보. 다양한 입력 발화에 대응 가능
- - 특정 구간에 대한 모션 컨트롤 가능. 모션 라이브러리 연동을 통해 시맨틱 제스처 표현
○ 경청 행동 생성
- - 경청 행동 시점 추론과 LLM 기반 경청 행동 종류(이해, 공감, 흥미 등) 추론
- - 비동기적 추론 파이프라인을 통한 빠른 응답성
○ 실시간 상호작용
- 제스처 생성과 경청 행동 모두 실시간 상호작용 지원
- 실시간 상호작용을 위해 최적화된 오픈소스 음성인식/TTS/LLM 연동 데모 제공
○ 범용성
- 한국어 / 영어 지원 가능
- Raw 제스처 모션 출력으로 다양한 로봇 플랫폼, 디지털 휴먼 플랫폼에 적용 가능
- 기업의 사업화 분야와 요구사항에 따라 기술 최적화 지원

<로봇발화 제스처 모션 생성 정확도 평가 결과>
- 비즈니스 아이디어
○ 휴머노이드 시장은 본격적인 양산 및 상용화 국면에 진입 (2026년 글로벌 시장규모 5.6조원; 연평균 40% 고성장), 사람과의 자연스러운 소통을 가능케 하는 제스처 생성, 경청 행동 기술이 핵심 경쟁력이 될 수 있음
○ 디지털 휴먼 시장은 생성형 AI와의 결합을 통해 단순 대화를 넘어 정서적 교감이 가능한 '인공지능 에이전트'로 진화(2026년 글로벌 시장 규모 약 10.7조 원; 연평균 27% 고성장), 사용자 몰입감을 위한 제스처 및 경청 행동 기술이 필수 요소

- 시장동향
- ○ 휴머노이드 로봇 시장은 2025년 약 48.9억 달러에서 2034년 약 1,651억 달러로 성장이 전망되며, 연평균 50% 이상의 고성장 초기 시장이다. 해당 시장은 AI·센서·로보틱스 기술 발전과 함께 노동력 부족, 산업 자동화, 고령화 대응 수요에 의해 확대되고 있음

- 기술이전 내용 및 범위
○ (1세부) 한국어/영어 발화 제스처 자동 생성 기술
- 발화에 적절한 상반신 제스처 모션 자동 생성 기술
- 의미적 제스처 모션 라이브러리 및 사용자 정의 제스처 연동 기술
- 휴머노이드/디지털휴먼 제스처 동작 전이 및 로봇 제어 기술
○ (2세부) 경청 행동 자동 생성 기술
- 상대(사람) 발화에 적절한 경청행동
(Active Listening; Backchanneling) 생성 기술
- 경청행동의 발생 빈도와 표현 가능 범위를 제어하는
경청 스타일 설정 기술
○ 각 세부 기술 SW (기업 요청 시 소스코드 제공 가능)
○ 실시간 상호작용 데모 SW
○ 기술 소개 자료 및 사용 설명서