1. LOGIN
  2. JOIN
전시장정보
행사후기
출품기술
소액기술
수요기술
동영상
문의

출품기술

분류
인공지능창의연구소

휴머노이드 및 가상 에이전트의 발화, 제스처 경청 행동 자동생성 기술

휴머노이드 로봇, 디지털 휴먼과 같은 자율 에이전트의 대화 상호작용을 위해 발화에 적합한 제스처 모션과 사람 발화를 들을 때의 자연스러운 경청(Active Listening) 행동 실시간 자동 생성 기술

[발표기술] 휴머노이드 및 가상 에이전트의 발화, 제스처 경청 행동 자동생성 기술

보유기관 및 연구자 : 한국전자통신연구원 인공지능창의연구소 윤영우 책임

거래 조건 :

특허정보
  • 대규모 언어 모델 및 비전 언어 모델 기반의 로봇 모션 생성 시스템 및 방법 (No : 10-2025-0047319)
  • 모션 데이터 선별 시스템 및 방법 (No : 19/066904)
  • 모션 데이터 선별 시스템 및 방법 (No : 10-2024-0031142)
상담신청 기술문의
TRL09

사업화

  • 본격적인 양산 및 사업화 단계
TRL08

시작품 인증/표준화

  • 일부 시제품의 인증 및 인허가 취득 단계
    - 조선 기자재의 경우 선급기관 인증, 의약품의 경우 식약청의 품목 허가 등
TRL07

Pilot 단계 시작품 신뢰성 평가

  • 시작품의 신뢰성 평가
  • 실제 환경(수요기업)에서 성능 검증이 이루어지는 단계
TRL06

Pilot 단계 시작품 성능 평가

  • 경제성(생산성)을 고려한, 파일로트 규모의 시작품 제작 및 평가
  • 시작품 성능평가
TRL05

시제품 제작/ 성능평가

  • 개발한 부품/시스템의 시작품(Prototype) 제작 및 성능 평가
  • 경제성(생산성)을 고려하지 않고, 우수한 시작품을 1개~수개 미만으로 개발
TRL04

연구실 규모의 부품/시스템 성능평가

  • 연구실 규모의 부품/시스템 성능 평가가 완료된 단계
  • 실용화를 위한 핵심요소기술 확보
TRL03

연구실 규모의 성능 검증

  • 연구실/실험실 규모의 환경에서 기본 성능이 검증될 수 있는 단계
  • 개발하려는 시스템/부품의 기본 설계도면을 확보하는 단계
  • 모델링/설계기술 확보
TRL02

실용 목적의 아이디어/특허 등 개념 정립

  • 실용 목적의 아이디어, 특허 등 개념 정립
TRL01

기초 이론/실험

  • 연구과제 탐색 및 기회 발굴 단계

기술설명

기술개요

○ 휴머노이드 로봇, 디지털 휴먼과 같은 자율 에이전트의 대화 상호작용을 위해 발화에 적합한 제스처 모션과 사람 발화를 들을 때의 자연스러운 경청(Active Listening) 행동 실시간 자동 생성 기술

ab70b03c6de6e2999051cb894a11305f_1775189015_7548.png
 

<휴머노이드>

특징 및 장점

 고품질 제스처 모션 생성

  1. - Diffusion Transformer 기반 생성으로 자연스러운 모션 생성
  2. - 대규모 학습을 통한 일반화 능력 확보. 다양한 입력 발화에 대응 가능
  3. - 특정 구간에 대한 모션 컨트롤 가능모션 라이브러리 연동을 통해 시맨틱 제스처 표현


 경청 행동 생성

  • - 경청 행동 시점 추론과 LLM 기반 경청 행동 종류(이해, 공감, 흥미 등) 추론
  • - 비동기적 추론 파이프라인을 통한 빠른 응답성


 실시간 상호작용

- 제스처 생성과 경청 행동 모두 실시간 상호작용 지원

- 실시간 상호작용을 위해 최적화된 오픈소스 음성인식/TTS/LLM 연동 데모 제공


 범용성

- 한국어 / 영어 지원 가능

- Raw 제스처 모션 출력으로 다양한 로봇 플랫폼, 디지털 휴먼 플랫폼에 적용 가능

- 기업의 사업화 분야와 요구사항에 따라 기술 최적화 지원


ab70b03c6de6e2999051cb894a11305f_1775189054_0518.png

<로봇발화 제스처 모션 생성 정확도 평가 결과>

비즈니스 아이디어

○ 휴머노이드 시장은 본격적인 양산 및 상용화 국면에 진입 (2026년 글로벌 시장규모 5.6조원; 연평균 40% 고성장), 사람과의 자연스러운 소통을 가능케 하는 제스처 생성, 경청 행동 기술이 핵심 경쟁력이 될 수 있음

 디지털 휴먼 시장은 생성형 AI와의 결합을 통해 단순 대화를 넘어 정서적 교감이 가능한 '인공지능 에이전트'로 진화(2026년 글로벌 시장 규모 약 10.7조 원; 연평균 27% 고성장), 사용자 몰입감을 위한 제스처 및 경청 행동 기술이 필수 요소


ab70b03c6de6e2999051cb894a11305f_1775189145_2205.png
 

시장동향
○ 휴머노이드 로봇 시장은 2025년 약 48.9억 달러에서 2034년 약 1,651억 달러로 성장이 전망되며, 연평균 50% 이상의 고성장 초기 시장이다. 해당 시장은  AI·센서·로보틱스 기술 발전과 함께 노동력 부족, 산업 자동화, 고령화 대응 수요에 의해 확대되고 있음



 ab70b03c6de6e2999051cb894a11305f_1775189198_1448.png
기술이전 내용 및 범위

○ (1세부) 한국어/영어 발화 제스처 자동 생성 기술

- 발화에 적절한 상반신 제스처 모션 자동 생성 기술

- 의미적 제스처 모션 라이브러리 및 사용자 정의 제스처 연동 기술

- 휴머노이드/디지털휴먼 제스처 동작 전이 및 로봇 제어 기술


○ (2세부) 경청 행동 자동 생성 기술

- 상대(사람) 발화에 적절한 경청행동

   (Active Listening; Backchanneling) 생성 기술

- 경청행동의 발생 빈도와 표현 가능 범위를 제어하는 

   경청 스타일 설정 기술

○ 각 세부 기술 SW (기업 요청 시 소스코드 제공 가능)

○ 실시간 상호작용 데모 SW

○ 기술 소개 자료 및 사용 설명서