Learning Variable Compliance Control From a Few Demonstrations for Bimanual Robot with Haptic Feedback Teleoperation System
Kamijo, Tatsuya, Cristian C. Beltran-Hernandez, and Masashi Hamaya. "Learning Variable Compliance Control From a Few Demonstrations for Bimanual Robot with Haptic Feedback Teleoperation System." arXiv preprint arXiv:2406.14990 (2024).
연구 배경 및 제안 방법
강체 로봇으로 접촉이 많은 복잡한 작업을 자동화하는 것은 강한 접촉력으로 인한 손상 위험 때문에 어려움이 크다. 이를 해결하기 위해 컴플라이언스 제어(Compliance Control) 기법이 도입되었으나, 작업에 최적화된 제어 파라미터를 세밀히 조정해야 하는 한계가 있었다. 기존의 Learning from Demonstration (LfD) 방식은 직관적인 접근법이나 다수의 시연 데이터가 필요하며, 제어 파라미터 최적화와 사용자 인터페이스의 복잡성이 문제였다.
이 논문에서는 이러한 문제점을 해결하기 위해 직관적인 시스템을 제안했다. 이 시스템은 두 가지 주요 구성 요소로 구성되어 있으며, 강체 로봇에게 복잡하고 접촉이 많은 작업을 가르치기 위해 설계되었다:
- VR 기반의 햅틱 피드백을 활용한 직관적인 원격 조작 인터페이스
- 트랜스포머 기반 Action Chunking을 통한 가변 컴플라이언스 제어 학습 방법인 Comp-ACT
제안된 시스템은 로봇이 다양한 작업 환경에서 효율적으로 컴플라이언스를 학습하면서도 사용자에게 직관적인 조작을 제공하는 것을 목표로 한다.
시스템 구성 및 학습 방법
원격 조작 시스템과 컴플라이언스 제어
이 시스템에서는 VR 컨트롤러를 통해 사용자가 로봇에 참조 위치, 그리퍼 명령 및 컴플라이언스 강성도를 제공할 수 있다. 로봇의 손목에 장착된 힘/토크(F/T) 센서로 측정된 접촉력을 컨트롤러 진동으로 매핑해 사용자에게 햅틱 피드백을 제공함으로써 정밀한 조작을 가능하게 한다. Forward Dynamics Compliance Control (FDCC)를 이용해 Cartesian 컴플라이언스를 제어하여 유연성을 확보하고, 로봇 엔드이펙터의 위치와 강성도를 시간 가변 파라미터로 사용하여 보다 안정적인 동작을 구현했다.
Comp-ACT: 가변 컴플라이언스 제어 학습
Comp-ACT는 기존의 Action Chunking with Transformers (ACT) 방식을 변형하여 Cartesian 컴플라이언스 제어를 가능하게 했다. 이 방법은 CVAE (Conditional Variational Autoencoder)를 기반으로 한 트랜스포머 구조를 사용해 복잡한 작업에서의 긴 시퀀스와 다양한 센서 데이터를 효과적으로 처리한다.
네트워크 아키텍처
Comp-ACT의 아키텍처는 CVAE와 트랜스포머 구조로 구성된다. 먼저, CVAE 구조에서 인코더는 현재 로봇의 Cartesian 포즈, 힘/토크(F/T) 센서 측정값, 로봇 상태로 구성된 액션 시퀀스를 입력으로 받아 잠재 변수를 생성한다. 디코더는 이 잠재 변수와 다중 시점 이미지를 입력으로 받아 미래 액션 시퀀스를 예측한다.
트랜스포머 기반 인코더와 디코더는 시퀀스 내 의존성을 효과적으로 포착하여 보다 정확한 예측을 가능하게 한다. 이 아키텍처는 RGB 이미지, F/T 센서 데이터, 로봇 자체 감지 정보 등 다양한 형태의 입력을 처리하며, CNN을 통해 이미지 특징을 추출한다.
또한, 각 로봇 액션은 6D Cartesian 포즈, 1D 그리퍼 상태, 12D 강성도 파라미터로 구성된 38차원 벡터로 표현된다. 강성도 행렬은 Cholesky 분해를 사용하여 수치적 안정성을 보장한다. Comp-ACT는 단순히 다음 동작을 예측하는 것이 아니라, 시퀀스의 미래 행동을 한 번에 예측함으로써 안정성과 효율성을 향상시킨다.
데이터 수집 및 학습
데이터는 원격 조작 시스템을 사용해 시연으로부터 수집되었으며, 강성도 모드는 250, 500, 750 세 가지로 사전 정의되었다. 각 작업과 로봇 팔에는 하나의 중간 강성도가 항상 적용되며, 다른 강성도는 작업 요구사항에 맞춰 전환된다. 학습 시 예측된 액션은 컴플라이언스 컨트롤러의 입력으로 사용되며, 작업 단계에 따라 로봇이 강성도를 조절하면서 목표 동작 궤적을 따라 작업을 수행하도록 한다.
실험 설계 및 결과
UR5e 로봇 팔과 내장된 토크 센서를 사용해 실험을 진행했다. 로봇 팔 손목에는 카메라를 부착하고, 작업 공간 전방에는 광각 카메라를 설치해 다양한 각도에서 데이터를 수집했다. Comp-ACT는 양손 닦기, 집기 및 삽입, 닦기, 그리기, 양손 원통형 조립, 양손 직육면체형 조립 등 6가지 작업에서 성능을 평가했다.
시뮬레이션 결과 Comp-ACT는 기존 ACT보다 적은 접촉력으로 작업을 수행할 수 있었으며, F/T 데이터를 추가했을 때 더욱 안정적인 작업 수행이 가능했다. 실제 환경 실험에서도 Comp-ACT는 대부분의 작업에서 높은 성공률을 기록했으며, F/T 데이터 사용 시 특히 더 높은 성공률을 보였다. 예를 들어 집기 및 삽입 작업에서 F/T 데이터 사용 시 성공률이 70%로 미사용 시 35%보다 높게 나타났다.
결론 및 향후 연구 방향
Comp-ACT는 소수의 시연 데이터만으로도 복잡한 조작 작업을 안전하고 높은 성공률로 수행할 수 있었다. 기존 ACT와 달리, Comp-ACT는 컴플라이언스 강성도 파라미터를 학습하여 과도한 힘을 제어함으로써 Cartesian 공간에서의 안전한 가변 컴플라이언스를 가능하게 했다.
향후 연구로는 사용자 의도에 따라 컴플라이언스를 자동으로 조정할 수 있는 온라인 학습 방식, 강성도 외의 다른 제어 파라미터 학습, 그리고 다양한 작업에 일반화할 수 있는 다목적 학습이 필요하다. Comp-ACT의 트랜스포머 기반 시퀀스 예측과 CVAE를 활용한 다양한 행동 생성은 로봇이 산업 현장에서 더욱 안전하고 효율적으로 활용될 가능성을 열어주었다.
댓글