3분 읽기
- 학습 로봇, 이케아 선반 조립 가능
- 주변 환경을 "보고" 감지할 수 있는 학습 및 적응형 로봇
- 네 개의 판자로 된 이케아 선반, 컴퓨터 마더보드, 자동차 대시보드, 타이밍 벨트 조립.
- AI 로봇은 단 20~30회의 시연, 1~2시간 30분의 훈련으로 모든 작업 100% 정확하게 수행
학습 로봇, 이케아 선반 조립 가능
AI 제어 로봇, 인간 시연을 통해 동작 시퀀스 학습
지능형 도우미:
연구진은 이케아 선반 조립부터 컴퓨터 마더보드 조립까지 복잡한 작업도 빠르고 거의 완벽하게 수행할 수 있는 학습 로봇을 개발했다. 연구진은 "Science Robotics"에 이 로봇이 예상치 못한 문제에도 자신 있게 대응한다고 보고했다. 이는 AI 제어 로봇이 주변 환경을 "보고" 인간 교사의 행동을 관찰하여 학습할 수 있기 때문에 가능하다.
 |
▲ 새로운 로봇 시스템은 인간의 행동을 모방하는 법을 배울 수 있다. © gorodenkoff/GettyImages |
트랜스포머처럼 변형 가능한 로봇, 다람쥐처럼 점프하는 로봇, 공장 조립라인 작업자처럼 끈기 있는 로봇 등 로봇은 무수히 많은 변형이 있다. 이러한 로봇들은 일반적으로 명확하게 정의된 작업만 수행하도록 프로그래밍된다. 이제는 적응형 알고리즘 덕분에 성공과 실패를 통해 학습하고 훈련 과정을 통해 개선할 수 있는 학습 로봇도 등장했다.
그러나 이러한 로봇들은 지금까지 더 복잡한 프로세스와 여러 일상적인 작업에서는 실패했다. 무엇보다도, 주변 세계에 대한 "시각적" 능력이 부족하고 예상치 못한 문제(예: 배열이 미리 프로그래밍된 시작 위치에서 약간 벗어난 경우)를 처리하는 방법에 대한 이해가 부족하다. 물체가 평소보다 몇 센티미터 왼쪽으로 더 멀리 또는 다른 각도로 배치되면 이러한 로봇은 더 이상 물체를 안정적으로 잡을 수 없는 경우가 많다.
모방을 통한 학습캘리포니아 대학교 버클리 캠퍼스의 루오 지안란(Luo Jianlan)이 이끄는 연구진은 인간 참여형(Human-in-the-Loop) 샘플 효율적 로봇 강화 학습(HIL-SERL)이라는 시스템을 개발했다. 이 용어는 주변 환경을 "보고" 감지할 수 있는 학습 및 적응형 로봇을 의미한다. 이를 위해 이 로봇에는 하나 또는 두 개의 팔, 여러 개의 압력 및 동작 센서, 손목 및 측면 카메라가 장착되어 있다.
이를 통해 로봇은 사람들이 작업을 수행하는 것을 관찰할 수 있다. 이러한 시연과 동작 시퀀스를 통해 로봇은 스스로 동작을 수행하는 방법을 학습한다. 인간이 초기 시도 중에 개입하여 수정할 수 있으므로, 로봇은 피드백을 받고 실수로부터 학습할 수 있다. 이를 통해 로봇은 최근 도입된 수술 로봇처럼 다양한 시작점과 상황에 유연하게 대응할 수 있다.
계란 프라이부터 이케아 선반 조립까지루오와 그의 동료들은 7가지 실제 작업을 통해 이 알고리즘 시스템이 얼마나 잘 작동하는지 테스트했다. 이 작업에는 정확하고 역동적인 움직임, 두 팔 사이의 조화, 단단하고 유연한 물체를 다룰 때의 민첩성, 그리고 각 하위 단계의 순서를 따르는 능력이 요구되었다.
테스트 결과, 로봇은 프라이팬에 있는 계란이나 그와 유사한 물체를 뒤집고, 채찍을 사용하여 젠가 탑에서 블록 하나를 넘어뜨리지 않고 꺼낼 수 있었다. 또한 두 팔이 매우 조화롭게 작동하여 로봇은 물체를 잡고 다른 팔로 전달할 수 있다. 이를 통해 로봇은 네 개의 판자로 구성된 이케아 선반, 케이블과 커넥터가 포함된 컴퓨터 마더보드, 자동차 대시보드, 그리고 기어에 팽팽하게 조여진 타이밍 벨트를 조립할 수 있다.
 |
▲ 로봇은 (A) 젠가 타워에서 블록을 꺼내는 것, (B) 팬에 있는 물체를 뒤집는 것, (C) 타이밍 벨트, (D) 대시보드, (E) 마더보드, (F) 이케아 선반과 같은 복잡한 장치를 조립하는 것 등 다양한 실험 작업을 수행하는 법을 배웠다.
© Jianlan Luo |
단시간에 완벽하게 학습
루오와 그의 연구팀이 보고한 바에 따르면, AI 로봇은 단 20~30회의 시연과 1~2시간 30분의 훈련만으로 이러한 모든 작업을 100% 정확하게 수행할 수 있었다. 평균적으로 로봇은 첫 번째 시도와 마지막 시도 사이에 1.8배 더 빨라졌다. 연구팀은 이 시스템이 시연을 통해 더 잘 학습하고 이전 AI 시스템보다 인간의 행동을 더 빠르게 모방한다고 설명했다.
이러한 기능은 시스템이 자신과 주변 환경을 지속적으로 관찰하고 그에 따라 움직임을 조정하기 때문에 가능하다. 연구진은 이 혁신적인 로봇 기술이 향후 다양한 산업 플랜트에 활용되기를 기대한다.
참고: Science Robotics, 2025; doi: 10.1126/scirobotics.ads5033
출처: 미국과학진흥협회(AAAS)
[더사이언스플러스=문광주 기자]
[저작권자ⓒ the SCIENCE plus. 무단전재-재배포 금지]