한국어 사이트는 4월 1일부로 종료됩니다. 그동안 이용해 주셔서 감사합니다.

리서치 하이라이트

강화 학습(Reinforcement learning)을 이용한 성층권에서 기구의 자율 주행

Nature 588, 7836

초고압 기구(Superpressure balloons)는 성층권에서 몇 달 동안 자율적으로 이동할 수 있으므로 통신, 지구 관측 및 기상 데이터 수집을 위한 비용 효율적인 플랫폼이 된다. Loon 초고압 기구에서 수직 운동은 챔버 안팎으로 공기를 펌핑하여 일어나는 반면, 수평 운동은 바람에 의해 결정되므로 비행 컨트롤러(Flight controllers)는 항행에 유리한 흐름을 찾아 따라가기 위해 상승과 하강을 해야 한다. 이러한 단순한 역학에도 불구하고 장기적인 기구 제어는 스테이션 유지(Station-keeping) 작업에서 특히 매우 어렵다. Marc Bellemare와 연구진들은 강화 학습(Reinforcement learning)을 사용하는 고성능 비행 컨트롤러를 시연하였다. 이 컨트롤러는 데이터 증강(Augmentation) 및 불완전한 데이터에서 학습하는 문제를 극복하는 데 사용되는 자가 수정 설계(Self-correcting design)를 이용하여 태평양에 대한 39일 제어 실험을 포함하여 전세계 여러 위치에 Loon 기구를 배치하는데 사용하였다.