리서치 하이라이트

표지 기사: 인간 수준의 조절이 가능한 딥 재강화 학습

Nature 518, 7540

게시:

이번 주 네이처 표지는 딥 Q-네트워크 에이전트가 게임 패드 컨트롤을 통해서 인바운드 레트로-스타일 스피릿의 공격을 피한 것을 에이전트의 시각에서 장면을 이미지로 보여주고 있다. 인공적인 에이전트가 실제로 지능을 가지고 있다고 평가하기 위해서는 사람에게 도전이 된다고 생각되는 다양한 과제들에서 두드러진 실력을 보여야 한다. 지금까지는 단일 훈련 과제를 마스터하는 것만 가능한 개별적인 알고리즘을 개발하는 것만 가능했었다. 예를 들면, IBM의 딥블루는 체스에서는 월드 챔피언을 이겼지만, 다른 것은 하는 것이 불가능했었다. 최근 구글의 딥마인드 자회사의 연구팀에서는 딥Q 네트워크라고 불리는 인공 에이전트를 개발하였으며, 이러한 인공 에이전트는 감각적인 경험을 통해서만 얻어진 학습 결과를 통해서 49 클래식 아타리 2600 아케이드 게임을 할 수 있었으며, 이는 뛰어난 인간 플레이어의 실력과 대등하였다. 딥 러닝과 재 강화 학습을 결합시킴으로써, 게임 플레잉 에이전트는 여러 가지 단편적인 도전 과제로부터 학습하는 것이 가능한 목표 시스템에 가까운 인공 지능을 가질 수 있었다. 표지 사진: Max Cant/Google DeepMind [Letter, 529쪽]

Letter p.529
doi | 10.1038/nature14236 | 전문   | PDF
News & Views p.486
doi: 10.1038/518486a  |  전문  

2015년2월26일 자의 네이처 하이라이트