리서치 하이라이트

새로운 인공지능 시스템, 알파고 제로

Nature 550, 7676

게시:

바둑의 세계 최고 기사를 이기기 위해서, 인공지능 프로그램인 알파고는 수백만 건의 인간 바둑 기사들의 수를 통해 학습하는 방법을 이용했었다. David Silver와 공동연구원들은 알파고 제로(AlphaGo Zero)라는 프로그램을 개발하였는데, 이 프로그램은 강화 학습만을 기본으로 하고 있으며, 단독 훈련을 통해서만 학습하게 된다. 알파고 제로는 단지 몇 일만에 자체적으로 5백만 번의 게임과 학습을 통해서 무작위적인 움직임으로 시작하여, 최강 인간 레벨까지 갈 수 있으며, 기존의 알파고를 모두 물리쳤다. 인간이 1천년에 걸쳐서 만들어낸 개념을 기계 자체적으로 게임의 원리를 알아내기 때문에, 인간의 편견을 넘어서 이론적으로 일반화할 수 있는 특성이 있다는 것이 이번 연구를 통해서 밝혀졌다.

Article p.354
doi | 10.1038/nature24270 | 전문   | PDF
News & Views p.336
doi: 10.1038/550336a  |  전문  

2017년10월19일 자의 네이처 하이라이트