이제 알파고로부터 바둑을 배웁시다.

알파고가 다시 돌아왔습니다. 이번에는 인간에게 가르침을 주러 왔습니다.

알파고는 이세돌과의 대국 이후로도 끊임없이 진화하여 중국의 커제를 3:0으로 완파하였고, 최근에는 인간이 수천년간 두어 온 바둑 기보를 모두 무시하고, 바둑이라는 게임을 원점에서부터 재해석하여 궁극의 경지에 이른 알파고 제로로 업그레이드 되었습니다. 알파고 제로는 이세돌을 이긴 버전(알파고 리)에게는 100전 100승을, 커제를 이긴 버전 (알파고 마스터)에게는 89%의 승률을 기록하였습니다. 특히 알파고 제로는 인간이 그동안 특별한 고민 없이 전통적인 방식에 따라 두어 오던 초반 포석에서부터 파격을 선보이며 바둑의 기본 패러다임에 대한 문제를 제기하였습니다.

구글 딥 마인드는 바둑의 기본 포석을 알파고로부터 배울 수 있는 사이트를 오픈하였습니다. 사이트 이름은 AlphaGo teach 입니다.

https://alphagoteach.deepmind.com/

보라색 동그라미는 바둑 기사들이 일반적으로 잘 놓는 위치를, 청록색 동그라미는 알파고라면 놓을 위치를 의미합니다. 동그라미 안의 숫자는 그 수를 놓았을 때 이길 확률입니다. 바둑을 둘 줄 아시는 분이라면 이유 없이 주저하게 되는 한복판이나 3 by 3 위치에도 과감하게 수를 놓는 알파고를 보실 수 있습니다.

재미있는 것은 알파고가 항상 최고의 확률에 돌을 놓는 것은 아니라는 점 입니다. 알파고는 매 수 1천만번의 수 계산을 한 뒤 다음 수를 결정하는데, 이 과정에 무작위적인 선택이 들어가기 때문에 매번 계산할때 항상 동일한 수가 나오지 않기 때문이라고 합니다.

AlphaGo teach는 초반 포석에 대한 이해를 돕기 위해 만들어 졌으며 약 20-30수 정도까지만 둘 수 있습니다.