인공신경망과 물리학

커버이미지 : 인공신경망 (소스)

학부 시절, 인공지능에 관한 수업을 들은 적이 있습니다. 그 때 교수님이 첫 번째 수업에서 이세돌 九단과 알파고의 바둑 시합[1]을 이야기하시더군요. 일본에서도 상당히 뉴스가 되었을 정도로 충격적인 사건이었습니다. 한창 화제가 되었었고 우리나라는 지금도 ‘알파고’라는 단어 자체가 인공지능, 기계학습을 의미하는 대명사가 되어버렸습니다(알파고는 2017년 개발이 중단되었다고 합니다). 요즘 세간에서 이야기하는 4차 산업혁명 열풍은 바로 알파고가 만들어냈다고 해도 과언이 아닐 것입니다. 기계학습(Machine learning)이니 딥러닝(Deep learning)하는 것도 이 시기에 유행을 탔었지요.

많은 사람들이 (저 또한 마찬가지로) 기계학습하면 자연언어처리나 데이터 마이닝을 쉬이 생각하지만 최근에는 자연과학에서도 활용하려는 움직임을 보이고 있습니다. 특히나 물리학 중 양자역학에서 그 시도가 활발한데 간단한 예와 함께 소개하겠습니다. 물리학에 기계학습, 특히 인공신경망을 적용하는 것은 아직 초보적인 단계이기 때문에 많은 분들이 관심을 가져주셨으면 좋겠습니다.

양자역학의 영원한 숙제는 양자 다체 문제를 해결하는 것입니다. 물질에는 수많은 전자, 원자핵이 존재하는데 이들의 움직임을 모두 고려하는 것은 거의 불가능에 가까워 물리학자들은 다양한 근사를 활용하여 ‘비슷하게’ 문제를 해결하고 있습니다[2]. 인공신경망을 이용한 방법도 그 다양한 시도 중 하나라고 볼 수 있습니다. 게다가 최근 기계학습의 학문적 발전에 힘입어 여러 양자역학적 문제에 활용될 것으로 기대됩니다.

양자 상태(Quantum state) 여러 경우에 관한 부분 상태(폭 상태 Fock state라고 합니다)의 중첩, 즉 선형결합으로 이루어집니다. 즉, 식으로 표현하면

로 쓸 수 있습니다. 잠깐 식의 의미를 짚고 넘어가겠습니다. n1, n2, …는 위치(site) 1, 2, …에 존재하는 입자 수로 그 때의 폭 상태를

와, 그 계수를

로 표현하여 선형결합을 이룬 것이 구하고자 하는 양자 상태라는 뜻입니다(더 많은 의미를 내포하고 있지만 여기서는 이 정도로 충분합니다).

양자역학에서 양자 상태를 알기 위해서는 계수,

를 구해야 합니다. 즉 우리는 (n1, n2, …)를 입력값(input)으로 한 후 앞서 말한 계수를 출력(output)하는 인공신경망을 계산하는 것이 과제입니다. 여기서는 간단한 예시로 계의 바닥 상태(ground state)를 계산하는 인공신경망의 알고리즘에 대해 짚어보겠습니다.

그림1. 샘플에서 추출한 값과 인공신경망을 통해 얻은 결과 값을 비교해 W1, W2를 보정하는 알고리즘. 계속된 학습을 통해 샘플 외의 임의의 값이 주어져도 정확하게 계산할 수 있게 된다.

학습하기 위해 중요한 것은 인공신경망으로 계산한 결과와 비교하기 위한 샘플 데이터를 마련하는 것입니다. 샘플 데이터를 얻는 방법은 여러가지가 있지만 이 경우, 메트로폴리스-헤이스팅스 알고리즘(Metropolis-Hastings algorithm)으로 표본을 얻은 후 몬테 카를로 방법(Monte Carlo method)을 이용하여 바닥상태의 상태와 그 계수를 구할 수 있습니다[3].

그리고 다음과 같은 순서로 보정을 실시합니다(그림1).

(1) 샘플 데이터 중 하나를 골라 상태를 입력값(input)으로 설정합니다.

(2) 몇 번의 선형결합(빨간 선)으로 최종 결과 도출 직전까지 도달합니다.

(3) 최종적으로 비선형결합, 즉 활성화 함수(Activation function, 파란 선)로 구하고자 하는 결과를 도출합니다.

(4) 샘플에서의 결과값과 계산을 통한 결과값을 비교 후 여러 인수(W1, W2 등)를 보정을 합니다.

: 순서 (4)에서 보정하는 방법으로 대표적인 것은 경사 하강법(Gradient descent)이 있습니다. 샘플의 결과와 계산의 결과의 오차가 최소값에 다다를 때까지 반복하는 방법인데 보통은 기울기가 낮은 쪽으로 인수들을 이동시켜 보정하게 됩니다.

(5) (1)-(4)의 과정을 반복합니다.

이 과정으로 계산 방법을 학습시켜 임의의 상태가 주어지더라도 그 계수와 이를 이용해 여러가지 물리량을 구할 수 있습니다. 현재는 이미 익히 알려진 양자 모델인 보스-허버드 모델(Bose-Hubbard model)[3], 1차원 이징 모델(Ising model), 1차원 하이젠베르크 모델(Heisenberg model)[4]의 양자 상태를 인공신경망으로 계산한 것이 이론값과 거의 정확히 일치하다는 것이 밝혀졌습니다.

컴퓨터의 발전으로 지금까지 손을 대지 못했던 여러 물리 문제들이 점점 해결할 수 있게 되었습니다. 슈퍼컴퓨터 뿐만 아니라 개인용 컴퓨터도 상당한 성능에 이르렀습니다. 이제는 계산 방법에 있어서도 기계학습이라는 새로운 방법을 도입하게 되어 보다 폭발적인 학문적 성장을 이루어내지 않을까 기대해 봅니다.

인공신경망 외에도 기계학습을 이용한 물리학 연구의 동향에 관해서는 한국물리학회의 ‘물리학과 첨단기술(2017년 12월 제26권 12호)[5]’를 참고하시면 좋습니다.

References

[1] D. Silver, A. Huang, C. J. Maddison, A. Guez, L. Sifre, G. van den Driessche, J. Schrittwieser, I. Antonoglou, V. Panneershelvam, M. Lanctot, S. Dieleman, D. Grewe, J. Nham, N. Kalchbrenner, I. Sutskever, T. Lillicrap, M. Leach, K. Kavukcuoglu, T. Graepel, and D. Hassabis, Nature (London) 529, 484 (2016).

[2] 양자 다체 문제를 해결하기 위한 여러 시도에 관해서는 https://thesciencelife.com/archives/2416 참조.

[3] H. Saito, J. Phys. Soc. Jpn. 86, 093001 (2017).

[4] G. Carleo and M. Troyer, Science 355, 602 (2017).

[5] 링크
The following two tabs change content below.

김세훈

일본에서 응집물질물리학을 공부하고 있습니다.

Latest posts by 김세훈 (see all)