달력

42024  이전 다음

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30

우리는 이전글에서 인공지능 역사에서 1950년 이전의 인간과 대결하는 인공지능에 대해서 살펴보았습니다. 아래 그림에서 체크된 영역은 해당 주제에 대해 본 블로그에 게시된 상세 글이 이미 있는 경우입니다. 이번 글에서 다루는 헵 이론(Hebbian theory)을 다루면 관련 내용을 전부 다루게 됩니다.

1950년대 이전의 인공지능


도널드 이미지

헵 이론(Hebbian theory)은 Hebb의 규칙(Hebb's rule), Hebb의 가정(Hebb's postulate) 및 세포 조립 이론(cell assembly theory)이라고도 합니다. 헵 이론은 캐나다의 심리학자인 도널드 올딩 헵(Donald Olding Hebb, 1904년 7월 22일 ~ 1985년 8월 20일)이 1949년 그의 저서 "The Organization of Behavior"에서 소개했습니다.

 도널드 올딩 헵(Donald Olding Hebb)
Organization of Behavior(행동의 조직)  초판 표지(1949년) [출처 : 위키백과]

 

이 책은 도입 부분(Introduction)에서는 복잡한 두뇌 모델링에 대해 "연결주의(커넥셔니즘,connectionism)"이란 용어를 사용하여 연결주의 모델을 옹호했습니다. 연결주의(connectionism)는 인공 신경망을 사용하여 인지적 능력을 설명하려고 하는 심리철학의 이론입니다. 인지과학에서 설명하고자 하는 인간의 마음 현상(인간의 마음, 인간의 인지적 능력)은 튜링기계를 모델로 하는 계산주의(computationalism), 그리고 뇌의 뉴런을 모델로 하는 연결주의(connectionism)로 나눠집니다. 연결주의는 단순하고 병렬적인 계산요소들의 대규모 연결망을 핵심 개념으로 삼기 때문에 연결주의라 불립니다. 반면 계산주의는 기호의 직렬적 처리방식으로, 인간의 마음 및 뇌가 정보 처리 시스템이고 사고가 컴퓨팅의 한 형태라는 견해입니다.

Organization of Behavior의 Introduction내의 연결주의(connectionism)

 

도널드 올딩 헵은 뉴런의 작용이 어떻게 학습과 같은 과정에 기여했는지 알고자 했습니다. 이것은 인공지능의 모델의 발전측면에서 보면 가중치(weight)의 학습방법의 토대가 되었다는 측면이 있습니다. 그의 중심적인 아이디어는 두 개의 뉴런 A, B가 서로 반복적이고 지속적으로 점화(firing)하여 어느 한쪽 또는 양쪽 모두에 어떤 변화를 야기한다면 상호 간의 점화의 효율(인공신경망 관점으로 보면 가중치(weight)의 변화가 됨)은 점점 커지게 된다는 것입니다.  즉, 시냅스를 통한 신경 세포의 상호작용이 증가하면 시냅스가 더 견고하게 강화되며, 상호작용이 감소하면 시냅스는 약해져서 신경회로를 사용하지 않게 된다는 이론입니다.

 

그의 이론을  요약적으로 잘 설명해주는 문구는 "함께 발화(점화)하는 세포들은 함께 연결된다. (Cells that fire together wire together)."입니다. 즉 함께 활성화되는 세포가 함께 연결됩니다. 이것은 우리가 새로운 지식과 경험을 어떻게 뇌 속에 편입시킬 수 있는지를 설명하는 원리가 됩니다. 이 원리에 따르면 학습은 뉴런들 사이에 새로운 연결을 만드는 활동이며, 기억은 이러한 연결을 강화하고 유지하는 장치가 되는 것입니다.

딸기를 인식하는 동안 활성화된 뉴런의 연결이 서로 강화됨

 

헵은 하나의 처리 장치로 그룹화 될 수있는 뉴런의 조합으로 "세포 어셈블리(cell-assemblies)"라고 불렀습니다. 그리고 그들의 연결 조합은 자극에 대한 뇌의 반응을 지시하는 끊임없이 변화하는 알고리즘을 구성했습니다. 헵에 따르면 우리가 새로운 것을 배울 때, 뇌 기억 시스템은 기존의 신경망에 새로운 연결을 추가하면서 학습합니다. 새로운 정보가 기존의 기억과 만나면 서로의 연결이 강화되면서 기존의 기억을 자극하고, 이것이 새로운 정보와 연합되면서 신경망이 더욱 활성화 됩니다. 이때 활성화되지 않는 뉴런들은 연결이 약해집니다. 그리고 이런 과정의 반복을 통해 기억이 형성됩니다. 헵은 1949년 장기기억과 단기기억의 핵심 차이에 관한 가설을 제시했습니다. 장기기억에는 뉴런들이 연결되면서 물리적 변화가 발생하나, 단기기억은 그렇지 않을 것이라는 주장이었습니다.

 

헵의 이론은 완벽하지만은 않았고, 시간이 흐르며 내용이 계속해서 수정되었습니다. 헵 학습 규칙도 확장된 헵 학습 규칙으로 내용이 추가되었고, 반론도 있지만 지금도 여전히 타당한 주장이라고 받아들여지고 있습니다.

 

인공 뉴런과 인공 신경망의 관점에서 헵의 이론은 모델 뉴런 간의 가중치를 변경하는 방법을 결정하는 방법으로 설명 할 수 있습니다. 두 뉴런이 동시에 활성화되면 두 뉴런 사이의 가중치가 증가하고 개별적으로 활성화되면 감소합니다. 동시에 양수 또는 음수인 경향이 있는 노드는 강한 양의 가중치를 갖는 반면 반대되는 경향이 있는 노드는 강한 음의 가중치를 갖습니다. 헵의 이론에 근거한 이러한 헵의 학습 규칙은 가장 오래되고 단순한  형태의 학습규칙으로 나중에 개발된 다른 신경망 모델들의 학습 규칙의 토대가 됩니다. 


헵의 이론에 의한 신경망의 가중치(weight) 학습규칙은 훗날 프랭크 로젠블랫(Frank Rosenblatt)이 1957년에 제안한 퍼셉트론(인공 신경망 구조 중 하나)과 1960년의 아달라인(ADALINE)을 거치면서 좀더 발전합니다. 이는 오늘날의 고도화된 신경망(딥러닝) 학습의 토대가 되는 것입니다. 

초기 신경망 모델의 특징 및 발전

 

Copyright 2021. 『오드리공주될뻔 블로거』  All rights reserved.

Posted by 오드리공주될뻔
|

이번 글에서는 게임이론에 대해서 알아보고, 인공지능에서 게임이론이 어떻게 활용되고 있는지 살펴보겠습니다. 이 분야는 우리의 현실과 밀접하게 관련이 있고, 노벨경제학상의 “단골손님”이기도 합니다. 지금도 연구가 계속되고 있는 분야이기도 합니다. 게임 이론은 사회 과학, 특히 경제학에서 활용되는 응용 수학의 한 분야이며, 생물학, 정치학, 컴퓨터 공학, 철학에서도 많이 사용됩니다.

 

우선 사전적 의미로 놀이로써 게임은 규칙을 정해 놓고 승부를 겨루는 것을 말합니다. 경제용어로써의 게임이란 용어도 있는데, 이는 참가자들이 상대방의 행동이나 반응을 고려하여 전략적으로 자신의 의사를 결정하는 상황을 말합니다.

 

두 용어는 전자는 즐거움을 주는 행위가 목적이고, 후자는 결과를 예측하는 시뮬레이션 목적으로 개념적으로 서로 다르지만, 상대방의 행동에 따라 나의 의사결정을 최적화해서 해야 하는 유사한 면도 있습니다. 즉, 둘 다 어떤 행동을 선택하기 전에 상대방 행동을 고려합니다. 현재까지의 행동과 앞으로 전개될 행동의 시나리오까지 예측해서 나의 현재 전략과 미래 전략을 세워야 합니다. 예를 들면 포커라는 카드 게임처럼.

포커 게임을 즐기는 동물들

 

위키백과의 정의를 보면, 게임(game)이란 효용 극대화를 추구하는 행위자들이 일정한 전략을 가지고 최고의 보상을 얻기 위해 벌이는 행위를 말합니다. 게임이론은 참가자들이 상호작용하면서 변화해 가는 상황을 이해하는 데 도움을 주고, 그 상호작용이 어떻게 전개될 것인지, 매 순간 어떻게 행동하는 것이 더 이득이 되는지를 수학적으로 분석해줍니다.

 

게임이론(game theory)은 경제용어로써의 게임에 관한 이론으로써, 이해가 대립되는 집단의 행동을 수학적으로 다룬 이론입니다. 게임 이론은 상호 의존적이고 이성적인 의사결정에 관한 수학적 이론입니다. 개인 또는 기업이 어떠한 행위를 했을 때, 그 결과가 게임에서와 같이 자신뿐만 아니라 다른 참가자의 행동에 의해서도 결정되는 상황에서, 자신의 최대 이익에 부합하는 행동을 추구한다는 수학적 이론을 연구합니다.

 

1944년 폰 노이만(John von Neumann)과 경제학자 오스카 모르겐슈테른 (Oskar Morgenstern)이 “게임 이론과 경제 행동(Theory of Games and Economic Behavior)”이라는 이름의 책(처음엔 논문으로 나오고, 점차 확장하여 책으로 만듦)을 출판했습니다. 이 책은 게임 이론에 관한 최초의 책이자 최초로 경제학에 게임 이론을 응용한 책으로, 게임 이론의 역사에 큰 획을 그으며 본격적인 연구가 시작되는 출발점이 되었습니다.  동시에 폰 노이만은 미니맥스 원리(최소극대화, 미니맥스 법)를 증명하여 게임 이론은 응용 수학 영역으로 명확히 자리를 잡았습니다. 그는 1928년 미니맥스 원리를 증명하고, 완벽한 정보를 가진 제로섬 게임에서 두 가지 모두에 대한 한 쌍의 전략이 존재함을 입증합니다. 각 플레이어의 최대 손실을 최소화는 전략을 최적이라고 합니다. 이를 좀 더 개선하고, 확장하여 이 책에도 그 내용을 담았습니다.

 

게임 이론과 경제 행동(Theory of Games and Economic Behavior) 책 제2판의 목차(1947년)

 

이후 1950년 프린스턴 대학교에 다녔던 22살의 존 내시(John Nash)는 "비협조적 게임(Non-Cooperative Games)" 이라는 박사학위 논문으로 다시 한 번 게임 이론에 한 획을 그었습니다. 존 내시는 그동안 주목받지 않던 비협조적 게임에서 제로섬 게임이 아닐 경우에도 참가자의 수와 상관없이 언제나 균형상태가 존재하다는 것을 증명했습니다. 이 균형에는 존 내시의 이름을 딴 내시 균형(Nash equilibrium)이란 이름이 붙여졌습니다. 존 내시이외에도 이 이론은 1950년대 이후 많은 학자들에 의해 광범위하게 연구되었으며, 여러 산업에 적용되었습니다.

 

게임 이론에서 게임의 유형(Type)은 협조/비협조, 대칭/비대칭, 제로섬/넌-제로섬(혹은 비제로섬), 동시/순차, 완전 정보/불완전 정보 등으로 분류될 수 있습니다. 개념이해를 위해서 게임이론의 예를 가지고 설명드리겠습니다.


게임 이론의 예로는 넌-제로섬 게임의 사례로 죄수의 딜레마나 제로섬게임의 치킨게임, 가위바위보 게임(무승부 제외) 등이 거론됩니다. (이외에도 사슴 사냥 게임, 세 명의 총잡이, 여행자의 딜레마 등의 여러가지 상황으로 게임 이론을 설명하고 있습니다.)


#1. 죄수의 딜레마

우선 죄수의 딜레마(Prisoner's Dilemma, PD)는 게임 이론의 대표적인 유명한 사례로, 2명이 참가하는 넌-제로섬(비제로섬 게임, non zero-sum game)의 일종입니다. 이 게임은 용의자의 딜레마 또는 수인의 번민(囚人의 煩悶)이라고도 부릅니다.

죄수의 딜레마 이미지

 

공범으로 의심되는 두 명의 용의자가 체포되었습니다. 격리되어있는 서로 다른 취조실로 불러 자백을 할 수 있는 기회를 줍니다. 즉, 서로의 상황을 전혀 모르는 겁니다. 이들에게 자백여부에 따라 다른 형별이 가해집니다. 

  • 둘 중 하나가 배신하여 죄를 자백하면 자백한 사람은 즉시 풀어주고 나머지 한 명이 10년을 복역해야 합니다.
  • 둘 모두 서로를 배신하여 죄를 자백하면 둘 모두 5년을 복역합니다.
  • 둘 모두 죄를 자백하지 않으면 둘 모두 6개월을 복역합니다.

 

이 내용을 한눈에 보기 좋게 정리하면 아래와 같습니다.

죄수 딜레마의 보상 행렬

여러분이 죄수이라면 어떤 선택을 하시겠습니까? 선택의 결과에 따라 곧바로 석방, 6개월 복역, 5년 복역, 10년 복역이 됩니다.

 

이 게임의 죄수는 각자의 이익을 위해서 이성적으로 행동, 즉 자신의 이익만을 최대화한다는 가정을 합니다. 그 결과는 상대방이 취하는 행동과 무관하게 자신이 자백하는 것이 이득이므로 둘 다 자백을 택하게 됩니다. 

  • 죄수A의 선택 : 죄수B가 침묵할 것으로 생각되는 경우 자백을 하는 것이 유리합니다. 죄수B가 자백할 것으로 생각되는 경우 자백이 유리합니다. 따라서 죄수A는 죄수B가 어떤 선택을 하든지 자백을 선택합니다.
  • 죄수B의 선택 : 죄수A와 동일한 상황이므로, 마찬가지로 죄수A가 어떤 선택을 하든지 자백이 유리합니다.

 

결국 사이좋게 둘다 5년의 징역을 살게 됩니다. 어떻게보면 정말 멍청한 짓이 되어 버린 것입니다.  각자가 최선의 이익을 보려는 행동으로 인해서 오히려 둘다 큰 손해를 봅니다. 여기서  침묵(협동)보다는 자백(배신)을 통해 더 많은 이익을 얻으므로 모든 참가자가 자백을 택하는 상태를 내쉬 균형(Nash equilibrium)이라고 합니다. 즉,  각 경기자가 상대방의 행동에 대응하여 자신에게 가장 유리한 전략을 선택함으로써 이루어지는 균형입니다. 경쟁자 대응에 따라 최선의 선택을 하면 서로가 자신의 선택을 바꾸지 않는 균형상태를 말합니다.

 

죄수의 딜레마는  '모두가 자신의 이익을 위해 노력하게 하면 자연스럽게 사회는 발전하게 된다'라는 기존의 절대적 진리였던 애덤 스미스의 자유주의 시장 경제 이론과 대치되어 상당한 논란을 불러 일으켰습니다. 

죄수의 딜레마 게임은 여러가지 버전으로 확장될 수 있습니다.  두 죄수가 서로 의사소통을 할 수 있는 경우라든지, 다시 그 죄수들이 똑같은 상황을 마주하게되어 반복되는 죄수의 딜레마(Iterated Prisoner's Dilemma)로 최적의 선택을 찾는 문제로도 확장됩니다. 


#2. 치킨 게임(겁쟁이 게임)

치킨게임 이미지 (충돌하는 A와 B)

치킨(Chicken)은 겁쟁이를 표현하기도 합니다. 치킨 게임(The game of chicken, the hawk–dove game or snowdrift game, 매와 비둘기 게임, 겁쟁이 게임)의 용어는 가상적인 사고 게임에서 비롯되었는데, 두 사람이 각각 자동차를 타고 서로에게 돌진합니다. 이때 누군가가 핸들을 돌려 피하지 않으면 양쪽 모두 죽게 되지만, 누군가가 피한다면 먼저 피하는 사람이 겁쟁이(chicken)가 되어 결국 게임에서 지게 됩니다. 이런 상황을 가정해서 만든 게임입니다. 할리우드 영화에서도 많이 나왔던 장면입니다.

치킨 게임의 보상 행렬

 

이 게임에서의 가장 좋은 시나리오는 나(A)는 직진을 하고, 상대방(B)는 겁을 먹고 자동차 핸들을 돌려 방향을 변경하는 것입니다. 물론 최악의 경우는 둘 다 돌진해서 충돌로 공명하는 것입니다. 이판사판 끝장승부가 되겠습니다. 

 

상대방이 합리적이라고 가정하면, 치킨 게임에서 이길 수 있는 방법은 충돌을 하면 했지, 핸들을 절대로 돌리지 않겠다는 강력한 의지를 상대에게 확인시켜주는 것입니다(예를 들면 핸들에 자신의 손을 묶어 직진 혹은 핸들을 망가뜨려 직진. 배수진 전략). 하지만 이와 같은 승리를 얻기 위해서는 충돌해서 둘 다 죽는 치명적인 위험도 감수해야합니다. 그래서 치킨 게임에서는 미친놈이 이긴다고 말하기도 합니다. 그러나 상대방도 미친놈이면 파국으로 갑니다. 현실에서는 이를 고려해서 타협하는 전략도 있습니다.

 

이와 같은 치킨 게임의 비즈니스 분야에서의 예로는 메모리 반도체 분야에서의 삼성전자와 일본 업체들의 경쟁을 들 수 있습니다. 과거 삼성전자가 손실을 감수해서 반도체 가격을 계속해서 내려서 결국 시장을 독식하게 되었습니다.

치킨 게임은 제2차 세계대전 이후 냉전 시대에서 미국과 소련의 군비 경쟁도 이런 치킨 게임에 비유하면서 국제정치학 용어로도 쓰이게 되었습니다.

 


#3. 인공지능(AI)에서의 게임 이론 활용

인공지능 측면에서 게임 이론은 기본적으로 결정을 내리는 데 도움이 됩니다. 그 중의 하나는 생성적 적대 신경망(Generative Adversarial Network; GAN. 이하 GAN)의 개념입니다 . 

 

이 개념은 2014년에 이안 굿펠로우(Ian. j. Goodfellow)에 의해 발표되었습니다. GAN은 비지도 학습에 사용되는 인공지능 알고리즘으로, 제로섬 게임 틀 안에서 서로 경쟁하는 두 개의 신경 네트워크 시스템에 의해 구현됩니다. 이것은 본질적으로 두 신경망 간의 경쟁 게임입니다.  내부적으로 경쟁하는 프로세스는 더 이상 개선 범위가없는 상태에 도달 할 때까지 계속됩니다. 이 상태가 바로 내쉬 균형(Nash equilibrium)입니다.  본질적으로 내쉬 균형을 찾기 위해 지속적으로 최적화하고 있는 것입니다.

 

또 다른 응용의 예로 피츠버그의 카네기 멜론 대학교에서 개발된 Libratus(리브라투스)가 있습니다. Libratus는 텍사스 홀덤(Texas hold'em)과 같은 포커를 하기 위해 고안된 인공 지능 컴퓨터 프로그램입니다. 텍사스 홀덤(Texas hold'em)은 플레잉 카드로 즐기는 가장 대표적인 "커뮤니티 카드 포커" 게임이며, 손패 2장과 공유카드 5장으로 족보를 맞춰서 높은 쪽이 승리하는 게임입니다. Libratu의 성능은 20,000개 이상의 포커 족보(hands of poker)로 세계 챔피언을 제치고 있습니다. Libratus의 놀라운 점은 기계 학습 방법을 전혀 사용하지 않는다는 것입니다.  게임 이론은 이 Libratus의 핵심 아이디어입니다. Deep Learning 또는 Reinforcement Learning 방법에 비해 상대적으로 낮은 컴퓨팅 파워를 사용합니다.  

 

게임 이론은 인공지능 자율 주행 자동차를 사용하여 지역의 교통 흐름을 개선하는 데에도 활용됩니다. 각 자동차는 외부 환경과 완벽한 상호 작용을 합니다. 특정 경로를 따라가는 것이 여행에 편리 할 수 ​​있기 때문에 자동차가 다른 자동차와 충돌 할 수 있다는 것을 고려해야합니다. 이런 상태는 게임 이론으로 쉽게 모델링 할 수 있습니다. 게임 이론 측면에서 자동차는 플레이어 역할을 하며 내쉬 균형은 서로 다른 자동차 간의 협업 지점으로 생각할 수 있습니다.

 

이외에도 다양한 분야에서 게임 이론을 인공지능에 접목하는 시도가 이어지고 있습니다.  

 

Copyright 2021. 『오드리공주될뻔 블로거』  All rights reserved.

Posted by 오드리공주될뻔
|

달 이미지

달하면 뭐가 떠오르시죠 ? 오늘은 달을 천체망원경으로 자세히 관찰하면 달 표면의 분화구가 보이는데, 이 분화구의 여러 이름 중에 하나인 "Condon"에 관련된 이야기입니다.

 

지능적인 체스/체커 게임과 인간과의 대결이외도 또 다른 게임분야에서 사람과 대결하는 게임 프로그램과 하드웨어에 대한 구현 노력이 있었습니다. 바로 에드워드 콘던(Edward Uhler Condon : 1902년 ~ 1974년)의 님 게임(Nim Game) 전용 기계인 니마트론(Nimatron)입니다.

달 분화구의 이름 중에도 "Condon"이 있는데 이는 바로 에드워드 콘던(Edward Uhler Condon)의 이름 따서 명명한 것입니다. 달의 표면은 수많은 분화구가 있으며 이 중 대부분이 충격으로 말미암아 형성된 것입니다. 아래 이미지는 미국 항공 우주국 NASA에서 운영한, 달 궤도를 탐사하는 최초의 미국 우주선인 "Lunar Orbiter 1"가 찍은 직경 35km 크기의 달 분화구 "Condon" 이미지입니다.

달의 분화구 Condon [출처 : 영어 위키백과]


에드워드 콘던(Edward Uhler Condon : 1902년 ~ 1974년)은 미국의 핵 물리학자이며, 양자 역학의 선구자로, 제2차 세계 대전 당시 최초의 핵무기 개발 프로젝트였던 맨해튼 프로젝트(Manhattan Project)의 일원으로서 레이더와 핵무기 개발에 참여했던 인물입니다. 에드워드 콘던은 1928년에 조지 가모프(George Gamow)와 로널드 거니(Ronald W. Gurney)와 함께 터널 효과를 증명했던 인물이기도 합니다. 터널 효과(혹은 터널링, tunnel effect, tunneling)은 양자 역학에서 원자핵을 구성하는 핵자가 그것을 묶어 놓은 핵력의 퍼텐셜(potential) 장벽보다 낮은 에너지 상태에서도 확률적으로 원자 밖으로 튀어 나가는 현상을 말합니다.

에드워드 콘던은 또한 콘던 위원회(Condon Committee)가 작성한 콘던 보고서라는 유명한 UFO관련 보고서 작업을 감독했던 인물입니다. 콘던 위원회는 1966년부터 1968년까지 미확인 비행 물체(UFO,Unidentified Flying Object)를 연구하기 위해 미국 공군이 자금을 지원 한 “University of Colorado UFO Project”의 비공식 이름입니다. 에드워드 콘던의 지시에 따라 진행했던 콘던 위원회는 “미확인 비행 물체에 대한 과학적 연구(Scientific Study of Unidentified Flying Objects)”라는 제목의 보고서를 제출합니다. 이 보고서의 비공식적인 이름이 콘던 보고서(Condon Report, 1968년)입니다.  이 보고서의 결론에 대해서는 엇갈린 반응이 있지만, 주요 비평가들은 UFO 문제의 과학적 상태에 관한 가장 영향력 있는 공개 문서로 보고 있습니다. 결론적으로 UFO 연구에 의해 발견된 가치가 거의 없다고 한 보고서입니다. (한마디로 UFO에 쓸데없이 시간투자 하지 말자는 이야기입니다.)

콘던 보고서(Condon Report) 만평

 

오늘 이야기의 주제인 니마트론(Nimatron)은 에드워드 콘던이 엔터테인먼트 목적으로 1939년 겨울에 설계한 것으로, 7개의 전구로 구성된 4줄의 조명을 허용하는 전자 기계식 릴레이(electromechanical relays)로 구성된 디지털 컴퓨터입니다. 니마트론(Nimatron)은 이와 같은 4줄의 조명으로 님 게임(nim game)을 할 수 있는 컴퓨터로, 에드워드 콘돈(Edward Uhler Condon)과 그의 연구원들과 함께 만들어 1940년 4월 뉴욕 ​​세계 박람회에서 처음으로 발표되었습니다.

 

원리를 살펴보면 각 플레이어는 어떤 라인에서든 하나 이상의 전구를 끌 수 있으며  기계(니마트론)는 플레이어와 차례대로 진행합니다. 일반적인 님 게임(nim game)에서 그렇듯이 빛을 끄는 마지막 사람이나 기계(니마트론)가 승자입니다. 니마트론(Nimatron)님 게임을 경기하는데 필요한 복수 세트의 조명을 제공합니다. 세트의 조합은 각 세트의 특정 전구를 꺼서 설정할 수 있습니다. 전구는 수동으로 작동 가능한 스위치로 제어되는 회로에 연결됩니다. 특허 출원된 내용을 보면 좀더 상세하게 설명이 되어있는데, 처음 조합은 아래의 테이블에서 순차적으로 정하는 방식으로 구현했습니다.

니마트론(Nimatron) 특허내용 일부1

 플레이어는 자신의 차례에 스위치를 조작하여 한 세트에서 원하는 수의 전구를 끌 수 있습니다.  그러면 니마트론(Nimatron)은 다른 스위치를 작동하여 세트 중 하나의 특정 추가 전구가 자동으로 꺼지도록 할 수 있습니다.  플레이어는 자신이나 기계가 마지막 전구를 끌 때까지 작업을 반복 할 수 있습니다.  바람직하게는 처음에 전원이 공급되는 전구의 수는 제어 요소를 조작하는 플레이어가 첫 번째 이동에서 우승 조합을 설정하고,  다음 이동을 할 때 우승 조합을 유지하는 경우 이길 수 있도록하는 것입니다.  그러나 플레이어가 한 번의 잘못된 이동을하면, 기계는 승리 조합을 설정하고  그 후 플레이어는 확실히 패배합니다. 내부적으로 보면 이 원리는 이진법을 이용하여 균형상태를 맞추면 이기는 님 게임(nim game) 필승전략을 활용한 것입니다.

니마트론(Nimatron) 특허내용 일부2

 

박람회 기간 동안 기계의 반응은 긍정적이었고, 거의 100,000번의 님 게임(nim game)을 플레이하면서 성공했습니다. 그 중 약 90,000번는 니마트론(Nimatron)이 이겼습니다. 승률 90%! 이긴 사람은 "Nim Champ"라는 동전을 선물로 받았습니다. 니마트론(Nimatron)은 완전히 구성된 최초의 컴퓨터 게임이자 님 게임(nim game) 전용의 최초 컴퓨터로 간주되지만, 디지털 컴퓨터 및 컴퓨터 게임에 미치는 영향은 미미합니다. (참고로 통상 최초의 컴퓨터 게임으로는  우주 전투 비디오 게임인 “Spacewar!(1962년 출시)”라는 게임을 말합니다.)

니마트론(Nimatron) 이미지

 

전시장 방문객들이 이 기계를 만지고 난 뒤에 "나는 미래를 봤다"며 찬사를 아끼지 않았습니다. 니마트론(Nimatron)은 당시 기준으론 크기도 소형이었기 때문에 미국 가정으로 가정용 컴퓨터로 보급해서 엔터테인먼트 기계로 성장할 가능성이 높았기에 장밋빛 미래를 점치기도 했습니다. 하지만 공개한 지 얼마 지나지 않아 제2차 세계대전이 발발하면서 미국과 유럽 사회 전역에 부정적인 견해가 지배하게 되었고, 니마트론(Nimatron)은 사람들로부터 거부감을 느끼는 기계로 자연스럽게 기억에서 잊히게 됩니다.


님 게임(nim game)은 구슬 더미, 돌멩이 더미, 성냥개비 같은 것을 쌓아 놓고 차례대로 몇 개씩 덜어내기를 해서 누가 맨 마지막 것을 집게 되는지를 겨루는 게임입니다. 한 동안 유행했던 "배스킨라빈스 31 게임"이 바로 님 게임(nim game)의 일종입니다.

이 게임은 중국에서 시작되었다고 하지만, 그 기원은 불확실합니다. 옛날 서양의 선술집 탁자 위에는 항상 성냥갑이 하나씩 놓여 있었고, 선술집에 오는 사람들은 성냥개비를 사용한 여러 가지 게임으로 내기를 하며 놀았습니다. 그 중의 하나가 님 게임(nim game)이라는 설도 있습니다.

4층 성냥 배열의 님 게임  [출처 : 영어 위키백과]

 

니마트론(Nimatron)에서 영감을 받아, 훗날 1951년 존 메이크피스 베넷(John Makepeace Bennett)은 Nimrod를 설계했습니다. Nimrod는 비디오 게임의 선구자 중 하나로 간주되는 Nimatron과 유사한 게임 기계입니다.

베를린의 Computerspielemuseum에 전시된 Nimrod [출처 : 영어 위키백과]

1940년에 디지털 컴퓨터 형태로 만들어 사람과 님 게임(nim game)을 경쟁한 니마트론(Nimatron)이였습니다.

Copyright 2021. 『오드리공주될뻔 블로거』  All rights reserved.


님 게임 만평

Posted by 오드리공주될뻔
|

#6. 자동화된 추론 논리 이론가 (Logic Theorist)

아서 사무엘(혹은 아서 새뮤얼, Arthur Lee Samuel)이 체커 프로그램을 시연하던 시기에 또 하나의 첫 번째 인공지능 프로그램이 탄생하고 있었습니다. 바로 게임분야가 아닌, 수학 원리의 증명을 인간과 같이 할 수 있을지를 검토한  "논리이론가 (LT, Logic Theorist 혹은 Logic Theory Machine) "입니다. 이 프로그램은 1956년도에 첫 
 시연을 가졌습니다.

 

논리 이론가는 앨런 뉴얼(혹은 앨런 뉴웰, Allen Newell : 1927년 ~ 1992년), 허버트 알렉산더 사이먼(Herbert A. SimonHerbert Alexander Simon : 1916년 ~ 2001년) 및 클리프 쇼(John Clifford Shaw or Cliff Shaw  : 1922년~1991년)가 1956년에 작성한 컴퓨터 프로그램입니다 . 자동화된 추론(automated reasoning)을 수행하기 위해 의도적으로 설계된 최초의 프로그램으로 "최초의 인공 지능 프로그램"이라고도 합니다. 

최초의 인공지능 프로그램

 

이 프로그램은 수학원리(Principia Mathematica : Alfred North Whitehead과 Bertrand Russell의 저서)에서 처음 52개의 정리 중에서 38개를 증명하고 일부에서는 수작업으로 사람이 만든 증명보다 좀 더 멋진 증명을 찾아냈습니다. 사람처럼 수학 원리를 증명할 수 있다는 부분이 획기적입니다.

 

앨런 뉴얼과 허버트 알렉산더 사이먼(이하 '허버트 사이먼')은 지난번 소개드린 인공지능의 용어가 탄생하게 된 존 메카시(John McCarthy)가 주도했던 다트머스 워크숍에 참석했던 인물들입니다. 여기에 RAND Corporation(랜드 연구소, 미국의 대표적인 싱크 탱크 비영리 법인)의 시스템 프로그래머였던 클리프 쇼가 개발에 공동으로 참여하여 논리 이론가 프로그램을 탄생시킨 것입니다.

 

1955년 앨런 뉴얼과 허버트  사이먼이 논리 이론가에 대한 작업을 하기 시작했을 때 인공지능 분야는 아직 본격적으로 태동하지 않았습니다. 이들은 1956년 6월 15일 발행된 Rand Corporation 보고서 P-868에서 "논리 이론 기계(The Logic Theory Machine. A Complex Information Processing System)"라는 제목으로 논리 이론가를 처음으로 설명했습니다.

앨런 뉴얼과 허버트 사이먼의 Logic Theory Machine 보고서 

 

 

논리 이론가는 인공지능 연구의 핵심이 될 몇 가지 개념을 도입했습니다.

첫 번째는 추론을 통한 탐색입니다. 검색 트리(search tree)를 기반으로 탐색을 구현했는데, 검색 트리에서 Root는 초기 가설이었고 각 분기(Branch)는 논리 규칙에 기반한 추론이었습니다. 트리 어딘가에는 프로그램이 증명하고자하는 명제(proposition)가 있는 형태였습니다. 목표를 따라가는 경로가 수학에서의 증명(Proof)이 였습니다. 이는 각각의 논리 규칙을 사용해서 추론되는 증명할 명제에 대한 가설에 대한 표현들입니다.

두 번째는 경험적 방법론(휴리스틱, Heuristics)을 도입한 것입니다. 이들은 경험법(Rule of Thumb)으로 트리가 기하급수적인 탐색공간을 마련하므로, 일부 분기(Branch)를 자르기(Trim)를 해야한다는 것을 알고 적용했습니다. 이러한 규칙을 "휴리스틱(heuristics)"이라고 불렀습니다. 휴리스틱은 인공지능 연구의 중요한 영역이며, 기하급수적으로 증가하는 검색의 조합폭발(혹은 조합 확산 : 문제 복장성이 급격한 증가하는 것. Combinatorial explosion)을 극복하는 중요한 방법으로 남아 있습니다.

세 번째는 목록 형식의 데이터 처리방법인 리스트 프로세싱입니다.  클리프 쇼를 포함하여 이들 세 명의 연구원은 컴퓨터에서 논리 이론가를 구현하기 위해 프로그래밍 언어인 IPL(어셈블리 언어 스타일의 프로그래밍 언어, Information Processing Language)을 개발했습니다. 이 프로그래밍 언어는 나중에 AI 연구원들에 의해 종종 사용하는 중요한 언어인 존 메카시(John McCarthy)의 Lisp 프로그래밍 언어의 기반이 될 동일한 형태의 기호 목록 처리를 사용했습니다.

 

허버트 사이먼은  1956년 1월 대학원 수업에서, 자신이 앨런 뉴얼과 함께 사고하는 머신(Thinking Machine)을  발명했다고 말했습니다. 이는 철학적 관점에서 논리 이론가를 시스템이 기호와 휴리스틱으로 인간 사고의 모델을 흉내 내는 것으로 볼 수 있다는 측면을 강조한 것입니다.

해당 논문에서의 추론의 특성과 학습 프로세스의 설명 


이 논리 이론가가 좀 더 발전하여, 나중에는 인간의 문제해결 과정을 모형화한 프로그램인  '일반문제해결자 (General Problem Solver, 1958)'로 나옵니다.

앨런 뉴얼은 인공지능과 인지심리학의 기초를 쌓은 공헌을 인정받아 허버트 사이먼과 함께 1975년에 튜링상을 받았습니다. 앨런 뉴얼과 허버트 사이먼은 지속적인 파트너십을 맺었습니다. 그들은 Carnegie Mellon University에 인공 지능 실험실을 설립하고 50년대 후반과 60년대에 걸쳐 일련의 중요한 프로그램과 이론적 통찰력을 제공했습니다.

문제를 해결하기 위해 기호와 휴리스틱을 이용했고, 이를 통해 기계가 마음을 반영하는 인간 사고의 모델이라는 것을 증명하고자 했던 분들이 바로 앨런 뉴얼과 허버트 사이먼이였습니다.

 

"물리적 심볼 시스템은 일반적인 지능적 행동에 필요하고 충분한 수단을 가지고 있습니다.(A physical symbol system has the necessary and sufficient means for general intelligent action.)"
- Allen Newell and Herbert A. Simon -

논리 이론가 만평

 

Posted by 오드리공주될뻔
|