AI(인공지능) 외교관, 전략 게임에서 인간 능가 (동영상)

AI(인공지능) 외교관, 전략 게임에서 인간 능가 (동영상): 문광주 기자 / 기사승인 : 2022-11-24 11:23:50

3'30" 읽기 + 3'31" 영상
- 연구원들은 "Cicero" AI 시스템을 개발. 이것은 자가 학습 알고리즘의 두 모듈 기반
- AI 시스템 Cicero는 게임 "Diplomacy"에서 많은 인간 플레이어보다 더 잘 수행
- 게임의 특징:전략적, 군사적 결정뿐만 아니라 잠재적 동맹국과의 능숙한 협상 및 협의 필요
- "Cicero는 다른 게임에서 AI로 인식되지 않았다"

인공 지능 외교 마스터
AI 시스템 Cicero는 게임 "Diplomacy"에서 많은 인간 플레이어보다 더 잘 수행한다.

외교관으로서의 기계 두뇌:
인공 지능은 전략 게임에서 우리 인간을 이길 뿐만 아니라 새로 개발된 "Cicero" AI 시스템이 증명하듯이 능숙한 협상에서도 우리를 따라잡을 수 있다. "Diplomacy" 게임에서 이것은 인간 플레이어에 대해 성공적으로 - 그리고 탐지되지 않고 - 우세했다. 특별한 점은 이 멀티플레이어 게임은 전략 외에도 상호 합의와 숙련된 의사소통에 관한 것이다.

▲ 새로 개발된 "Cicero" AI 시스템이 증명하듯이 능숙한 협상에서도 우리를 따라잡을 수 있다.(영상 스냅샷)

패턴, 전략 또는 복잡한 데이터와 관련해 인공 지능은 이제 한발 앞서 있다. 신경망에 기반한 자가 학습 알고리즘은 체스, 바둑, 심지어 포커의 허풍과 같은 전략 게임에서 인간 플레이어를 물리치고 단백질 구조를 해체한다. 수십 년 동안 풀리지 않았거나 새로운 수학적 정리 및 증명을 개발했다. AI 시스템은 오랫동안 음성 인식 및 출력을 위한 일상생활의 일부였다.

외교: 협력과 기만

이제 새로운 AI 시스템은 의사소통의 예술인 외교적 협상도 마스터할 수 있음을 입증하고 있다. 게임 'Dplomacy 외교'는 1차 세계대전 이후 7명의 플레이어가 유럽 각국의 보급소를 확보하기 위해 경쟁하는 테스트 역할을 했다. 이 게임의 특징은 전략적, 군사적 결정뿐만 아니라 잠재적 동맹국과의 능숙한 협상 및 협의가 필요하다는 것이다.

페이스북 그룹 메타(Meta)의 AI 연구센터 안톤 박틴(Anton Baktin)과 그의 동료들은 “불신으로 특징지어지는 게임 환경에서 타인의 신뢰를 얻는 데 성공이 달려 있기 때문에 외교는 특별한 도전”이라고 설명한다. "인공지능이 성공하기 위해서는 다른 플레이어가 약속을 지키지 않거나 자신의 진술을 믿지 않는다는 점을 고려해야 한다." 따라서 AI 시스템은 전략과 커뮤니케이션 모두에서 설득력이 있어야 한다.

▲ "인공지능이 성공하기 위해서는 다른 플레이어가 약속을 지키지 않거나 자신의 진술을 믿지 않는다는 점을 고려해야 한다."

전략 및 언어 처리 결합

이 작업을 수행하기 위해 연구원들은 "Cicero" AI 시스템을 개발했다. 이것은 자가 학습 알고리즘의 두 모듈을 기반으로 한다. 첫 번째는 12만5000개 이상의 Diplomacy 온라인 게임 플레이를 기반으로 유망한 플레이와 다른 플레이어의 행동에 대한 반응을 학습한 전략 모듈이다. 두 번째 구성 요소는 Diplomacy 게임의 4만 개 이상의 대화에 대해 훈련된 언어 엔진이다. 문장에 대한 추가 정보로 AI는 맥락과 추정 의도에 대한 정보를 받았다.

▲ 첫 번째는 12만5000개 이상의 Diplomacy 온라인 게임 플레이를 기반으로 했다.

또한 인공 지능은 동료 플레이어와 상대방의 관점을 평가하는 방법을 배워야 했다. "예를 들어 Cicero가 동맹과 함께 공격을 조정하는 경우 적의 반응에 대한 그의 예측은 후자가 의도된 협력에 대해 아무것도 모른다는 점을 고려해야 한다"고 연구원은 설명했다. 반대로 AI는 상대 플레이어가 비밀 계약을 맺을 것을 기대해야 한다.

인간 플레이어에 대해 성공

2022년 여름, 팀은 온라인 버전의 Diplomacy에서 AI 시스템이 이러한 도전에 부응하는지 테스트했다. "Cicero"는 82명의 인간 경쟁자와 40개의 게임에 참가했으며 21명의 참가자와 함께 토너먼트도 완료했다. 그 결과 Cicero는 40경기 만에 순위 상위 10%에 진입했고 8경기 토너먼트에서 우승했다.

"또한 Cicero는 다른 게임에서 AI로 인식되지 않았다"고 Baktin과 그의 동료는 보고했다. 평균적으로 AI 시스템은 게임당 동료 플레이어에게 약 130개의 메시지를 보냈고 구어체도 사용했다. 분명히 설득력이 있다. 그러나 메시지가 전략이나 맥락에 맞지 않는 실수도 있었다. 이것은 메시지의 약 10%의 경우였다.

"우리는 게임이 시간 압박하에 진행되었고 인간 플레이어도 비슷한 실수를 하기 때문에 이러한 실수가 의심을 불러일으키지 않았다고 생각한다"고 연구원은 설명했다. 이렇게 엄격한 시간 제한이 없는 라운드에서는 AI 시스템이 잡히지 않는 것이 더 어려워질 수 있다.

"협력 AI의 돌파구“

Baktin과 그의 팀에 따르면 Cicero의 성공은 AI 시스템이 순전히 전략적인 작업뿐만 아니라 종종 이와 관련된 외교 및 의사소통 문제도 처리할 수 있음을 보여준다. 고급 전략과 언어 처리의 조합을 통해 인공 지능은 동맹을 구축하고 계획을 조정하며 다른 사람의 의도를 평가할 수 있다.

Meta AI의 수석 AI 과학자인 Yan LeCun은 "Diplomacy만큼 전략적으로 복잡한 게임에서 인간과 경쟁할 수 있는 시스템은 협력 AI의 진정한 돌파구다"고 말했다. Google 연구 센터 DeepMind의 대표도 비슷하게 본다. DeepMind 연구원 Yoram Bachrach는 "Science"에서 "이것은 놀라운 결과다"고 말했다.

앞으로 이러한 AI 시스템이 어떤 형태로 사용될지는 두고 볼 일이다. 마찬가지로, 예를 들어 회사가 그러한 알고리즘을 사용하는 경우 어떤 윤리적 결과가 발생할까?
(Science, 2022; doi: 10.1126/science.ade9097)
출처: Science

[더사이언스플러스=문광주 기자]