アメリカ最新AI情報満載!セミナーや講演情報など交えて毎週水曜配信 無料ニュースレター 下記へメールアドレスを入力し無料で登録
CLOSE
パロアルトインサイト/ PALO ALTO INSIGHT, LLC.
パロアルトインサイト/PALO ALTO INSIGHT, LLC. > ブログ > 強化学習の可能性を広げたDeepNashとは
投稿日:2022/07/27 更新日: 2023/05/22 by kohei

強化学習の可能性を広げたDeepNashとは

不完全情報ゲーム「ストラテゴ」に対応するための新たなアプローチ

今週のテーマ:技術開発

パロアルトインサイトの嶋崎です。2016年にDeepMind社が発表した「アルファ碁」は、囲碁で世界トップレベルのプロ棋士に勝ち、話題を集めました。

2022年6月、同社の研究者が新たなAI「DeepNash」を発表しました。これまで人のトッププレーヤーにAIがまったく及ばなかったゲーム「ストラテゴ」で、驚異的なレベルアップを実現したのです。その背景には、強化学習を使った、従来とはまったく異なるアプローチがあります。

シリコンバレーから現役データサイエンティストのインサイトをお届けする「The Insight」。今回取り上げるのは、DeepMindの研究者が発表した最新AI「DeepNash」です。

?

この記事から得られる3つのナレッジ ・DeepNashの何がすごいのか ・ストラテゴのプレーがAIには難しい理由 ・強化学習を活用した新たな技術手法

論文データ:
今回のディスカッション対象の論文をご紹介します。

タイトル:Mastering the Game of Stratego with Model-Free Multiagent Reinforcement Learning
著者:Julien Perolat et al.
掲載サイト:arXiv
発行日:2022年6月30日
引用数:
URL:https://arxiv.org/abs/2206.15378

?この論文を選んだポイント
ビジネスを含む幅広い領域で応用されている「強化学習」の可能性を広げる論文であるため。
?この記事に登場する技術キーワード
  • アルファ碁
関連記事「AIが囲碁で人間に勝つ。その事実のどこが凄いのか
  • 不完全情報ゲーム
  • 強化学習
関連記事「ソニーAIの研究は何がすごいのか?エチケットを理解した深層強化学習
  • ナッシュ均衡

目次

DeepNashのすごさとは

ストラテゴは高度な判断が必要なゲーム

他のAIに対するDeepNashの圧倒的な強さ

DeepNashの技術的アプローチ

AIビジネスデザイナーのワンポイントアドバイス

DeepNash のすごさとは

まずはDeepNashの成果の何がすごいのかを解説します。

ストラテゴで驚異的なレベルアップをした

DeepNashは「ストラテゴ(Stratego)」というボードゲームで、人のトッププレーヤーに匹敵する強さを手に入れました。下図は木製のストラテゴです。

ボードゲームでのAIと人の競争といえば、将棋や囲碁が大きな話題になったので、ご記憶の方も多いかと思います。DeepMind社が開発した「アルファ碁」が、世界トップレベルの棋士に勝ったのが2016年でした。さらに2018年に発表された「アルファゼロ」は、チェス・将棋・囲碁のすべてで、人のトッププレーヤーを上回る強さを手に入れたのです。

2022年現在、ほとんどのボードゲームにおいて、AIが人を圧倒しています。そんな中で、数少ない「AIが人のトッププレーヤーに勝てないボードゲーム」のひとつが、ストラテゴだったのです。

なおアルファ碁については、過去記事「AIが囲碁で人間に勝つ。その事実のどこが凄いのか」で解説しました。ぜひあわせてお読みください。

DeepNashはどれほど強いのか

DeepNashの強さを数字でまとめると、以下の通りです。

?DeepNash の成績
  • 97%以上の勝率:他のAIを圧倒
  • 84%の勝率:人のトッププレーヤー相手に
  • 人と競争し世界トップ3のランク:2022年の年間と全期間の両方で

他のAIでは、人のトッププレーヤーに遠く及びません。そんな中で、DeepNashだけが驚異的な強さを手に入れたことから、注目を集めているのです。

ストラテゴは高度な判断が必要なゲーム

DeepNashについて理解するための前提知識として、ストラテゴがどんなゲームなのかを紹介します。

ゲームの特徴とプレーの流れ

ストラテゴは端的に言えば「西洋版の軍人将棋」です。とはいえ、そもそも軍人将棋を知らないという方も多いでしょうから、順に説明してきます。

下図は論文中に掲載された、ストラテゴを説明するための図です。

ストラテゴは2人用のゲームで、以下の特徴があります。

ストラテゴの特徴
  • 相手陣地にある「旗(駒の一種)」を取れば勝利
  • 盤面の広さは10×10の100マス
  • 1〜10の強さの駒を40個ずつ双方が持つ
  • 特殊な働きをする駒がある

ゲームは以下の流れで進められます。

  1. 駒を自陣に自由に配置する(相手プレーヤーに駒の強さや種類は見せない)
  2. プレーヤーは駒の「移動」または「攻撃」を繰り返す
    1. 自分の手番で相手の駒に攻撃を仕掛けられる
    2. 攻撃が行われると、双方の駒の種類と強さが公開される
    3. 攻撃の結果、弱い方の駒はボードから取り除かれる
  3. どちらかのプレーヤーが「旗」に攻撃を仕掛けたらゲーム終了

ありえる局面のパターンが多い

駒の数と種類が多く、盤面も広いためありえる局面のパターンが非常に多いのが、ストラテゴの特徴です。

ありえる局面のパターンは、碁が「10の360乗」なのに対し、ストラテゴは「10の535乗」です。ストラテゴにおいては、あまりにも多いため、囲碁のように「先を読む」方法では、最適な指し手を決めることは困難です。

そのため、ストラテゴをうまくプレーするAIを開発するには、囲碁とは違ったモデルが必要となります。

情報がすべては公開されていない

ストラテゴでは、すべての情報がプレーヤーに公開されるわけではありません。相手の駒の種類や強さは、攻撃が行われるまでわからないのです。このように不明な情報があるゲームを「不完全情報ゲーム」と呼びます。

不完全情報ゲームでは、すべての情報が公開されている碁や将棋、チェスなどの「完全情報ゲーム」と比べ、最善の戦略が明確ではありません。このことが、強いAIを開発するうえで大きな壁となってきました。

ストラテゴではたとえば、「相手の駒の種類を知るために、あえて自分の駒を犠牲にする」といった戦い方がありえます。完全情報ゲームと比較すると、より高度な判断が必要となるのです。

他のAIに対するDeepNashの圧倒的な強さ

DeepNashは他のAIとの対戦で、圧倒的な勝率を示しました。

以下の表は、有名な8つのAIと対戦した結果です。

おすすめ/関連記事こちらの記事も合わせてどうぞ

パロアルトインサイトについて

AIの活用提案から、ビジネスモデルの構築、AI開発と導入まで一貫した支援を日本企業へ提供する、石角友愛氏(CEO)が2017年に創業したシリコンバレー発のAI企業。

社名 :パロアルトインサイトLLC
設立 :2017年
所在 :米国カリフォルニア州 (シリコンバレー)
メンバー数:17名(2021年9月現在)

パロアルトインサイトHP:www.paloaltoinsight.com
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

石角友愛
<CEO 石角友愛(いしずみともえ)>

2010年にハーバードビジネススクールでMBAを取得したのち、シリコンバレーのグーグル本社で多数のAI関連プロジェクトをシニアストラテジストとしてリード。その後HRテック・流通系AIベンチャーを経てパロアルトインサイトをシリコンバレーで起業。データサイエンティストのネットワークを構築し、日本企業に対して最新のAI戦略提案からAI開発まで一貫したAI支援を提供。東急ホテルズ&リゾーツ株式会社が擁する3名のDXアドバイザーの一員として中長期DX戦略について助言を行う。

AI人材育成のためのコンテンツ開発なども手掛け、順天堂大学大学院医学研究科データサイエンス学科客員教授(AI企業戦略)及び東京大学工学部アドバイザリー・ボードをはじめとして、京都府アート&テクノロジー・ヴィレッジ事業クリエイターを務めるなど幅広く活動している。

毎日新聞、日経xTREND、ITmediaなど大手メディアでの連載を持ち、 DXの重要性を伝える毎週配信ポッドキャスト「Level 5」のMCや、NHKラジオ第1「マイあさ!」内「マイ!Biz」コーナーにレギュラー出演中。「報道ステーション」「NHKクローズアップ現代+」などTV出演も多数。

著書に『AI時代を生き抜くということ ChatGPTとリスキリング』(日経BP)『いまこそ知りたいDX戦略』『いまこそ知りたいAIビジネス』(ディスカヴァー・トゥエンティワン)、『経験ゼロから始めるAI時代の新キャリアデザイン』(KADOKAWA)、『才能の見つけ方 天才の育て方』(文藝春秋)など多数。

実践型教育AIプログラム「AIと私」:https://www.aitowatashi.com/
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

 

※石角友愛の著書一覧

NEWSLETTERパロアルトインサイトの
無料ニュースレター

毎週水曜日、アメリカの最新AI情報が満載の
ニュースレターを無料でお届け!
その他講演情報やAI導入事例紹介、
ニュースレター登録者対象の
無料オンラインセミナーのご案内などを送ります。

BACK TO BLOG
« »
PAGE TOP