「AIは人間を超えることができるのか」というAIの未来を理解するために大事な報酬メカニズムを徹底解説
こんにちは、パロアルトインサイトのCTO長谷川です。今回は「AlphaGo」の開発でも知られるDeepMind社のポジションペーパーについて取り上げます。
ポジションペーパーとは、学術論文と違い、数学的な証明や実験に基づく仮説の証明がなく、文章だけで仮説を提示する論文のことです。
AlphaGo開発の中心人物であるデイビッド・シルバーと、AI研究の重鎮であるリチャード・サットンが昨年書いたセンセーショナルな論文は、AI研究者の間で大きな論争を巻き起こしました。
今回は、「AIは人間を超えることができるのか」というAIの未来を占う内容について、詳しく解説します。
シリコンバレーから現役データサイエンティストのインサイトをお届けする「The Insight」。今回は、「AIは人間を越えるのか」「もし超えるとしたら、それはどんな学習をさせた場合か」というAI研究の最先端の論文を、2週にわたってご紹介します。
前半にあたる今週は、人間を越えるAIの可能性について、強化学習における報酬のフレームワークの観点から詳しく解説します。
論文データ:
今回のディスカッション対象の論文をご紹介します。
論文タイトル:Reward is enough
著者:David Silver,Satinder Singh,Doina Precup,Richard S. Sutton
Deepmind web 掲載:Reward is enough, May 12th,2021
ジャーナル掲載:Artificial Intelligence Volume 299, October 2021, 103535
発行日:2021年10月
引用数:
URL:https://www.sciencedirect.com/science/article/pii/S0004370221000862
? この記事から得られる3つのナレッジ
・AGIとシンギュラリティの定義について
・DeepMind社が考えるAGI実現の鍵について
・報酬モデルのフレームワークについて
人間を超える能力を持つAIについては、長い間SFの世界で語られてきました。生物学者で作家のアイザック・アシモフが1950年に出版した『I,Robot(邦題:われはロボット)』を原作とする映画『アイ,ロボット』。2004年に公開されたこの映画は、ロボットの存在が当たり前となった2035年のアメリカを舞台に、人間と同等の知能や感情までも持ったロボットとそれを取り巻く社会について描いています。
最近では、イギリスのロボット開発会社Engineered Artsがヒューマノイドロボット「Ameca」を公開しました。昨年12月に公開された動画 https://www.youtube.com/watch?v=IPukuYb9xWw で、人間さながらの表情を見せるAmecaは、『アイ,ロボット』に登場するロボットNS-5を彷彿とさせます。映画で描かれていた世界が、近い将来現実のものとなるのでしょうか。映画の時代設定だった2035年は、もうそう遠くない未来です。
めざましい発展を遂げるAI研究ですが、現在のAIは限定された範囲で特定のタスクにのみに機能するもので、映画の世界にはまだ遠く及びません。お掃除ロボット「ルンバ」を始めとするスマート家電、Siri、Googleアシスタント、AlexaなどのAIアシスタント、顔認証に使われる画像認識など、特定の目的と機能に限られています。
AIには、上記のように特定の目的のための特化型人工知能(Narrow AI)と、**人間と同等の能力を持つ汎用人工知能(AGI、Artificial General Intelligence)**が存在します。
AGIは『アイ,ロボット』に登場するロボット「サニー」のように、人間に近い能力を備えたAIです。AGIは人間のような認知能力を持ち、過去の経験や知識を元に環境の変化に適応することができます。さらに、想像力、表現力、予測力、計画力、そして感情も持ち合わせています。私たちがイメージしやすい例を挙げるならば、「ドラえもん」のイメージです。
では、AI研究者は最終的にドラえもんのようなAIを作ることができるのでしょうか?その問いに対して、DeepMind社は、この論文の中でひとつの仮説を立てています。それが、この論文のタイトルにもなっている「Reward is enough」です。つまり、AGIを実現するためには、「報酬を与えるだけで十分である」というのです。この「報酬の定義を適切に行うだけでAGIが実現できる」という主張が、賛否両論の論争を巻き起こした理由でした。
DeepMind社が考える報酬のフレームワークの話を進める前に、AGIがどのような状態になったら、「”人間のような”知能(インテリジェンス)」を獲得したと言えるのかについて、解説しておきましょう。
近年AI研究の場で重要視されている「知能(インテリジェンス)」は、以下の7つの要素に大別されます。
知能(インテリジェンス)の7つ要素
これらの知能を持つAGIが実現可能なのか、実現するとすればいつ頃なのか、についてはいまだ意見が分かれるところですが、多くのAI研究者は遅かれ早かれAGIは実現すると信じて研究を重ねています。その筆頭が、この論文の書き手でもあるDeepMind社のデイビッド・シルバーやリチャード・サットンです。
ちなみに、「AIは人間を超えるのか?(AGIは実現するのか?)」が議論される時、よく登場するワードが「シンギュラリティ」です。シンギュラリティ(技術的特異点)とは、
AIの活用提案から、ビジネスモデルの構築、AI開発と導入まで一貫した支援を日本企業へ提供する、石角友愛氏(CEO)が2017年に創業したシリコンバレー発のAI企業。
社名 :パロアルトインサイトLLC
設立 :2017年
所在 :米国カリフォルニア州 (シリコンバレー)
メンバー数:17名(2021年9月現在)
パロアルトインサイトHP:www.paloaltoinsight.com
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com
2010年にハーバードビジネススクールでMBAを取得したのち、シリコンバレーのグーグル本社で多数のAI関連プロジェクトをシニアストラテジストとしてリード。その後HRテック・流通系AIベンチャーを経てパロアルトインサイトをシリコンバレーで起業。東急ホテルズ&リゾーツのDXアドバイザーとして中長期DX戦略への助言を行うなど、多くの日本企業に対して最新のDX戦略提案からAI開発まで一貫したAI・DX支援を提供する。2024年より一般社団法人人工知能学会理事及び東京都AI戦略会議 専門家委員メンバーに就任。
AI人材育成のためのコンテンツ開発なども手掛け、順天堂大学大学院医学研究科データサイエンス学科客員教授(AI企業戦略)及び東京大学工学部アドバイザリー・ボードをはじめとして、京都府アート&テクノロジー・ヴィレッジ事業クリエイターを務めるなど幅広く活動している。
毎日新聞、日経xTREND、ITmediaなど大手メディアでの連載を持ち、 DXの重要性を伝える毎週配信ポッドキャスト「Level 5」のMCや、NHKラジオ第1「マイあさ!」内「マイ!Biz」コーナーにレギュラー出演中。「報道ステーション」「NHKクローズアップ現代+」などTV出演も多数。
著書に『AI時代を生き抜くということ ChatGPTとリスキリング』(日経BP)『いまこそ知りたいDX戦略』『いまこそ知りたいAIビジネス』(ディスカヴァー・トゥエンティワン)、『経験ゼロから始めるAI時代の新キャリアデザイン』(KADOKAWA)、『才能の見つけ方 天才の育て方』(文藝春秋)など多数。
実践型教育AIプログラム「AIと私」:https://www.aitowatashi.com/
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com
※石角友愛の著書一覧
毎週水曜日、アメリカの最新AI情報が満載の
ニュースレターを無料でお届け!
その他講演情報やAI導入事例紹介、
ニュースレター登録者対象の
無料オンラインセミナーのご案内などを送ります。