アメリカ最新AI情報満載!セミナーや講演情報など交えて毎週水曜配信 無料ニュースレター 下記へメールアドレスを入力し無料で登録
CLOSE
パロアルトインサイト/ PALO ALTO INSIGHT, LLC.
ブログBLOG
パロアルトインサイト/PALO ALTO INSIGHT, LLC. > ブログ > Google「Gemini」が与えた衝撃 ネイティブなマルチモーダルの次世代AI
Google「Gemini」が与えた衝撃 ネイティブなマルチモーダルの次世代AI
2024/01/31 ブログ, PAIoneer PRO, The Insight 
by suzuki 

Google「Gemini」が与えた衝撃
ネイティブなマルチモーダルの次世代AI

今週のテーマ:技術開発

今回は、Googleが開発した「Gemini: A Family of Highly Capable Multimodal Models」という論文で紹介された「Gemini(ジェミニ)」について紹介します。論文で紹介されたGeminiモデルは、マルチモーダルAIの分野において革新的な飛躍を遂げており、能力は多くのベンチマークで最先端の結果を大幅に上回ったということで話題になりました。複雑な画像を解析し、画像、音声、テキストのシーケンスを組み合わせて推論する能力を持ち、テキストと画像を応答として生成するこの機能は、教育、問題解決、多言語コミュニケーション、情報の要約や抽出、さらには創造性への応用が期待されています。

💡 この記事から得られる3つのナレッジ

論文

今回のディスカッション対象の論文をご紹介します。
タイトル:Gemini: A Family of Highly Capable Multimodal Models
著者:Gemini Team, Google
URL:https://arxiv.org/pdf/2312.11805.pdf

目次

Geminiとは何か?
パフォーマンス性能について
Googleの責任あるAIとGemini
おわりに


Geminiとは?用途と適応性について

Geminiは、*マルチモーダルAIの大きな飛躍を示しています。このモデルは、ネイティブなマルチモーダルモデルであり、テキスト、画像、音声、ビデオデータなど幅広いデータソースで学習されています。このユニークなアプローチにより、Geminiは、多様なモダリティからの情報を処理し理解する能力を備えており、従来のモデルでは実現できなかった幅広いタスクの実行が可能になっています。

*マルチモーダル(Multi-Modal)とは、「複数種類の入力情報を利用する」という意味です。マルチモーダルについてはThe Insight の記事「メタ学習とマルチモーダル:AIを人間に近づける挑戦」でも詳しく解説しています。

Geminiは、Ultra、Pro、Nanoの3つのサイズで構成されており、それぞれが異なる計算限界と要件に対応しています。Ultraでは、高度に複雑なタスクに向いており、Proは拡張されたパフォーマンスとスケールでの展開性に、Nanoではデバイスアプリケーション向けに最適化されています。このように、様々なサイズで構成されるGeminiは、複雑な推論タスクからメモリに制約があるオンデバイスのユースケースに至るまで、幅広いアプリケーションに適した運用が可能になります。この多用途性と適応性により、Geminiは言語理解からコーディング、推論、マルチモーダルなタスクに至るまで、サイズに応じた顕著な能力を発揮します。

マルチモーダルタスクに対応するパフォーマンス性能

https://www.paloaltoinsight.com/membership-checkout/?level=4
https://www.paloaltoinsight.com/membership-checkout/?level=4

 PAIoneerPRO会員に登録 ▷ 
PAIoneer PRO
詳細はこちら

 会員の方はログイン▷ 

パロアルトインサイトについて

AIの活用提案から、ビジネスモデルの構築、AI開発と導入まで一貫した支援を日本企業へ提供する、石角友愛氏(CEO)が2017年に創業したシリコンバレー発のAI企業。

社名 :パロアルトインサイトLLC
設立 :2017年
所在 :米国カリフォルニア州 (シリコンバレー)
メンバー数:17名(2021年9月現在)

パロアルトインサイトHP:www.paloaltoinsight.com
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

石角友愛
<CEO 石角友愛(いしずみともえ)>

2010年にハーバードビジネススクールでMBAを取得したのち、シリコンバレーのグーグル本社で多数のAI関連プロジェクトをシニアストラテジストとしてリード。その後HRテック・流通系AIベンチャーを経てパロアルトインサイトをシリコンバレーで起業。データサイエンティストのネットワークを構築し、日本企業に対して最新のAI戦略提案からAI開発まで一貫したAI支援を提供。東急ホテルズ&リゾーツ株式会社が擁する3名のDXアドバイザーの一員として中長期DX戦略について助言を行う。

AI人材育成のためのコンテンツ開発なども手掛け、順天堂大学大学院医学研究科データサイエンス学科客員教授(AI企業戦略)及び東京大学工学部アドバイザリー・ボードをはじめとして、京都府アート&テクノロジー・ヴィレッジ事業クリエイターを務めるなど幅広く活動している。

毎日新聞、日経xTREND、ITmediaなど大手メディアでの連載を持ち、 DXの重要性を伝える毎週配信ポッドキャスト「Level 5」のMCや、NHKラジオ第1「マイあさ!」内「マイ!Biz」コーナーにレギュラー出演中。「報道ステーション」「NHKクローズアップ現代+」などTV出演も多数。

著書に『AI時代を生き抜くということ ChatGPTとリスキリング』(日経BP)『いまこそ知りたいDX戦略』『いまこそ知りたいAIビジネス』(ディスカヴァー・トゥエンティワン)、『経験ゼロから始めるAI時代の新キャリアデザイン』(KADOKAWA)、『才能の見つけ方 天才の育て方』(文藝春秋)など多数。

実践型教育AIプログラム「AIと私」:https://www.aitowatashi.com/
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

 

※石角友愛の著書一覧

NEWSLETTERパロアルトインサイトの
無料ニュースレター

毎週水曜日、アメリカの最新AI情報が満載の
ニュースレターを無料でお届け!
その他講演情報やAI導入事例紹介、
ニュースレター登録者対象の
無料オンラインセミナーのご案内などを送ります。

BACK TO BLOG
« »
PAGE TOP