アメリカ最新AI情報満載!セミナーや講演情報など交えて毎週水曜配信 無料ニュースレター 下記へメールアドレスを入力し無料で登録
CLOSE
パロアルトインサイト/ PALO ALTO INSIGHT, LLC.
ブログBLOG
パロアルトインサイト/PALO ALTO INSIGHT, LLC. > ブログ > Googleの最新画像生成AI「Imagen」はDALL·E 2を超えるのか
Googleの最新画像生成AI「Imagen」はDALL·E 2を超えるのか
2022/06/08 ブログ, The Insight 
by kohei 

Googleの最新画像生成AI「Imagen」はDALL·E 2を超えるのか

2022年5月23日に発表されたデジタルアート生成最新技術

今週のテーマ:技術開発

パロアルトインサイトの石角です。先月にはOpenAIの「DALL·E 2」を紹介しました。創造性を持っているかのようなアートを生み出す技術は多くの人を驚かせましたが、Googleがそれに対抗するかのようなAI「Imagen」をさっそく発表し、話題となっています。DALL·E 2を超えたとされる最新AIについて解説します。

(Sample images from Google’s Imagen)

シリコンバレーから現役データサイエンティストのインサイトをお届けする「The Insight」。今回取り上げるのは、2022年5月にGoogleが発表した画像生成AI「Imagen」です。

?この記事から得られる3つのナレッジ

・Imagenはどんな画像を作り出せるのか
・Imagenの画像生成プロセス
・DALL·E 2と異なる点は何か

論文データ:

今回のディスカッション対象の論文をご紹介します。

タイトル:Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding
著者:Chitwan Saharia et al.
掲載サイト:arXiv
発行日:2022年5月23日
引用数:
URL:https://arxiv.org/abs/2205.11487

?この論文を選んだポイント

AIによる画像生成というホットな分野で成果を出し、新しい評価方法を提案した論文であるため。

?この記事に登場する技術キーワード

 

目次

Imagenが生成する画像と重要な発見

Imagen の画像生成プロセス

ImagenがDALL·E 2と異なる点

新たな評価手法「DrawBench」

AIビジネスデザイナーのワンポイントアドバイス


Imagenが生成する画像と重要な発見

Googleが発表した「Imagen」は、与えられた文章から画像を生成するAIです。その特徴を紹介します。

Imagenが生成する画像の例

Googleは論文を公表したのと同時期に、Imagenの公式サイトを公開しました。Imagenがどのような画像を作り出せるのか、与える文章を変更しながらユーザーが試せるようになっています。

例えば、こちらの文章を指示することで、Imagenは以下の画像を生成します。

  • 写真
  • ペルシャ猫
  • サングラスと
  • 赤いシャツを身につけている
  • ギターを弾いている
  • ビーチで

(画像引用:https://imagen.research.google

そして、少し条件を変えるだけで、Imagenは以下のようにまったく異なる画像を生成するのです。

  • 油絵
  • ペルシャ猫
  • カウボーイハットと
  • 赤いシャツを身につけている
  • ギターを弾いている
  • ビーチで

(画像引用:https://imagen.research.google

Imagenがどのような画像を生成できるのか、ぜひ公式サイトをチェックしてみてください。

ごく短い文章から多彩な画像を作り出すことから、まるでImagenが「創造性」を持っているかのように感じられるでしょう。

重要な発見:文章のみでの事前学習が有効

本研究には、肝となる重要な発見があります。それは大量の「文章のみ」のデータで事前学習した大規模言語モデルの利用が、画像生成に非常に有効であることを示したことです。

従来の研究では、AIモデルの学習には「画像と文章の組み合わせ」のデータこそが重要であると考えられていました。

しかし、実際に検証したところ、学習データとして「文章のみ」を増やす方が「画像と文章の組み合わせ」を増やすよりも、ずっと効果的だったのです。

「文章のみ」のデータの方が、「画像と文章の組み合わせ」よりも大量に集めるのは容易です。そのため、この発見は画像生成AIの進化を早めると期待されています。

Imagen の画像生成プロセス

Imagenはどのような仕組みで、創造的な画像を生成しているのでしょうか。そのプロセスを解説します。

https://www.paloaltoinsight.com/membership-checkout/?level=4
https://www.paloaltoinsight.com/membership-checkout/?level=4

 PAIoneerPRO会員に登録 ▷ 
PAIoneer PRO
詳細はこちら

 会員の方はログイン▷ 

パロアルトインサイトについて

AIの活用提案から、ビジネスモデルの構築、AI開発と導入まで一貫した支援を日本企業へ提供する、石角友愛氏(CEO)が2017年に創業したシリコンバレー発のAI企業。

社名 :パロアルトインサイトLLC
設立 :2017年
所在 :米国カリフォルニア州 (シリコンバレー)
メンバー数:17名(2021年9月現在)

パロアルトインサイトHP:www.paloaltoinsight.com
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

石角友愛
<CEO 石角友愛(いしずみともえ)>

2010年にハーバードビジネススクールでMBAを取得したのち、シリコンバレーのグーグル本社で多数のAI関連プロジェクトをシニアストラテジストとしてリード。その後HRテック・流通系AIベンチャーを経てパロアルトインサイトをシリコンバレーで起業。データサイエンティストのネットワークを構築し、日本企業に対して最新のAI戦略提案からAI開発まで一貫したAI支援を提供。東急ホテルズ&リゾーツ株式会社が擁する3名のDXアドバイザーの一員として中長期DX戦略について助言を行う。

AI人材育成のためのコンテンツ開発なども手掛け、順天堂大学大学院医学研究科データサイエンス学科客員教授(AI企業戦略)及び東京大学工学部アドバイザリー・ボードをはじめとして、京都府アート&テクノロジー・ヴィレッジ事業クリエイターを務めるなど幅広く活動している。

毎日新聞、日経xTREND、ITmediaなど大手メディアでの連載を持ち、 DXの重要性を伝える毎週配信ポッドキャスト「Level 5」のMCや、NHKラジオ第1「マイあさ!」内「マイ!Biz」コーナーにレギュラー出演中。「報道ステーション」「NHKクローズアップ現代+」などTV出演も多数。

著書に『AI時代を生き抜くということ ChatGPTとリスキリング』(日経BP)『いまこそ知りたいDX戦略』『いまこそ知りたいAIビジネス』(ディスカヴァー・トゥエンティワン)、『経験ゼロから始めるAI時代の新キャリアデザイン』(KADOKAWA)、『才能の見つけ方 天才の育て方』(文藝春秋)など多数。

実践型教育AIプログラム「AIと私」:https://www.aitowatashi.com/
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

 

※石角友愛の著書一覧

NEWSLETTERパロアルトインサイトの
無料ニュースレター

毎週水曜日、アメリカの最新AI情報が満載の
ニュースレターを無料でお届け!
その他講演情報やAI導入事例紹介、
ニュースレター登録者対象の
無料オンラインセミナーのご案内などを送ります。

BACK TO BLOG
« »
PAGE TOP