アメリカ最新AI情報満載!セミナーや講演情報など交えて毎週水曜配信 無料ニュースレター 下記へメールアドレスを入力し無料で登録
CLOSE
パロアルトインサイト/ PALO ALTO INSIGHT, LLC.
ブログBLOG
パロアルトインサイト/PALO ALTO INSIGHT, LLC. > ブログ > Microsoftの音声合成AIモデル「VALL-E」の可能性
Microsoftの音声合成AIモデル「VALL-E」の可能性
2023/02/01 ブログ, The Insight 
by suzuki 

Microsoftの音声合成AIモデル「VALL-E」の可能性

たった3秒の音声サンプルで人の声を再現

今週のテーマ:技術開発

ChatGPTのような生成AIが、学生や主婦など、より一般の層にも浸透してきていますね。今回は、Microsoftが発表した革新的な音声合成AIをご紹介します。このAIモデルは、たった3秒の音声データサンプルを読み込ませるだけで、指定したテキストプロンプトをサンプルと同じ声色で読み上げることができるというもので、注目を集めています。

💡この記事から得られる3つのナレッジ
・Microsoftの最新の音声合成AIモデル「VALL-E」
・開発の背景にあるMeta社のAI技術
・音声合成AIが抱える懸念と、応用可能性

📖 この記事に登場する技術キーワード
・GenerativeAI(生成AI)
 関連記事Microsoft社の画像生成AIにのみ備わった新たな技術」
 関連記事Metaの動画生成AI「Make-A-Video」とは
・データ圧縮技術
 関連記事BERT(自然言語処理)の学習時間を削減する「モデル圧縮」とは」
 関連記事DeepMindのAI「AlphaTensor」の凄さとは」

目次

Microsoftが発表したAIモデル「VALL-E」とは

開発の背景にあるMeta AIが開発した2つの技術

音声合成AIが抱える懸念点と応用性


 

Microsoftが発表したAIモデル「VALL-E」とは

2023年1月上旬、Microsoftの研究者チームが、VALL-Eと呼ばれる音声合成AIモデルを発表しました。このモデルは、たった3秒間の音声サンプルを与えるだけで、サンプルの人間の声を精密に再現することが可能になるといいます。一度音声サンプルの声を学習したVALL-Eは、その人物が何かを話しているように音声を合成し、話者の感情的なトーンや、アクセントの類似性、音響環境(たとえば、携帯電話の通話に圧縮された声)さえも維持できるといいます。

この技術は、高品質のテキスト読み上げアプリケーションへの応用や、人が録音した声を後から編集して発言を変更するといった音声編集に使用できるとされています。またChatGPTなど、他のジェネレーティブAIモデルと組み合わせて、全く新しいオーディオコンテンツを作成することも考えられます。

https://valle-demo.github.io/ より画像引用、VALL-Eの生成の流れ

 

開発の背景にあるのは、Meta AIが開発した2つの技術

https://www.paloaltoinsight.com/membership-checkout/?level=4
https://www.paloaltoinsight.com/membership-checkout/?level=4

 PAIoneerPRO会員に登録 ▷ 
PAIoneer PRO
詳細はこちら

 会員の方はログイン▷ 

パロアルトインサイトについて

AIの活用提案から、ビジネスモデルの構築、AI開発と導入まで一貫した支援を日本企業へ提供する、石角友愛氏(CEO)が2017年に創業したシリコンバレー発のAI企業。

社名 :パロアルトインサイトLLC
設立 :2017年
所在 :米国カリフォルニア州 (シリコンバレー)
メンバー数:17名(2021年9月現在)

パロアルトインサイトHP:www.paloaltoinsight.com
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

石角友愛
<CEO 石角友愛(いしずみともえ)>

2010年にハーバードビジネススクールでMBAを取得したのち、シリコンバレーのグーグル本社で多数のAI関連プロジェクトをシニアストラテジストとしてリード。その後HRテック・流通系AIベンチャーを経てパロアルトインサイトをシリコンバレーで起業。データサイエンティストのネットワークを構築し、日本企業に対して最新のAI戦略提案からAI開発まで一貫したAI支援を提供。東急ホテルズ&リゾーツ株式会社が擁する3名のDXアドバイザーの一員として中長期DX戦略について助言を行う。

AI人材育成のためのコンテンツ開発なども手掛け、順天堂大学大学院医学研究科データサイエンス学科客員教授(AI企業戦略)及び東京大学工学部アドバイザリー・ボードをはじめとして、京都府アート&テクノロジー・ヴィレッジ事業クリエイターを務めるなど幅広く活動している。

毎日新聞、日経xTREND、ITmediaなど大手メディアでの連載を持ち、 DXの重要性を伝える毎週配信ポッドキャスト「Level 5」のMCや、NHKラジオ第1「マイあさ!」内「マイ!Biz」コーナーにレギュラー出演中。「報道ステーション」「NHKクローズアップ現代+」などTV出演も多数。

著書に『AI時代を生き抜くということ ChatGPTとリスキリング』(日経BP)『いまこそ知りたいDX戦略』『いまこそ知りたいAIビジネス』(ディスカヴァー・トゥエンティワン)、『経験ゼロから始めるAI時代の新キャリアデザイン』(KADOKAWA)、『才能の見つけ方 天才の育て方』(文藝春秋)など多数。

実践型教育AIプログラム「AIと私」:https://www.aitowatashi.com/
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

 

※石角友愛の著書一覧

NEWSLETTERパロアルトインサイトの
無料ニュースレター

毎週水曜日、アメリカの最新AI情報が満載の
ニュースレターを無料でお届け!
その他講演情報やAI導入事例紹介、
ニュースレター登録者対象の
無料オンラインセミナーのご案内などを送ります。

BACK TO BLOG
« »
PAGE TOP