アメリカ最新AI情報満載!セミナーや講演情報など交えて毎週水曜配信 無料ニュースレター 下記へメールアドレスを入力し無料で登録
CLOSE
パロアルトインサイト/ PALO ALTO INSIGHT, LLC.

メディア掲載実績MEDIA ACHIEVEMENTS

パロアルトインサイト/PALO ALTO INSIGHT, LLC. > メディア掲載実績 > ビジネスインサイダー寄稿記事 掲載「なぜ日本企業はビッグデータ集めなきゃいけない病にかかるのか?」

ビジネスインサイダー寄稿記事 掲載「なぜ日本企業はビッグデータ集めなきゃいけない病にかかるのか?」

2018/05/02 メディア掲載実績 
by PALO ALTO INSIGHT, LLC. STAFF 

なぜ日本企業は「ビッグデータ集めなきゃいけない病」にかかるのか?

Shutterstock

私は、シリコンバレーに拠点をもつAIビジネスデザインカンパニー、パロアルトインサイトのCEOとして、過去50社以上の日本企業にAI技術活用に関するアドバイスや導入をしてきました。

業界特化型のAIソリューションを提供する会社ではなく、業界横断的に企業のニーズを見て、それに対してAI技術を駆使した解決策を提案、実装してきた中で見えてきたことがあります。

それは、多くの日本企業、それも超一流の会社ばかりが、「データ集めなきゃいけない病」にかかっているということです。

大企業に蔓延する「データ集めなきゃいけない病」とは?

Shutterstock

弊社のクライアント企業の経営陣は、よく以下のような質問を投げかけて来ます。

•集められるデータを集められるだけ収集しないと、AI活用できないのか?

•分析するのは「ビッグデータ」じゃないといけないのか?

•どれだけの容量のデータが集まれば、「解析するのに十分だ」と言えるのか?

データが十分に集まっているだけでは、ゴールにたどり着けません。それを考えるきっかけとなる例が、少し前にみつけたこの記事にありました。

IoTで取得できるようになった健康データの量と、アメリカ人の肥満率レベルをまとめたものです。

関連記事:Does More Data Really Lead To Better Decision Making?(Forbes)

記事が投げかける疑問は端的でユニークです。

IoTデバイスやウェラブルが溢れたことで、消費者は毎朝、コネクテッド体重計から体重や体脂肪率を記録できるようになり、ウェラブルデバイスで心拍数や血中酸素濃度を数秒ごとにモニタリングし、消費カロリーも計算できるようになりました。それなのに、何故アメリカでは肥満率が減少しないのか? しかも「23andMe」のような遺伝子解析サービスを使えば、自分の遺伝的な属性データまで見えるようになったのに、です。

アメリカ人口の肥満率は現在約37%。2030年には50%(2人に1人が肥満)になると予測されています。データが集まったからといってゴールではなく、 データを解析して示唆に落とし込む能力がなければ、そしてその示唆を使って問題解決までやりぬく意思、そこまでのメカニズム作りをするコミットメントがなければ、結果につながらないことを表しています。

Dr. MercolaのWebサイトより。CDCのデータを基に、ロバート・ウッド・ジョンソン財団らの予測をマッピングしたもの。

データ集めは最初の0.8歩に過ぎない

Shutterstock

同じことが企業のAI活用プロジェクトにも言えます。例えば、弊社に相談に来るクライアント企業の中には、「まだこれくらいしかデータが溜まっておらず、見てもらうには不十分ではないかと思っている」というような懸念を抱いている企業もあります。でも、その後実際に手元にあるデータを見てみると、既に面白い解析ができることがわかりました(そういうケースは少なくありません)。

ここで大事なのは、データ集めは非常に大事なステップですが、最初の0.8歩に過ぎないということです。データ解析やAI技術導入の準備に時間をかけすぎていて、「やっとビッグデータが溜まった」と思ったときにデータサイエンティストに大量のデータを丸投げする、というプロセスは非効率的なのです。

それよりも、最初の段階からデータサイエンティストを交えて、ゴールを志向しながら逆算的アプローチでデータを収集、解析した方が良い結果が確実に出ます。

以前、 ビッグデータを保有している企業のデータを拝見したのですが、その7割ほどがゴール(データを使って新しい収益モデルを生み出したい)到達のためには使えないデータでした。そして残りの3割の有益なデータも、ラベル付けがされていない等の理由からすぐには解析して示唆にできる状態ではありませんでした。

こうなる前に、まず、どんなデータを集めるべきか、どんなラベル付けをすべきか、というところをデータサイエンティストと話しながらデータ収集をした方がよほど効率的なのです。

「ビッグデータじゃないと意味がない」は思い込み

Shutterstock

「ビッグデータでなければいけないのか」

この質問も度々企業から投げかけられますが、答えはNOです。

そもそもビッグデータを持ち合わせている会社は多くありません。むしろスモールデータから何が見えるかという分析手法の方が、ノイズが少なくて早く結果が出ると言う声もあります。

データ容量が多いことにこしたことがないケースも多くありますが、全てにおいてそうではないのです。画像認識などで使われるディープラーニング(深層学習)のようなビッグデータが必要と思われている技術でも、同じことが言えます。Google Brain TeamのAI研究者であり オープンソースのニューラルネットワークlibraryの「Keras」を開発したFrançois Chollet氏も自身の著書『Deep Learning with Python』で、シンプルなモデルでタスクが簡単な場合は、数百行のデータでも十分な場合も多くある、と言っています。

また、Deep Learningのモデルは再利用可能かつ無料で公開されているものが多く、ImageNetなどのデータセットを元にトーレニングされた*ニューラルネットワークから学習を開始することができるので、その場合は自分でゼロからビッグデータを集める必要がない、と語っています(出典:「Deep Learning with Python by François Chollet」のP.130より) 。

ニューラルネットワークとは:脳内の神経回路網を模してつくられた数学モデルのこと。

AI採用を検討している企業が注意すべきこととは

ハーバードビジネスレビューの記事。
出典:ハーバードビジネスレビュー「Research: How Subtle Class Cues Can Backfire on Your Resume」

また、データが多いことで生まれてしまうバイアスのリスクも忘れてはいけません。ハーバードビジネスレビューが以前行った研究でこういうものがあります。

この研究では、300以上の偽物の願書をトップ級の大手法律事務所に送って、どの願書が面接のお誘いがかかるかを見ました。全ての願書はトップ1%の成績優秀者のもので、本当の情報が記載されていましたが、求職者の名前、大学時代に所属していた部活や趣味を変えてあります。

意図的に、そのような付属的な情報から、求職者の社会的なレベルや性別が採用側に推測できるようにしたわけです(アメリカでは性別や社会的レベルなどによる採用差別は違法とされるため、通常履歴書や面接でもそのような情報は求職者は開示しません)。

結果、大手法律事務所から面接のお誘いが一番届いたのは、富裕層に属する男性(16%の面接招待率)と思われるものでした。同じように富裕層に属する女性と推測された願書はその4分の1ほどの面接招待率でした(3.8%)。そして、低所得層に属する男性と推測された願書の面接招待率は、たった1%、低所得層に属する女性と推測された願書の面接招待率は、6%だったのです。

出典:ハーバードビジネスレビュー「Research: How Subtle Class Cues Can Backfire on Your Resume」

これで分かったことは、大学時代の部活動や趣味のデータから、その人の社会的レベルを採用側が推測し、バイアスのかかった判断をしてしまっていたということです。例えば、趣味や大学時代の部活がポロ、セイリング、クラシック音楽などと記述されていれば富裕層と判断。逆にトラック&フィールド競技やピックアップサッカー(誰でも参加できるサッカー)をやっていて、趣味がカントリーミュージックなどと記載されていれば低所得層と判断され、面接のお声がけがかからない、というわけです。

よく、採用プロセスでAIを導入するという声を聞きますが、もし上記のようなバイアスのかかった採用基準を元にAI予測モデルを作ってしまったら、同じような差別主義の採用しかできなくなります。この研究で分かったことは、求職者は余計なデータを企業側に与えすぎると、採用に不利になることがあるということです。

AI技術活用を考えている企業が今、すべきことは闇雲なデータ集めではないのです。

確かに、データは21世紀の石油、データは金、それが当てはまるケースも多くあります。しかし、必ずしもAI活用においてビッグデータを持つことが一番大事なこととは限りません。それよりも、腕のよいデータサイエンティストがつくるアルゴリズムや、目的志向のAI活用、良質なデータを収集することの方がゴール到達のためには大事なのです。

データを集めてから相談する、ではなく、データがない時から優秀なデータサイエンティストに相談をして、データ集めの効率的な方法をデザインする、それこそがAI技術活用の近道だと私は考えています。

パロアルトの風景。
Shutterstock

パロアルトインサイトについて

AIの活用提案から、ビジネスモデルの構築、AI開発と導入まで一貫した支援を日本企業へ提供する、石角友愛氏(CEO)が2017年に創業したシリコンバレー発のAI企業。

社名 :パロアルトインサイトLLC
設立 :2017年
所在 :米国カリフォルニア州 (シリコンバレー)
メンバー数:17名(2021年9月現在)

石角友愛
<CEO 石角友愛(いしずみともえ)>

2010年にハーバードビジネススクールでMBAを取得したのち、シリコンバレーのグーグル本社で多数のAI関連プロジェクトをシニアストラテジストとしてリード。その後HRテック・流通系AIベンチャーを経てパロアルトインサイトをシリコンバレーで起業。データサイエンティストのネットワークを構築し、日本企業に対して最新のAI戦略提案からAI開発まで一貫したAI支援を提供。AI人材育成のためのコンテンツ開発なども手掛け、順天堂大学大学院医学研究科データサイエンス学科客員教授(AI企業戦略)及び東京大学工学部アドバイザリー・ボードをはじめとして、京都府アート&テクノロジー・ヴィレッジ事業クリエイターを務めるなど幅広く活動している。また、毎日新聞「石角友愛のシリコンバレー通信」、ITメディア「石角友愛とめぐる、米国リテール最前線」など大手メディアでの寄稿連載を多く持ち、最新のIT業界に関する情報を発信している。「報道ステーション」「NHKクローズアップ現代+」などTV出演も多数。

著書に『いまこそ知りたいDX戦略』『いまこそ知りたいAIビジネス』(ディスカヴァー・トゥエンティワン)、『経験ゼロから始めるAI時代の新キャリアデザイン』(KADOKAWA)、『才能の見つけ方 天才の育て方』(文藝春秋)など多数。

パロアルトインサイトHP:www.paloaltoinsight.com
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com
※石角友愛の著書一覧

NEWSLETTERパロアルトインサイトの
無料ニュースレター

毎週水曜日、アメリカの最新AI情報が満載の
ニュースレターを無料でお届け!
その他講演情報やAI導入事例紹介、
ニュースレター登録者対象の
無料オンラインセミナーのご案内などを送ります。

BACK TO MEDIA
« »
PAGE TOP