データサイエンティストとは

こんにちは。パロアルトインサイト、データサイエンティストの辻です。

日々お客様とお話をさせていただく際に、データサイエンティストとはどのようなお仕事なのですか?という質問をよくいただくので、今日はデータサイエンティストについてお話ししたいと思います。

データサイエンティストとは2008年にCloudera社の共同創始者Jeff Hammerbacher氏らによって提唱された比較的新しい職種で、日本での認知度は業界によって異なるようです。日本データサイエンティスト協会は「データサイエンティストとは、データサイエンス力、データエンジニアリング力を ベースにデータから価値を創出し、ビジネス課題に答えを出すプロフェッショナル」 と定義しています。わかりやすく言うと統計学やプログラミング(主に機械学習)などを活用して、データから事業戦略につながるようなアイデアを生み出し、実現するという仕事です。

では実際にどのような知識や技術がデータサイエンティストには求められるのでしょうか? 下の表では、データアナリストとデータサイエンティストの対比をしてみました。両職業ともに数学・統計学を活用して企業価値を向上するアイデアなどを提案します。データアナリストは、構造が整っているデータを分析して改善点などを見つけるのが主な業務です。それに対しデータサイエンティストは、お客様とビジネスの課題について話し合い、機械学習を導入するためのデータ構造を設計し、それを実装します。それにより、新たなデータ利用の手法やビジネス展開をお手伝いしてします。表にあるオレンジ色の項目がデータサイエンティストとしての付加価値の部分となります。

 図1:データアナリストとデータサイエンティストの比較

図1:データアナリストとデータサイエンティストの比較

この表について研究開発系のデータサイエンティストの方の中には、データベースのエンジニアリング、ソフトウェアエンジニアリングの必要性について異なる見解をお持ちの方も思われます。しかしながら、ビジネス案件を扱う場合、実際にお客様とデータ活用・運用方法などのお話をすると、必ずこの2つのポイントも課題の中に上がってきます。例えば、いくら精度の高いアルゴリズムが開発できたとしても、予測値を出すまでの時間、お客様のオペーレーションにどのようにモデルを組み込むかなど、運用上の条件も満たすことができないとビジネスの問題は解決できないからです。

このように、データサイエンティストの業務は非常に多岐に渡り、多くのエリアの知識を必要とします。大手企業はこれらの人材を自社で確保できるかもしれませんが、日本ではまだ人材も少なく、新しい分野でもあるためアウトソースをしながら共同で機械学習を導入されるアプローチが良いのではないかと思います。少しでもデータサイエンスにご興味のある方は弊社までご連絡ください。次回は機械学習に関してもう少し詳しく触れてみたいと思います。

参照: