パロアルトインサイト/ PALO ALTO INSIGHT, LLC.

ブログBLOG

パロアルトインサイト/PALO ALTO INSIGHT, LLC. > ブログ > DI COOK氏が説くAPOPHENIA(データ妄想癖)の避け方

DI COOK氏が説くAPOPHENIA(データ妄想癖)の避け方

2018/02/13 ブログ 
by PALO ALTO INSIGHT, LLC. STAFF 

こんにちは、CTO長谷川です。

突然ですが、質問です。晴れた日の午後に芝生の上に寝そべって雲を見ながら、雲の形が他の何かに見える連想ゲームをしたことはありますか?表題のApopheniaとは、まさにそういう意味で、「特に繋がりがないのに意味もなく連想してしまう」ことをさします。ドイツ心理学者のクラウス・コンラッド氏が「統合失調症の前駆症状」という論文の中で使った言葉です。

RStudio::ConfのトップバッタースピーカーのDi Cook氏はMonash大学の統計学の教授です。彼女によると、Apopheniaは数字や図表を扱う仕事では頻繁に起きる現象です。人間は先入観に基づきデータを見る生き物なので、特にデータにトレンドがなくても、自分のバイアスを裏付ける証拠を見出そうとするため、何の相関性もない図表を見て、相関性があると錯覚してしまう危険性があります。

このApopheniaを避けるための手法を二つ紹介してくれました。[1]


Photo: Gramercy Pictures; Courtesy Everett Collection

他にも統計におけるTidy Data[2]の重要性や、p値に頼り過ぎることの危険性など、面白い統計話をしていました。Tidy DataはRStudioカンファレンスの重要なテーマの一つだったので、定義を記述しておきます。

・各変数が列になっていること
・各事象が行になっていること
・セルが値になっていること

上記の3つの条件を満たすことがTidy Dataの前提で、このような形になっていることが後のデータ分析やモデル化を簡単にします。

・[1] http://www.dicook.org/files/rstudio/#41
・Wickham H (2014), “Tidy Data” Journal of Statistical Software

BACK TO BLOG

NEWSLETTERニュースレター

ブログ記事を最後まで読んでいただき、
ありがとうございます。
弊社ニュースレターにご登録いただくと、
このブログの最新記事や、
シリコンバレーの最新AI事情、
お得なキャンペーン情報について
お知らせいたします。
また、アップルやアマゾンなどで
経営陣が実施しているデータ会議の
回し方が分かる早見表を
無料でダウンロードできる
リンクもお送りします。

PAGE TOP