統計思考の世界


[tag: book]

三中信宏「統計思考の世界」を読んだ。

統計的手法というのは、人間がすべてを理由付けによって 把握するにはあまりに大量なデータを、何とか理由を保持 しながら扱うためのものだと思う。
An At a NOA 2017-05-05 “統計

大量のバラバラなデータのうち、それとなく揃っている 部分を一つの塊とみなすことで、データサイズが小さく なり、データ処理にかかるコストは減少する。
これはデータ圧縮の過程である。
適切な圧縮ができれば処理能力の向上につながる一方で、 不適切な圧縮をしてしまえば処理自体が破綻する。
処理の破綻を可能な限り免れ続けるには、データの変化 に合わせて圧縮方法の適切性を常に検証し、必要に応じて 別の圧縮方法を試し続ける他ない。

この一連の試行錯誤はつまり「何をsignとするか」 についての試行錯誤である。
人間というのは、何かを見たり聞いたりする知覚の レベルでの「自然な」signだけでなく、言語、宗教、 科学など、様々なかたちで結実している「不自然な =人工の」signによる圧縮を、半ば投機的に試みる ことで、他の存在に対する相対的な処理能力を向上 させてきたのだと思われる。
その様を伊藤計劃は「人間は無意味に耐えられない」 と表現した。

不用意に行われればバグのようなものになるであろう 投機的な圧縮に、「理由」を付けることで暫定的な 適切性の検証とし、その成功率を上げるというのが、 思考や意識と呼ばれるものの特徴なのだと思う。
統計学は、「これをsignにすることができる」という 意味でのsignificanceに理由を与える試みである点で、 まさに意識的な分野である。

そのまま把握するにはあまりに膨大なデータである 世界というものを「理解=理由付けて圧縮」するに あたり、数式もグラフも駆使しながら、どのように して圧縮や理由付けできるのか、あるいはすべきか について試行錯誤するプロセスである統計思考。
その面白さの伝わってくる本であった。