私は、とある企業で「なんちゃってデータサイエンティスト」を生業にしています。
この、
「なんちゃってデータサイエンティスト」
から
「普通のデータサイエンティスト」
に昇格するために日々勉強を続けています。
その勉強の一環で、「完全独習 統計学入門」を読んでみたので、感想を記します。
結論、
統計学をこれから勉強する人で、数式が苦手な人は、
ほかの本を買う前に「完全独習 統計学入門」を買うことをおススメします。
「完全独習 統計学入門」を読んだきっかけ
「普通のデータサイエンティスト」に昇格するために色々なところから情報を集めています。
その中で、
「データサイエンティストになるんだったら統計検定2級レベルの統計学は必須」
というお言葉を頂きました。
こういう、勉強の成果が資格とか検定とかの形に残ると、勉強がはかどるタイプの筆者。
迷わず統計検定2級の公式参考書を購入しました。
しかし、この「統計学基礎」は統計学初心者にはとても難しい。。。
一応理数系の学部を卒業し、大手製造業の会社でエンジニアとして働いている筆者。
普通の人よりは数学ができるという自負がありますが、「統計学基礎」は理解に苦しみました。
なので、統計学をきちんと学んでいない方がいきなり「統計学基礎」を読むのはおススメしません。
私はここで挫折しかかりましたが、「統計学基礎」での勉強をいったん諦め、
もう少し丁寧に説明してくれる参考書を探すことにしました。
そして、たどり着いたのが「完全独習 統計学入門」でした。
「完全独習 統計学入門」の良いところ
「完全独習 統計学入門」は、
小難しい数式や分布をなぜ使うのか、というストーリーを丁寧に説明してくれます。
例えば、一般の人はまず使うことはないであろう「カイ二乗分布」について。
「統計学基礎」では
確率変数\(Z_1\)、\(Z_2\)、\(Z_3\)が互いに独立に標準正規分布N(0,1)に従うとき
$$W = Z_1^2 + Z_2^2 + + Z_n^2$$
の従う分布を自由度nのカイ二乗分布と呼び、記号\(χ^2(n)\)を用いて表す。
と説明されています。
これ、読んでも意味わかりませんよね。カイ二乗分布がどんな場面で使われるかの説明がありません。
一方、「完全独習 統計学入門」では
標準正規母集団からデータをn個観測して、それらのデータを2乗して加えたWという統計量を作ると、Wの分布は自由度nのカイ二乗分布になる。
分布を得られることで、ある範囲を指定してその範囲にWが入る、という予言を95%の確立で的中させることが可能になる。
と、記載されています。
カイ二乗分布は未知の値を予言する際に使う分布なのです。
「統計学基礎」には、この辺りの説明が一切なく、いきなりカイ二乗分布の数式が出てくるので読者は混乱してしまいます。
まとめ
「完全独習 統計学入門」を読んだ感想を記しました。
統計の小難しい数式や分布はなぜ必要なのか
がわかりやすく説明されているので、統計学の入門者にはとってもおススメできる書籍です。
また、今回は「完全独習 統計学入門」の引き立て役になってしまった「統計学基礎」(笑)
内容的には前者よりも詳細なところまで記載されていると思いますので、
ある程度の統計学の基礎がある人や数式に強い人はいきなり「統計学基礎」を購入しても良いかと思います。
私も「統計学基礎」を理解できるレベルになりたいですね。
まずは統計検定2級の合格を目指します!
2019.03.09追記
勉強の甲斐あり統計検定2級に合格しました!!

以上!
コメント