伝説のベイジアン先生にベイズの基礎を教えてもらえる「図解・ベイズ統計「超」入門」を読んだ
「図解・ベイズ統計「超」入門 あいまいなデータから未来を予測する技術」という本を読んだ。
社会人のアヤとケンが社内研修で伝説のベイジアン先生からベイズの基礎を教わる、という設定の会話形式でベイズについて書かれた入門書。社内研修でベイズのプロから指導を受けるとかどんだけ恵まれてるんだ。
アヤさんは大学で統計をやったが数学は詳しくないという設定。ただ時々鋭い質問をする。また統計に詳しいイケメン兄がいる。
ケンくんは知識は全くなく最後まで「わかりません」を連発する。彼女持ちのリア充。
伝説のベイジアン先生は社内研修の講師。ベイズの基礎を豊富な具体例で教えてくれるまじぱない先生。あまりにもいけてるので数カ月後に転職しそうな感じ。
内容は1章が導入、2章が同時確率・条件付き確率、3章がベイズの定理、4章がベイズの定理を用いた事後確率計算の具体例、5章が事例の追加による事前確率の更新(具体例としてナイーブベイズによるスパムフィルタ)、6章がパラメータを確率変数として扱う話、7章が正規分布の平均を確率変数として扱う話、といった感じ。
5章までは四則演算がわかれば問題なく理解できる。ベイズの入門的な資料ではベイズの定理とナイーブベイズだけ書いてお茶を濁しているケースが多いが、ベイズの本質は分布の更新なのでそのへんがわかりやすく書かれている本書はベイズの入門としては非常にいけていると感じた。
6、7章は指数や積分が出てくるのと、分布のパラメータを確率変数として扱うという発想を受け入れるのがちょっと大変かもという印象(もっともこのへんはそもそも説明が難しいので本書はわかりやすく書いている方だとは思う)。
とりあえず初心者は5章まで読んでおくといい感じなんじゃないかと思う。個人的には機械学習の初心者にはベイズに触れるのはやめてパーセプトロンをやれと言ってきたのだけど、この本くらい良い解説書があるならベイズをやってみるのもいいかなという感じだった。さすが伝説のベイジアン先生。
頻度主義VSベイジアンの話とか、最後に測度論の存在を匂わせて終わるとか小ネタも充実してるので内容を知ってる人でもわりと楽しめる気がする。