何故、確率分布からのサンプリングが必要か?

最近「計算機シミュレーションのための確率分布乱数生成法」という本をオススメする記事を書いた。

「計算機シミュレーションのための確率分布乱数生成法」がamazonで再注文可能に - EchizenBlog-Zwei

ただ確率分布からサンプリングすると何が嬉しいのか、ピンと来ない方もいると思うので、補足しておく。

解説には以下の資料を参考にした。というか、かなりそのまんま。大変わかり易くオススメ。

Sampling Methods UEMATSU Sumire


やりたい事は変数xについての関数f(x)の期待値を求めること。つまりE[f(x)]を求めたい。期待値は

E[f(x)] = ∫p(x)f(x)dx

という積分計算で求められる。ここで積分が計算できない場合、xの分布p(x)からxをいくつかサンプリングしてきて{x1, x2, ..., xN}を得る。これを使って

(Σf(xi)) / N

を求める。この値はE[f(x)]の近似になっている。Nを大きくとるほど真の値に近づく。
というわけでE[f(x)]の近似解を得る途中で確率分布p(x)からのサンプリングが必要というわけ。