「バイオインフォマティクスの数理とアルゴリズム」を読み返した

バイオインフォマティクスではDNA配列やアミノ酸配列から共通のパターンを抽出したり、類似する配列を獲得したり、といった問題を扱う。
こうした問題は配列を文字列と考えれば自然言語処理の分野でも適用できる。
というわけでNLPな人も抑えておきたい話題が豊富な「バイオインフォマティクスの数理とアルゴリズム」を読み返していた。

特に重要なのが第3章で、ギプスサンプラやHMM、カーネル法まで説明されていて自然言語処理の人も大変参考になる。
ギプスサンプラはモチーフ抽出の例で説明されている。こうした具体例から入るとわかり易い気がする。