WEB+DB PRESS vol.64の「作って学ぶ 日本語入力」がすごい
@tkngさんが日本語入力の記事を書いたということで注目していたWEB+DB PRESS vol.64をげっとしましたよ。
この特集記事は3つの章から構成されている。
第1章 日本語入力システム入門 第2章 かな漢字変換器の実装 第3章 変換速度と変換精度の向上
第1章は普通の読み物なので安心して読める。日本語入力の基礎がばっちりわかるすばらしい内容。第2章はStructured Perceptron(+ Viterbiアルゴリズム)でかな漢字変換の実装例を具体的に紹介している。そして第3章では辞書引きにトライ(Double Array)を用いて速度を向上させ、Structured PerceptronをStructured SVMにすることで精度を向上させる話が書いてある。
日本語入力に限らずこの特集で扱っているアルゴリズムは基本的で応用の効くものばかりなので日本語入力に関心がない人でも自然言語処理や機械学習、データ構造に関心がある人は読むと良さそう。あと@tkngさんも仰っているけれど確率の話を使っていないのもポイント。初心者にやさしい。
そ・れ・か・ら。最後にひっそり書いてあったのだが今回の特集をより掘り下げた「日本語入力を支える技術(WEB+DB PRESS plus)」というのが今秋に発売されるとのこと。この本ではDouble ArrayだけでなくLOUDSなんかも取り上げるのだとか。すごい。LOUDSについて書かれた日本語の書籍って初めてなのでは・・・(既に他にあったらすみません)。これは要注目!ですね。