tsubomi

9月の電撃文庫も機械学習でレコメンドしてみた

先月は電撃文庫の新刊購入の参考に自前のレコメンデーションツールfutabaを使ってみた。futabaで推薦された「Let it BEE!」が良作だったので今月もfutabaで推薦してみようと思う。 電撃文庫の新刊はどれを買うべきかを機械学習で求めてみた - EchizenBlog-Zw…

電撃文庫の新刊はどれを買うべきかを機械学習で求めてみた

最近はものすごい数のライトノベルが出版されている。中でも大手の電撃文庫では毎月10冊以上もの新刊が発売されるためどれを買ったらいいか困ってしまう。 そんなときこそ機械学習の出番ではないか!というわけで先日作った簡単分類ツールfutabaを使って今…

簡単分類ツールfutabaを作ってみた

しばらく前に作ったライブラリtsubomiのサンプルとして簡単分類ツールfutabaを作ってみた。あくまでtsubomiのサンプルなので高性能というわけではないが、ちょっとしたマイニングに使うには便利かもしれない。 本ツールは事前に用意した学習データ(クラス名…

海風に揺れる一輪のTRIEライブラリ erikaを作ってみたよ

注意:この記事の内容は古いものです。 最新版のerika-trieは erika-trie(実用版)とキーワード抽出ツールerika_extractを作ったよ - EchizenBlog-Zwei うっかり手が滑って自分で☆つけてしまいましたが自画自賛してるわけではないです・・・。 をご参照くださ…

tsubomiの環境別のmakeのはなし

ちょっと不親切な気がしたのでmakeまわりについてメモ。 参考: CSAを使った全文検索ライブラリtsubomiを公開してみる - EchizenBlog-Zwei tsubomiライブラリのAPIの仕様とサンプルプログラム - EchizenBlog-Zwei tsubomiは基本的にlinux環境を想定しているの…

tsubomiライブラリのAPIの仕様とサンプルプログラム

先日公開したtsubomiのAPI仕様とサンプルプログラムについて書いておく。 参考: CSAを使った全文検索ライブラリtsubomiを公開してみる - EchizenBlog-Zwei

CSAを使った全文検索ライブラリtsubomiを公開してみる

しばらく前から作っていた全文検索ライブラリtsubomiを公開しておく。 本ライブラリは接尾辞配列(Suffix Array)というアルゴリズムを使っていて、入力として与えたキーワードを含む行をテキストデータから探して、その行と出現位置を取得できる。さらに圧縮…