2011-01-01から1年間の記事一覧

簡潔データ構造超入門II 〜ちょっとだけ実用的な簡潔ビットベクトル〜

簡潔データ構造(Succinct Data Structure)の魅力を紹介する本シリーズ。前回の記事では疎ベクトルを簡潔データ構造を使って効率的に実装する方法を紹介した。 前回の実装ではビットベクトルのサイズの上限が256だった。今回はこれを拡張して任意の大きさを扱…

ロリではないスポ根ラノベ「Let it BEE!」を読んだ

スポ根ラノベといえばアニメが絶賛放映中のロウきゅーぶ!が話題だが、今回読んだのはロリどころか萌え成分も特に無い正統派スポ根ライトノベル「Let it BEE!」。 先日、機械学習で今月読むべき電撃新刊を推薦したところ本作が選ばれた。よって本当に機械学…

簡潔データ構造超入門 〜つくって学ぶ簡潔ビットベクトル〜

簡潔データ構造は各種操作を高速に保ったままでデータサイズを情報理論的な下限近くまで圧縮できる。大規模データを扱うことの多くなってきた現在、特に注目を集めている技術である(※個人的な見解です)。 しかし有用性とは裏腹にまとまった教科書等がないこ…

電撃文庫の新刊はどれを買うべきかを機械学習で求めてみた

最近はものすごい数のライトノベルが出版されている。中でも大手の電撃文庫では毎月10冊以上もの新刊が発売されるためどれを買ったらいいか困ってしまう。 そんなときこそ機械学習の出番ではないか!というわけで先日作った簡単分類ツールfutabaを使って今…

思わず「しまむら」に行きたくなるライトノベル「七花、時跳び!」を読んだ

熱が出て一日寝ていた。暇だったので積ん読していた「七花、時跳び!」を読んだ。タイトルを見てわかるようにタイムトラベル系のお話。 そして一部地域に住んでいる人は大変お世話になっているであろう「ファッションセンターしまむら」ネタが豊富に盛り込ま…

「COMPOSITE ver.Ka サイバスター」良すぎる!

というわけで注文していたカトキサイバスターが届いた。これは凄い。無茶苦茶かっこいいじゃないですか。最近では嬉しいことにサイバスター関連のアイテムも増えてきたけれど、中でもこれはかなり出来がいいんじゃないかな! 参考: COMPOSITE ver.Kaのサイバ…

一家に一冊「ミルキィホームズ オフィシャルファンブック」

アニメ版ミルキィのファンブック「ミルキィホームズ オフィシャルファンブック」を購入しました。ドラマCDも付いて満足度高いです。

LCP(Longest Common Prefix)を用いたSuffix Arrayの検索

Suffix Arrayは「インデックスの構築」と「キーワードの検索」からなる。それぞれ構築には文字列のsortが、検索には文字列の二分探索が必要になる。 以前にCompressed Suffix Arrayのライブラリtsubomiを実装したときにはsortについてはマルチキー・クイック…

簡潔データ構造(Succinct Data Structure)で最初に読むと良さそうな論文

最近、簡潔データ構造(Succinct Data Structure)まわりの論文を色々読んでいる。その中で良さそうなものをいくつかピックアップしてみた。まだ調査中なので他に良いものがあったら教えてもらえると嬉しいです。

DSIRNLP#1で発表しました「TRIEにトライ!〜今日からはじめるTRIE入門〜」

昨日開催された「第1回 データ構造と情報検索と言語処理勉強会(DSIRNLP)」に発表者として参加しました。主催者の@overlastさん、発表者の皆さん、ボランティアの皆さん、会場を提供してくださったミクシィさん、そして発表を聞いてくださった皆さん。どうも…

簡単分類ツールfutabaを作ってみた

しばらく前に作ったライブラリtsubomiのサンプルとして簡単分類ツールfutabaを作ってみた。あくまでtsubomiのサンプルなので高性能というわけではないが、ちょっとしたマイニングに使うには便利かもしれない。 本ツールは事前に用意した学習データ(クラス名…

これは良書かも 「まずはこの一冊から 意味がわかる線形代数」

偶然書店で手に取ってみた「まずはこの一冊から 意味がわかる線形代数」が思いのほか良書の予感がしたのでメモ。 わかるわかる言っている本は信用できないことも多いのだが、本書は本当に意味がわかるので安心。

これが時代の最先端なのか 「お前のご奉仕はその程度か?」を読んだ

どうせ普通の萌え系ライトノベルなんでしょ。もう飽きたよ。そう思っていた時期が私にもありました。手に取って読み始めてみれば、そこは今までにない世界。なんだこのプレッシャーは! そんなわけで「お前のご奉仕はその程度か?」を読んだ。この作品こそが…

すっかり忘れていたミルキィホームズBD完走報告

社会人力を活かしてミルキィホームズのBDを全巻購入達成した。すっかり記事書くのを忘れていた。 「探偵オペラ ミルキィホームズ」は全12話すべてが神回という頭おかしいアニメなのでBDを全巻購入するのは当然と言えますね。特にある程度経済力のある社会人…

思わずスペランカーをやりたくなる「僕と彼女のゲーム戦争」を読んだ

「僕と彼女のゲーム戦争」を読んだ。主人公は大の読書好きで集中すると作品世界にトリップしてしまう謎の体質を持っている。その体質のせいかゲーム初心者ながら集中力を要するタイプのゲームではものすごい活躍をみせる。そんな彼とゆかいな仲間たちがゲー…

これはSFなのか?「ねじまき少女(下)」を読了した

「ねじまき少女(The Windup Girl)」上下巻読み終わった。翻訳SFの割には読みやすかった気がする。 なんとなくライトノベル的なお話で、これはSFなのか?と思わないでもなかったけれど作品としては面白かったよ。

ついにHJ文庫の時代が来たか・・・「僕の妹は漢字が読める」を読んだ

インパクト絶大のタイトルをもつライトノベル「僕の妹は漢字が読める」を読了した。妹は漢字が読める!当たり前じゃん!・・・いやいやそうではないのです。

機械学習超入門IV 〜SVM(サポートベクターマシン)だって30分で作れちゃう☆〜

ニーズがあるのかさっぱりわからない機械学習超入門だけどひっそり続けていきたい。 前回は識別関数の基礎であるパーセプトロンの簡単な説明とPerlによる実装を解説した。実はこの時点でかの有名なSVM(Support Vector Machine、サポートベクターマシン)もほ…

高村本でCRFのお勉強をしたのでメモ

「言語処理のための機械学習入門」通称高村本でCRF(Conditional Random Fields, 条件付き確率場)のお勉強をしたのでメモしておく。

話題のSF作品「ねじまき少女(上)」を読んだ

なんでも主要なSF賞を総なめしたとかで話題になったThe Windup Girlの邦訳「ねじまき少女」を読み始めた。上巻を読み終わったので感想メモ。ネタバレとかはないです。 で感想。特に根拠もなくハードSFだと思い込んでいたのだが、本作はかなりエンターテイン…

ACL2011論文「Faster and Smaller N-Gram Language Models」を読んだ

ACL2011の論文で「Faster and Smaller N-Gram Language Models」というのが気になったので読んでみた。 ACL Anthology » P11 Faster and Smaller N-Gram Language Models Adam Pauls, Dan Klein; 2011 本論文はこれまで提案されている言語モデルの圧縮・高速…

【ガンダムAGE放送決定記念】10分でわかる初心者のためのガンダム入門講座

祝!ガンダムAGE放送決定。今回も色々言われてるけど、それは毎回のことなので私は気にせず楽しみにしているよ! 機動戦士ガンダムAGE それはそうと、今回のAGEが初ガンダムという初心者のために10分でわかるガンダム入門記事を書いてみた。AGEの予習になに…

機械学習で固有値とか固有ベクトルで詰まった人は「キーポイント線形代数」がオススメ

機械学習を学んでいる微分積分や線型代数の知識が必要になることが多い。どちらとも大学で学ぶ数学の基礎なので知っていて当然!・・・というのが理想だけれどなかなかそうはいかない。 特に線型代数で出てくる固有値や固有ベクトルはグラフマイニングや次元…

百合アイドル祭なラノベ「アイドライジング!」2巻を読んだよ

今回も面白かったです!アイドラ2巻は私のイチオシのオリンちゃん無双。すばらしい。これは大満足。 参考: 百合アイドル!?俺得としか思えないラノベ「アイドライジング!」が面白すぎる - EchizenBlog-Zwei

クールなメガネ女子が主役の「わたしにXXしなさい!」が超面白かったよ

はい。少女漫画です。カッとなって買っちゃいました。もう無駄に漫画買うのやめようと思ったのに!こんなに面白いなんて!くやしい!

SVMの定番入門書「サポートベクターマシン入門(赤本)」の読み方

SVMを学びたい人にとっては「サポートベクターマシン入門」通称「赤本」は最適な入門書であるといえる。理論から実践までバランスよく解説されており、本書を読むだけでSVMの実装が可能になる。 しかし本書はSF小説を彷彿とさせる独特な翻訳の文体のため機械…

機械学習超入門III 〜機械学習の基礎、パーセプトロンを30分で作って学ぶ〜

機械学習には大きく分けて「識別関数」「識別モデル」「生成モデル」の3つの種類がある。このなかで識別関数は確率を使わないので初心者が入門するのに最適。 識別関数で有名なのはSVM(Support Vector Machine、サポートベクターマシン)。名前を聞いたことが…

ドット絵でキュアブロッサムを描いてみた(失敗)

渋谷員子のドットの匠 というスクエニのドット描いてる方の講座を見ていたら無性にドット絵を描きたくなったので描いてみたよ。 (※作らないといけない資料が一向に完成しなくて気分転換したかっただけなのはここだけの秘密)

ドラゴンクエストで学ぶ社会人スキル

ドラゴンクエスト(ドラクエ、DQ)は言わずと知れた有名RPG。名作と言われるだけあってその内容は大変示唆に富んでいる。そこでDQから社会人スキルを学び生活をより豊かにしようという試みをしてみた。

「ミルキィBlu-Ray5巻+ねんぷちネロ」を購入

ミルキィ5巻入手した!いえーい。このパッケージのネロは良いね。ねんぷちはアホ毛完備。