2011-01-01から1年間の記事一覧
簡潔データ構造(Succinct Data Structure)の魅力を紹介する本シリーズ。前回の記事では疎ベクトルを簡潔データ構造を使って効率的に実装する方法を紹介した。 前回の実装ではビットベクトルのサイズの上限が256だった。今回はこれを拡張して任意の大きさを扱…
スポ根ラノベといえばアニメが絶賛放映中のロウきゅーぶ!が話題だが、今回読んだのはロリどころか萌え成分も特に無い正統派スポ根ライトノベル「Let it BEE!」。 先日、機械学習で今月読むべき電撃新刊を推薦したところ本作が選ばれた。よって本当に機械学…
簡潔データ構造は各種操作を高速に保ったままでデータサイズを情報理論的な下限近くまで圧縮できる。大規模データを扱うことの多くなってきた現在、特に注目を集めている技術である(※個人的な見解です)。 しかし有用性とは裏腹にまとまった教科書等がないこ…
最近はものすごい数のライトノベルが出版されている。中でも大手の電撃文庫では毎月10冊以上もの新刊が発売されるためどれを買ったらいいか困ってしまう。 そんなときこそ機械学習の出番ではないか!というわけで先日作った簡単分類ツールfutabaを使って今…
熱が出て一日寝ていた。暇だったので積ん読していた「七花、時跳び!」を読んだ。タイトルを見てわかるようにタイムトラベル系のお話。 そして一部地域に住んでいる人は大変お世話になっているであろう「ファッションセンターしまむら」ネタが豊富に盛り込ま…
というわけで注文していたカトキサイバスターが届いた。これは凄い。無茶苦茶かっこいいじゃないですか。最近では嬉しいことにサイバスター関連のアイテムも増えてきたけれど、中でもこれはかなり出来がいいんじゃないかな! 参考: COMPOSITE ver.Kaのサイバ…
アニメ版ミルキィのファンブック「ミルキィホームズ オフィシャルファンブック」を購入しました。ドラマCDも付いて満足度高いです。
Suffix Arrayは「インデックスの構築」と「キーワードの検索」からなる。それぞれ構築には文字列のsortが、検索には文字列の二分探索が必要になる。 以前にCompressed Suffix Arrayのライブラリtsubomiを実装したときにはsortについてはマルチキー・クイック…
最近、簡潔データ構造(Succinct Data Structure)まわりの論文を色々読んでいる。その中で良さそうなものをいくつかピックアップしてみた。まだ調査中なので他に良いものがあったら教えてもらえると嬉しいです。
昨日開催された「第1回 データ構造と情報検索と言語処理勉強会(DSIRNLP)」に発表者として参加しました。主催者の@overlastさん、発表者の皆さん、ボランティアの皆さん、会場を提供してくださったミクシィさん、そして発表を聞いてくださった皆さん。どうも…
しばらく前に作ったライブラリtsubomiのサンプルとして簡単分類ツールfutabaを作ってみた。あくまでtsubomiのサンプルなので高性能というわけではないが、ちょっとしたマイニングに使うには便利かもしれない。 本ツールは事前に用意した学習データ(クラス名…
偶然書店で手に取ってみた「まずはこの一冊から 意味がわかる線形代数」が思いのほか良書の予感がしたのでメモ。 わかるわかる言っている本は信用できないことも多いのだが、本書は本当に意味がわかるので安心。
どうせ普通の萌え系ライトノベルなんでしょ。もう飽きたよ。そう思っていた時期が私にもありました。手に取って読み始めてみれば、そこは今までにない世界。なんだこのプレッシャーは! そんなわけで「お前のご奉仕はその程度か?」を読んだ。この作品こそが…
社会人力を活かしてミルキィホームズのBDを全巻購入達成した。すっかり記事書くのを忘れていた。 「探偵オペラ ミルキィホームズ」は全12話すべてが神回という頭おかしいアニメなのでBDを全巻購入するのは当然と言えますね。特にある程度経済力のある社会人…
「僕と彼女のゲーム戦争」を読んだ。主人公は大の読書好きで集中すると作品世界にトリップしてしまう謎の体質を持っている。その体質のせいかゲーム初心者ながら集中力を要するタイプのゲームではものすごい活躍をみせる。そんな彼とゆかいな仲間たちがゲー…
「ねじまき少女(The Windup Girl)」上下巻読み終わった。翻訳SFの割には読みやすかった気がする。 なんとなくライトノベル的なお話で、これはSFなのか?と思わないでもなかったけれど作品としては面白かったよ。
インパクト絶大のタイトルをもつライトノベル「僕の妹は漢字が読める」を読了した。妹は漢字が読める!当たり前じゃん!・・・いやいやそうではないのです。
ニーズがあるのかさっぱりわからない機械学習超入門だけどひっそり続けていきたい。 前回は識別関数の基礎であるパーセプトロンの簡単な説明とPerlによる実装を解説した。実はこの時点でかの有名なSVM(Support Vector Machine、サポートベクターマシン)もほ…
「言語処理のための機械学習入門」通称高村本でCRF(Conditional Random Fields, 条件付き確率場)のお勉強をしたのでメモしておく。
なんでも主要なSF賞を総なめしたとかで話題になったThe Windup Girlの邦訳「ねじまき少女」を読み始めた。上巻を読み終わったので感想メモ。ネタバレとかはないです。 で感想。特に根拠もなくハードSFだと思い込んでいたのだが、本作はかなりエンターテイン…
ACL2011の論文で「Faster and Smaller N-Gram Language Models」というのが気になったので読んでみた。 ACL Anthology » P11 Faster and Smaller N-Gram Language Models Adam Pauls, Dan Klein; 2011 本論文はこれまで提案されている言語モデルの圧縮・高速…
祝!ガンダムAGE放送決定。今回も色々言われてるけど、それは毎回のことなので私は気にせず楽しみにしているよ! 機動戦士ガンダムAGE それはそうと、今回のAGEが初ガンダムという初心者のために10分でわかるガンダム入門記事を書いてみた。AGEの予習になに…
機械学習を学んでいる微分積分や線型代数の知識が必要になることが多い。どちらとも大学で学ぶ数学の基礎なので知っていて当然!・・・というのが理想だけれどなかなかそうはいかない。 特に線型代数で出てくる固有値や固有ベクトルはグラフマイニングや次元…
今回も面白かったです!アイドラ2巻は私のイチオシのオリンちゃん無双。すばらしい。これは大満足。 参考: 百合アイドル!?俺得としか思えないラノベ「アイドライジング!」が面白すぎる - EchizenBlog-Zwei
はい。少女漫画です。カッとなって買っちゃいました。もう無駄に漫画買うのやめようと思ったのに!こんなに面白いなんて!くやしい!
SVMを学びたい人にとっては「サポートベクターマシン入門」通称「赤本」は最適な入門書であるといえる。理論から実践までバランスよく解説されており、本書を読むだけでSVMの実装が可能になる。 しかし本書はSF小説を彷彿とさせる独特な翻訳の文体のため機械…
機械学習には大きく分けて「識別関数」「識別モデル」「生成モデル」の3つの種類がある。このなかで識別関数は確率を使わないので初心者が入門するのに最適。 識別関数で有名なのはSVM(Support Vector Machine、サポートベクターマシン)。名前を聞いたことが…
渋谷員子のドットの匠 というスクエニのドット描いてる方の講座を見ていたら無性にドット絵を描きたくなったので描いてみたよ。 (※作らないといけない資料が一向に完成しなくて気分転換したかっただけなのはここだけの秘密)
ドラゴンクエスト(ドラクエ、DQ)は言わずと知れた有名RPG。名作と言われるだけあってその内容は大変示唆に富んでいる。そこでDQから社会人スキルを学び生活をより豊かにしようという試みをしてみた。
ミルキィ5巻入手した!いえーい。このパッケージのネロは良いね。ねんぷちはアホ毛完備。