2013-01-01から1年間の記事一覧

「スーパーロボット大戦OG ダークプリズン」をクリアした

ちょっとずつ進めていた「スーパーロボット大戦OG ダークプリズン」をクリアした。以下、ネタバレな話をする。

固有値について理解を深めるために「基礎線形代数と固有値問題」を読んだ

@uchumikさんから「基礎線形代数と固有値問題」がいけているという情報を得たので速攻で購入して読んでいた。ざっと読み終えた(6章除く)ので感想を書いておく。

伝説のベイジアン先生にベイズの基礎を教えてもらえる「図解・ベイズ統計「超」入門」を読んだ

「図解・ベイズ統計「超」入門 あいまいなデータから未来を予測する技術」という本を読んだ。 社会人のアヤとケンが社内研修で伝説のベイジアン先生からベイズの基礎を教わる、という設定の会話形式でベイズについて書かれた入門書。社内研修でベイズのプロ…

まったく最小二乗法は最高だぜ!な「イラストで学ぶ機械学習」を読み終えた。

「イラストで学ぶ機械学習」という機械学習の本を読んだので感想を書いておく。 なお本書にはMatlabのコードが書いてある場合があるけど、Matlabに詳しくないので読み飛ばした。

ウェーブレット行列のrankを2倍高速化する案について著者からコメントをいただいた

一年くらい前にウェーブレット行列のrank計算を2倍高速化する方法を思いついた。 詳細はDSIRNLP発表資料(http://ja.scribd.com/doc/102636443/Wavelet-Matrix)のP.56以降。 本当にイケているのか自信がなかったのでウェーブレット行列論文のfirst authorであ…

Python版のSCWを作った(ついでに疎な素性を取るようにした)

Pythonに慣れるためにSCWを書いた。前にPerlで書いたのは密な素性を前提にしていた。これだと不便なので今回は疎な素性を取るように変更した。 https://github.com/echizentm/ConfidenceWeighted

何かと話題の隠れマルコフモデルを実装した

"ビジネスでもほとんど使われていない最新の統計モデル"とかいう謎なレッテルをはられてしまったことで話題の隠れマルコフモデル(Hidden Markov Model)を実装した。 NLPでのHMMは教師ありデータに対して使う場合が多いが、完全に品詞がわかっている場合はCRF…

SoftConfidenceWeightedの非対角成分を無視するバージョンを書いた

SCWはまともに実装すると高次元密行列ができてしまう。なんだか対角成分だけでもいいんじゃないの的な話があったので試しに実装してみた。 対角成分だけだったら疎なままでもOKだし(今回の実装では密行列を想定しているけど)、これで充分に精度が出るならSCW…

多変量(多次元)正規分布のKLダイバージェンスの求め方

機械学習界隈では多変量正規分布のKLダイバージェンスの導出は自明らしく、とくに説明もなく「はいこうなりますね〜簡単ですね〜ははは〜」みたいな感じで軽く流されて死にそうになる。 軽く流されると私のように死んでしまう人もいるかもしれないので導出方…

Soft Confidence Weightedも書いてみた

CW(Confidence Weighted)を実装したので調子に乗ってSCW(Soft Confidence Weighted)も書いてみた。 SCWには1と2があって、それぞれL1,L2正則化っぽい感じのことをしている。今回はSCW1を実装した。 またCWは学習時に使う共分散行列が対角成分しかなかったの…

Confidence Weightedを書いてみた

時代はSCW(Soft Confidence Weighted)らしいのだがCWさえまともに実装したことがなかった。これでは良くないということでCWを実装したので公開しておく。 https://github.com/echizentm/ConfidenceWeighted参考: http://www.cs.jhu.edu/~mdredze/publication…

自分のコピペ用にPerlで誤差関数と逆誤差関数を書いた

学習器を実装しようとすると唐突に逆誤差関数(erf(誤差関数)の逆関数)が必要になったりする。 こんなときに慌てず騒がずコピペできるようにPerlで実装したものをメモしておく。

器用貧乏な魔法戦士と無敵のマジカルプリンセス

RPGでパーティキャラは大きく分けると戦士型、魔法型、魔法戦士型に分類される。このうち戦士型と魔法型は能力特化型のスペシャリストで魔法戦士型はバランス型のゼネラリストである。 パーティを組んで戦闘を行うRPGではバランス型のキャラよりも能力特化型…

【転職一周年記念エントリ】エンジニアの転職を支える技術

転職して1年が経ちました。 前職での6年間は私の人生で最も辛い時期でした。転職してようやく本来の自分を取り戻せました。自分にあった場所で働くというのはとても大切だと思うので、転職するにあたって私がやったことをメモしておきます。

エントロピーレート(確率過程におけるエントロピーの増加の割合)

情報理論でエントロピーといえば確率変数が持つ情報量の期待値のこと。例えば P(x1) = 1/2, P(x2) = 1/4, P(x3) = 1/4という分布があったらエントロピーは 1/2 * lg2 + 1/4 * lg4 + 1/4 * lg4 = 1/2 * 1 + 1/4 * 2 + 1/4 * 2 = 3/2 = 1.5なので平均1.5ビット…

Googleの新しい圧縮アルゴリズムZopfliについて調べた。

Googleの新しい圧縮アルゴリズムZopfliについて調べたのでメモしておく。 Compress data more densely with Zopfli - Google Developers Blog

スチームパンク式検索エンジンが凄い「ソフロニア嬢、空賊の秘宝を探る」を読んだ。

何故かものすごい直感でこれを読むべきだと感じたので購入した。

Perlで完備辞書(Fully Indexable Dictionary)のモジュールを書いた

ウェーブレット木/行列など「高速文字列解析の世界」で扱っているデータ構造やアルゴリズムは完備辞書(Fully Indexable Dictionary)を基本的な道具として用いるものが多い。 とはいえ実用的な完備辞書を一から作るのは大変なので、高速文字列本を読んで「ち…

「入門 機械学習」を献本していただきました

「入門機械学習」を献本していただきました。ありがとうございました。 というわけで早速読み終わったので感想を書いておく。

「高速文字列解析の世界」を読む前に知っておくと良いこと

「高速文字列解析の世界」という大変すばらしい本が発売された。わりと敷居が高い本ではあるので読む前に知っておくとよさそうなことを書いておく。