お金を生まない技術は不要なのか?と考えている人に"不戦無敵の影殺師"というラノベをオススメしたい

"不戦無敵の影殺師"というラノベがとても面白かったので紹介しておく。 作者が趣味で書いていたものをガガガ文庫が出版させてくれた、という経緯の作品とのこと。そのため最近のラノベのトレンドとはちょっとずれた作風になっている。 簡単に言うと"異能力者…

文法圧縮を使った完備辞書(簡潔ビットベクトル)を作った

@marugorithmさんの文法圧縮の解説資料(http://research.preferred.jp/2014/03/nlp2014_grammar/)があまりにも有益すぎて感動したので、文法圧縮を使った完備辞書(簡潔ビットベクトル)を作った。 文法圧縮の部分は実装の簡単さからRe-Pairアルゴリズムを使っ…

手元に置いておくと安心できる、情報系の人向けな日本語の本のリスト

最近、人に本を薦める事が多くなった。とりあえずこの辺を読むといいですよ的なリストを作っておくと便利だと思ったので作ることにした。 以下、「事前知識のいらない入門本」「事前知識はいらないけど本格的な本」「事前知識がないと何言ってるかわからない…

「木構造と自然数の重複あり集合は等価だよね」というはなし

「木構造と自然数の重複あり集合は等価だよね」というはなしをする。簡潔データ構造な人向けに言うとLOUDSの話。 とはいえこの記事は特に簡潔データ構造の知識を要求しない。データ構造とか情報量とかに興味がある人全般を対象としている。 ※簡潔勢にとって…

jumbled pattern matchingというのを知った

Binary Jumbled Pattern Matching via All-Pairs Shortest Paths(http://arxiv.org/pdf/1401.2065v1.pdf)という論文がLOUDS論文をreferしていて興味があったので読んでいた。jumbled pattern matchingという問題の時間計算量を改善したよ、という話だった。 …

本当に魔王を倒した勇者は誰?ファンタジー+ミステリな「魔王殺しと偽りの勇者」がとても良い

「魔王殺しと偽りの勇者」というラノベを読んだ。魔王を倒したと主張する勇者が4人いて本当に魔王を倒したのは誰か?というのを推理するミステリ作品(2巻完結)。以下感想(ネタバレ回避のため多くは語りません)。

「スーパーロボット大戦OG ダークプリズン」をクリアした

ちょっとずつ進めていた「スーパーロボット大戦OG ダークプリズン」をクリアした。以下、ネタバレな話をする。

固有値について理解を深めるために「基礎線形代数と固有値問題」を読んだ

@uchumikさんから「基礎線形代数と固有値問題」がいけているという情報を得たので速攻で購入して読んでいた。ざっと読み終えた(6章除く)ので感想を書いておく。

伝説のベイジアン先生にベイズの基礎を教えてもらえる「図解・ベイズ統計「超」入門」を読んだ

「図解・ベイズ統計「超」入門 あいまいなデータから未来を予測する技術」という本を読んだ。 社会人のアヤとケンが社内研修で伝説のベイジアン先生からベイズの基礎を教わる、という設定の会話形式でベイズについて書かれた入門書。社内研修でベイズのプロ…

まったく最小二乗法は最高だぜ!な「イラストで学ぶ機械学習」を読み終えた。

「イラストで学ぶ機械学習」という機械学習の本を読んだので感想を書いておく。 なお本書にはMatlabのコードが書いてある場合があるけど、Matlabに詳しくないので読み飛ばした。

ウェーブレット行列のrankを2倍高速化する案について著者からコメントをいただいた

一年くらい前にウェーブレット行列のrank計算を2倍高速化する方法を思いついた。 詳細はDSIRNLP発表資料(http://ja.scribd.com/doc/102636443/Wavelet-Matrix)のP.56以降。 本当にイケているのか自信がなかったのでウェーブレット行列論文のfirst authorであ…

Python版のSCWを作った(ついでに疎な素性を取るようにした)

Pythonに慣れるためにSCWを書いた。前にPerlで書いたのは密な素性を前提にしていた。これだと不便なので今回は疎な素性を取るように変更した。 https://github.com/echizentm/ConfidenceWeighted

何かと話題の隠れマルコフモデルを実装した

"ビジネスでもほとんど使われていない最新の統計モデル"とかいう謎なレッテルをはられてしまったことで話題の隠れマルコフモデル(Hidden Markov Model)を実装した。 NLPでのHMMは教師ありデータに対して使う場合が多いが、完全に品詞がわかっている場合はCRF…

SoftConfidenceWeightedの非対角成分を無視するバージョンを書いた

SCWはまともに実装すると高次元密行列ができてしまう。なんだか対角成分だけでもいいんじゃないの的な話があったので試しに実装してみた。 対角成分だけだったら疎なままでもOKだし(今回の実装では密行列を想定しているけど)、これで充分に精度が出るならSCW…

多変量(多次元)正規分布のKLダイバージェンスの求め方

機械学習界隈では多変量正規分布のKLダイバージェンスの導出は自明らしく、とくに説明もなく「はいこうなりますね〜簡単ですね〜ははは〜」みたいな感じで軽く流されて死にそうになる。 軽く流されると私のように死んでしまう人もいるかもしれないので導出方…

Soft Confidence Weightedも書いてみた

CW(Confidence Weighted)を実装したので調子に乗ってSCW(Soft Confidence Weighted)も書いてみた。 SCWには1と2があって、それぞれL1,L2正則化っぽい感じのことをしている。今回はSCW1を実装した。 またCWは学習時に使う共分散行列が対角成分しかなかったの…

Confidence Weightedを書いてみた

時代はSCW(Soft Confidence Weighted)らしいのだがCWさえまともに実装したことがなかった。これでは良くないということでCWを実装したので公開しておく。 https://github.com/echizentm/ConfidenceWeighted参考: http://www.cs.jhu.edu/~mdredze/publication…

自分のコピペ用にPerlで誤差関数と逆誤差関数を書いた

学習器を実装しようとすると唐突に逆誤差関数(erf(誤差関数)の逆関数)が必要になったりする。 こんなときに慌てず騒がずコピペできるようにPerlで実装したものをメモしておく。

器用貧乏な魔法戦士と無敵のマジカルプリンセス

RPGでパーティキャラは大きく分けると戦士型、魔法型、魔法戦士型に分類される。このうち戦士型と魔法型は能力特化型のスペシャリストで魔法戦士型はバランス型のゼネラリストである。 パーティを組んで戦闘を行うRPGではバランス型のキャラよりも能力特化型…

【転職一周年記念エントリ】エンジニアの転職を支える技術

転職して1年が経ちました。 前職での6年間は私の人生で最も辛い時期でした。転職してようやく本来の自分を取り戻せました。自分にあった場所で働くというのはとても大切だと思うので、転職するにあたって私がやったことをメモしておきます。

エントロピーレート(確率過程におけるエントロピーの増加の割合)

情報理論でエントロピーといえば確率変数が持つ情報量の期待値のこと。例えば P(x1) = 1/2, P(x2) = 1/4, P(x3) = 1/4という分布があったらエントロピーは 1/2 * lg2 + 1/4 * lg4 + 1/4 * lg4 = 1/2 * 1 + 1/4 * 2 + 1/4 * 2 = 3/2 = 1.5なので平均1.5ビット…

Googleの新しい圧縮アルゴリズムZopfliについて調べた。

Googleの新しい圧縮アルゴリズムZopfliについて調べたのでメモしておく。 Compress data more densely with Zopfli - Google Developers Blog

スチームパンク式検索エンジンが凄い「ソフロニア嬢、空賊の秘宝を探る」を読んだ。

何故かものすごい直感でこれを読むべきだと感じたので購入した。

Perlで完備辞書(Fully Indexable Dictionary)のモジュールを書いた

ウェーブレット木/行列など「高速文字列解析の世界」で扱っているデータ構造やアルゴリズムは完備辞書(Fully Indexable Dictionary)を基本的な道具として用いるものが多い。 とはいえ実用的な完備辞書を一から作るのは大変なので、高速文字列本を読んで「ち…

「入門 機械学習」を献本していただきました

「入門機械学習」を献本していただきました。ありがとうございました。 というわけで早速読み終わったので感想を書いておく。

「高速文字列解析の世界」を読む前に知っておくと良いこと

「高速文字列解析の世界」という大変すばらしい本が発売された。わりと敷居が高い本ではあるので読む前に知っておくとよさそうなことを書いておく。

第2次スーパーロボット大戦OG(7-12話)

SRポイントの条件がほとんど「nターン以内に(ry」なのと敵の回避力がやたら高いのとで遠距離武器メインのユニットが使いにくい。リニアレールガン無双だった時代が懐かしいですね。

第2次スーパーロボット大戦OG(1-6話)

twitterでネタバレを書くのは気が引けるのでこちらに書いておく。

DSIRNLP#03 「ウェーブレット行列 最速攻略」発表しました。

DSIRNLP#03 で「ウェーブレット行列 最速攻略」の発表をしました。 詳しくは資料を見ていただけると良いです。 台風にぶつかってしまいどうなることかと思いましたが、@overlastさんの配慮で無事発表できました。ありがとうございました。 それから準備あま…

DSIRNLP#03 ウェーブレット行列 最速攻略~予告編~

9/30(日)に開催予定のDSIRNLP#03で発表予定の「ウェーブレット行列 最速攻略」の予告編資料を作成したので公開しておきます。 ウェーブレット行列とはそもそもどんなものなのかを解説した資料です。この資料によってウェーブレット行列に関心をもつ人が増え…