「mixi Engineers’ Seminar #3」に参加しました

参加してきました。簡単にメモ。

mixi Engineers' Blog >> mixi Engineers’ Seminar #3のお知らせ


一人目は高村本で有名な高村(@hjtakamura)先生(って変な表現だな・・・)。大学の話からはじまって自然な形で評判分析の話題に移る流れがすごい。このプレゼンは見習いたい!評判の極性判別ということで機械学習のお話がメイン。生成モデル(ナイーブベイズ)から入って識別モデル(CRF)にという流れはちょっと新鮮。CRFは連続したツイートの系列を分析するという話。最後に中川モデル(http://www.aclweb.org/anthology-new/N/N10/N10-1120.pdf)の話が。シーケンスではなく木に対する構造学習を確率伝搬法で解いた+正解データ全部にラベルがついていない問題を周辺化して解決した、というような話だった。面白そうなので後で調べよう・・・。
二人目はPRMLの翻訳や朱鷺の杜で有名な神嶌(@shima__shima)先生。レコメンドの基礎的な話に加えて、今話題のステマとかのお話。モデルベースはメモリベースに比べてステマに強いとか。たしかにそんな感じはする。ただステマに強いってことは意図的な事例で結果を変えにくかったりするので「XXXが絶対出るようにチューニングして欲しいのです」系の要望に応えるのが難しいよなーとか思ったり。まあ実務でないとそういう問題は起きないからいいのか。あとは多腕バンディッド問題でコンテンツの表示内容をパーソナライズだ、とかそういう面白いお話が聞けてよかった。あ、資料は公開されている様子(http://www.kamishima.net/archive/recsys.pdf)。
三人目はミクシィ石川さん。社内の分析プラットフォームのお話。社員が誰でもデータを自由に使える環境構築というのはとても魅力的だけれど、この手のプラットフォームを浸透させるのは難しいよなーと思いつつお話を聞いていた。基本はHiveでHadoopをいじりつつ、高度な分析がいる部分はサンプリングしてRで、という話だった。
というわけで御三方とも面白いお話をして下さったので大変楽しめました。どうもありがとうございました。あと懇親会でのフリーランチ(ランチじゃないか・・・)がすごいクオリティで驚くなどしました。ごちそうさまでした。すごい。