「Web開発者のための大規模サービス技術入門」読了した

「Web開発者のための大規模サービス技術入門」読み終わった。インフラ、実装両面で大規模データの扱いのポイントが分かりやすく解説されていた。
機械学習をやっていると大規模データの扱いは避けて通れないので、アルゴリズムやデータ構造で工夫するような実装レベルでの大規模データの扱いは経験があったのだが、インフラ周辺のことは疎かったので大変参考になった。


実装面では、経験済みのことが多かったので素直に納得しながら読んだ。文章が全体的にうまく、こういう表現をすれば伝わりやすいのか!と大いに参考になった。扱っているトピックも検索、圧縮、分類など基本的で重要なものばかりなので入門用に良いのでは。圧縮は必要?という向きもある気はするが、圧縮によって全データがメモリに乗るなら大幅に性能をあげられるので結構重要だと思う。
あと最初はナイーブな実装で、必要に応じて効率化という話があったのだが、ある程度規模の大きな企業だと動き出したシステムを改良するのは難しいことも多い気はするな、と思った。少ない手間で実現できるなら可能な限りスケーラブルな実装をしておいたほうが良い気がする。(というより有事の際に少ない手間で解決できるように、できるだけ準備しておきたいところ。とくに研究部門とかがあるなら)
インフラ面では急激に成長する可能性のあるwebサービスならではの注意すべき点が書いてあって参考になった。スケールしやすいAPサーバと、しにくいDBサーバの違いなどは実際に大規模データを運用する前に知っておくと良いかもしれない。などなど。
全体的に入門書といった趣の本書だが、説明が分かりやすいので知ってる人も、プレゼン方法を学ぶなどの用途で活用できるんじゃないかと思った。オススメ。