About connecting the dots.

data science related trivial things

言語処理のための機械学習入門

言語処理のための機械学習入門 (自然言語処理シリーズ)

言語処理のための機械学習入門 (自然言語処理シリーズ)

自然言語処理と書いてありますが,普通に機械学習の教科書として読めます.そしてPRMLには手がまだでない人が読むのに最適なように思えます*1すごい良書です.
ターゲットは割と明確で,理工系の学部数学は理解しているけれども,機械学習の高度な手法について理論的な把握ができているわけではなく,まずは概要をつかみたい人向けです.専門的な手法に進む前段階の,機械学習の定番手法の概説書,というなかなかよいポジションに位置する本だと思います.その一方で数式バリバリなので,文系卒でSPSS使ってマーケティング分析しているようなタイプの方向きではないです.

そもそも動機としては,もともと割と統計よりだったために機械学習の数理的な部分の理解がかなりおざなりなままこれまでやってきていて,それを学びなおしたかったというのが一つ.さらに自然言語処理のお仕事をマネージする立場になっていながら,自身が自然言語処理の経験がないので,せめて知識だけでもつけておかないと,というのがもう一つ.そんなニーズにぴったりの本でした.

たかだ200ページ程度の厚さなので,読み切るのもそこまで骨ではなく,むしろ丁寧な補説や用語の定義がついていて,読み手のことをキチッと考えて作られた本だなぁと思います.各章に参考文献がしっかりついているので,そこからアドバンスドな方向に進めるのもよし.

秋休みになにか自然言語処理のデータ分析やってみようかなぁ...

*1:入門書とPRMLの間くらいの難易度の本らしいです.と職場の同僚がいっていました.私自身はPRML未読なので正しいかどうかの判断はしきれませんが...