About connecting the dots.

data science related trivial things

データビジネス・分析・開発に関して2013年に読んだ本

そういえば,昨年に読んだ本についてまとめてなかったなと気がついたので,もう1月も終わりに近づいてはいますが,まとめてみました.この1年間で,お仕事はHadoop基盤の開発+運用メインから,分析メインに移り,さらにはマネージャーになる形で動いているので,割と読む本の質も変わってきた感じがします.

そんなわけで,カテゴリ毎に読んで良かった順番に並べていきます.カテゴリは以下の3つにわけました.最近はデータビジネスの比重がどんどん増えてきる感じです.自分の備忘録的な物が第一ですが,何をしているかを他の人にシェアしましょうというのもあります.何かしら参考になることがあれば幸いです.

  • データビジネス
  • データ分析
  • ソフトウェア開発

データビジネス

失敗の本質

失敗の本質―日本軍の組織論的研究 (中公文庫)

失敗の本質―日本軍の組織論的研究 (中公文庫)

これが2013年に読んだ本のNo. 1でした.

一言で要約すると,手元にある情報をもとに合理的に判断すればやってはいけないはずのことを,組織がどうして選択して,その結果失敗へと突き進んだかを分析した本です.対象は第二次世界大戦の日本軍なのですが,中で論じられているのは組織のあり方の話なので,まったく違和感なく読めます.

データ分析から得られた優れた知見があっても,それを組織として活かす体制にしないと,まったく意味がないということをしみじみ噛み締めるわけです.データ分析って,どこの現場でも経営層にどうやって意義を認識してもらうかという形になりがちなので...

データ・サイエンティストに学ぶ「分析力」 ビッグデータからビジネス・チャンスをつかむ

データ・サイエンティストに学ぶ「分析力」

データ・サイエンティストに学ぶ「分析力」

ビッグデータ→データサイエンティストときて,2014年はスモールデータだそうですが,この本はいわゆるビジネス現場におけるスモールデータの活用をストーリー的に書いていて,非常に面白いです.手法として洗練されたものを使っているわけではなく,ちゃんと対象を認識して施策につなげるためにデータをどう活用するのがいいか,という視点で書かれていてよいです.

そもそも原題が"Sexy little numbers"なので,邦題が適当すぎるだろという話にかならんわけなのですが,今年出版されていたら「スモールデータからビジネス・チャンスをつかむ」という副題になっていたのは間違いないでしょうね...

そういえば,昨年春にこのあたりは一度まとめているので参考までに.

データ分析から戦略を考える立場になりつつある状況で役に立ちそうな本3+1冊 - About connecting the dots.

なぜ、あの会社は儲かるのか? ビジネスモデル編

なぜ、あの会社は儲かるのか? ビジネスモデル編

なぜ、あの会社は儲かるのか? ビジネスモデル編

データをどう活かすのかを考えるときって,なんのかのいっていろんな成功パターンを知っていないと困るということに,ある日はたと気がつきました.

別に既存のビジネスもデールがすべてな訳ではないし,それを猿真似したってうまくいくとは限らないわけです.ただそうであっても,データをこう活かせば,別業種で行われている勝ちパターンを,自分の業界に持ってくることができる,みたいな発想につなげることができます.単に上から分析課題が降ってきて,それをこなすだけというのであれば,こういうものを読む必要は特にありません.でもある程度分析の枠決め自体をするようになると,そもそも何をすれば分析ドリブンでプロジェクトを回していけるか,という発想が必要とされます.

そんなときに,こういった知識の幅が必要になるのではないかなーと思っています.

良い戦略、悪い戦略

良い戦略、悪い戦略

良い戦略、悪い戦略

上ともかぶるんですが,ビジネスモデルを考える際に,何をどう考えればいいのよ,データをもとに戦略を考えるっていったってどうすりゃいいのよ,みたいなときにかなり指針を与えてくれる本でした.

売れる仕掛けはこうしてつくる―成功企業のマーケティング

売れる仕掛けはこうしてつくる―成功企業のマーケティング

売れる仕掛けはこうしてつくる―成功企業のマーケティング

マーケティングの成功事例集です.何をどう考えてどのような手を打ち,その結果どうなった,というのがまとまっていてよいです.下のマーケティング入門の姉妹本で,マーケティング入門の方で紹介されているフレームワークの単位でまとまっています.なのでセットで読むと良いと思います.

ゼミナール マーケティング入門

ゼミナール マーケティング入門

ゼミナール マーケティング入門

割と教科書的に,マーケティングのコンセプトや基本がまとまっていて参考になります.ただこれだけだとかなり味気なくてストンとこないので,上の事例集と併せて読むのが良さそうです.欠点は2004年出版で,ネットビジネスがいっさい扱われておらず,古びた感じが否めないところ...

とかいってたら第2版が昨年秋に出てました.私自身は未読なので,どこまで時代にあわせられているかは知りませんが...

ゼミナール マーケティング入門 第2版

ゼミナール マーケティング入門 第2版

シグナル&ノイズ 天才データアナリストの「予測学」

シグナル&ノイズ 天才データアナリストの「予測学」

シグナル&ノイズ 天才データアナリストの「予測学」

オバマの選挙キャンペーンで有名になったアメリカのデータサイエンティストの本.気象,地震,インフルエンザ,チェス,ポーカーとかの広範な分析ネタについて書かれていて,単純に読み物として面白いです.

部下を持ったら必ず読む 「任せ方」の教科書 「プレーイング・マネージャー」になってはいけない

自分がマネージャーをやるようになって,プレイングマネージャーなんてものは無理だね,ということがよくわかりつつあります.まぁ業種によるんでしょうが,少なくとも開発や分析のような,まとまった時間と集中力を必要とする仕事では,まず不可能といって差し支えない.なので権限委譲しなくては...

日産 驚異の会議

日産 驚異の会議 改革の10年が生み落としたノウハウ

日産 驚異の会議 改革の10年が生み落としたノウハウ

組織全体をどうやって効率化していくか,意思決定に関わる非効率さを解消できるかという本.興味深いですが,自分で実践するには全く至らず...

サクッとうかる日商簿記3級商業簿記 テキスト 【改訂五版】

サクッとうかる日商簿記3級商業簿記 テキスト 【改訂五版】

サクッとうかる日商簿記3級商業簿記 テキスト 【改訂五版】

データ分析であっても,ある程度枠を決める側の立場になると,お金の話から逃れるのは無理なわけで,ちゃんと会計の勉強もせなあかんよねということで読んだ本です.まぁ試験受けたわけじゃないですが.

サクッとうかる日商簿記2級商業簿記 テキスト 【改訂五版】

サクッとうかる日商簿記2級商業簿記 テキスト 【改訂五版】

サクッとうかる日商簿記2級商業簿記 テキスト 【改訂五版】

上の続きです.

ドリルを売るには穴を売れ

ドリルを売るには穴を売れ

ドリルを売るには穴を売れ

物語形式でマーケティングのエッセンスをまとめた本.面白かったです.

顧客を知るためのデータマネジメントプラットフォーム DMP入門

顧客を知るためのデータマネジメントプラットフォーム DMP入門 (NextPublishing)

顧客を知るためのデータマネジメントプラットフォーム DMP入門 (NextPublishing)

アドテクの知識インプットのために読んだ本です.この本の出版当時,他にまとまった情報がなかったので非常に参考にはなったんですが,とにかくややこしめのカタカナ語がならんでいてややげんなりです.なんで広告界隈の人は面倒な横文字を使いたがるのでしょうか...

DSP/RTBオーディエンスターゲティング入門 ビッグデータ時代に実現する「枠」から「人」への広告革命

DSP/RTBオーディエンスターゲティング入門 ビッグデータ時代に実現する「枠」から「人」への広告革命 (Next Publishing)

DSP/RTBオーディエンスターゲティング入門 ビッグデータ時代に実現する「枠」から「人」への広告革命 (Next Publishing)

同上.

データサイエンティスト完全ガイド

データサイエンティスト完全ガイド (日経BPムック)

データサイエンティスト完全ガイド (日経BPムック)

事例集としては面白く読めました.でもデータサイエンティストほとんど関係ないですね.

マーケットの魔術師 - 米トップトレーダーが語る成功の秘訣

マーケットの魔術師 ? 米トップトレーダーが語る成功の秘訣

マーケットの魔術師 ? 米トップトレーダーが語る成功の秘訣

  • 作者: ジャック・D.シュワッガー,横山直樹,Jack D. Schwager
  • 出版社/メーカー: パンローリング
  • 発売日: 2001/08/01
  • メディア: 単行本
  • 購入: 9人 クリック: 87回
  • この商品を含むブログ (35件) を見る

株式投資面白いですね.データビジネスの極北ですので.

外資系金融の終わり

外資系金融の終わり

外資系金融の終わり

同上.外資系金融はドロドロしていてアレですね.

選択の科学

選択の科学

選択の科学

タイトルの引きに比べて,中身が散漫としてるししょぼいです.

スタバではグランデを買え!

スタバではグランデを買え!

スタバではグランデを買え!

Kindleで安かったので.読み物としてよいのではないでしょうか.

データ分析

データ解析のための統計モデリング入門

データ分析周りだと,これが2013のベストでした.

一般化線形モデルと,そこからMCMCに至るまでの一連の流れをとんでもなくわかりやすく解説してあります.線形モデル周りをきちんと学ぶなら,この本に勝る本はないと思います.この本を読んだことで学び直しと先の学習がきちんとできました.これについての関連エントリもいくつか書いていますので,互換ん新の向きにはどうぞ.

1からみなおす線形モデル (1) - 一般線形モデル - About connecting the dots.
1からみなおす線形モデル (2) - 一般化線形モデル - About connecting the dots.
1からみなおす線形モデル (3) - 一般化線形混合モデル - About connecting the dots.

言語処理のための機械学習入門

言語処理のための機械学習入門 (自然言語処理シリーズ)

言語処理のための機械学習入門 (自然言語処理シリーズ)

機械学習のエッセンスがまとまった良書です.ある程度数学の素養がある上で,機械学習のエッセンスを理解するには最適な中級書だと思います.

私はもともとが,スモールデータの統計解析屋さんの出なので,いかんせん機械学習周りはかなり学び漏らしが多く,後からいろいろ苦労しているわけですが,この本のおかげで大分助けられました.こちらについても,以前に書評をかいています.

言語処理のための機械学習入門 - About connecting the dots.

経済・ファイナンスデータの計量時系列分析 (統計ライブラリー)

経済・ファイナンスデータの計量時系列分析 (統計ライブラリー)

経済・ファイナンスデータの計量時系列分析 (統計ライブラリー)

春頃に,みせかけの回帰について知って,時系列分析周りについて一通り理解しておかないとなぁと思って読みました.計量経済学分野のモデルは,実際問題としてWeb周りで扱うデータにかなりフィットすることが多いように感じています.その意味で,やや読むのが手間ですが,この本は計量経済学の定番手法である計量時系列分析をきちんと学ぶのに最良の本だと思います.このあたりはTJOさんのエントリを読んで手を動かす方が早く身に付く気もしますが.

みせかけの回帰 (1) - About connecting the dots.
みせかけの回帰 (2) - About connecting the dots.
みせかけの回帰 (3) - About connecting the dots.

ビッグデータ時代のマーケティング―ベイジアンモデリングの活用 (KS社会科学専門書)

ビッグデータ時代のマーケティング―ベイジアンモデリングの活用 (KS社会科学専門書)

ビッグデータ時代のマーケティング―ベイジアンモデリングの活用 (KS社会科学専門書)

昨年秋からブームになりつつあるベイジアンモデリングの本.特にマーケティングにどう活かすか,という話で状態空間モデルについて詳しく扱っています.実務的にありそうなケースを取り上げてのモデリングを行っており,とても面白いです.

パターン認識機械学習

パターン認識と機械学習 上

パターン認識と機械学習 上

いわずとしれたPRML.夏休みにがんばって一気読みしようと思いましたが,上巻で尽きて,下巻には至らず.面白いんですが,やはり読むのに根気がいる...

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

年末に読んでいた本です.Pythonを使ったデータ分析の入門書としては最適なのでは感.これまでRメインでやってきましたけど,ぼちぼちPythonに徐々に乗り換えっていってもいいかなーとか思っています.

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

お仕事の関係で,このあたりの知識をアップデートする必要があったので結構丁寧に読んだ本です.以下のエントリに諸々のまとめをしており,そのときにも書いたように,「2000年代以降の応用統計学のひとつのエッセンスが詰まったとても良い本」というのが私の評価です.1位の本といい,この確率途上法の科学は,とてもよいシリーズだと思います.

調査観察データにおける因果推論(1) - 無作為割り当てされていないことの問題 - About connecting the dots.
調査観察データにおける因果推論(2) - 傾向スコアとIPW推定量,二重にロバストな推定量 - About connecting the dots.
調査観察データにおける因果推論(3) - Rによる傾向スコア,IPW推定量,二重にロバストな推定量の算出 - About connecting the dots.
調査観察データにおける因果推論(4) - Rで傾向スコアを出す際の共変量選択基準 - About connecting the dots.

サンプルサイズの決め方

サンプルサイズの決め方 (統計ライブラリー)

サンプルサイズの決め方 (統計ライブラリー)

サンプルサイズについてきちんと論じた,おそらく国内唯一の本.リファレンスとして手元に持っておきたいですね。

施策の効果をどうやって測るか(1) - 仮説検定とは - About connecting the dots.
施策の効果をどうやって測るか(2) - 検出力と効果量 - About connecting the dots.
施策の効果をどうやって測るか(3) - compute.esパッケージによる効果量の計算 - About connecting the dots.

データサイエンティスト養成読本

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)

いわゆるWeb界隈でデータ分析やってる人たちが使う実践的なトピックについてまとめられた良書だと思います.データ分析を始めようという人がまず最初に読んで手を動かすのにうってつけの本だと思います.

入門はじめての統計的推定と最尤法

入門はじめての統計的推定と最尤法

入門はじめての統計的推定と最尤法

学び直しのために読みました.最尤法周りはすっかり忘れてたので.わかりやすくていい本だと思います.

まずはこの一冊から 意味がわかる線形代数 (BERET SCIENCE)

まずはこの一冊から 意味がわかる線形代数 (BERET SCIENCE)

まずはこの一冊から 意味がわかる線形代数 (BERET SCIENCE)

線形代数の本質について,すっごく丁寧に書かれていて,これも位置から学び直す際に参考になりまくりでした.

これなら分かる応用数学教室―最小二乗法からウェーブレットまで

これなら分かる応用数学教室―最小二乗法からウェーブレットまで

これなら分かる応用数学教室―最小二乗法からウェーブレットまで

これと,下の本は,理数系の大学数学をきちんと学びなおそうと思ったときに最適の本ではないかと思っています.説明が本当に丁寧で,わかりやすいです.

これなら分かる最適化数学―基礎原理から計算手法まで

これなら分かる最適化数学―基礎原理から計算手法まで

これなら分かる最適化数学―基礎原理から計算手法まで

同上.

統計学を拓いた異才たち―経験則から科学へ進展した一世紀

統計学を拓いた異才たち―経験則から科学へ進展した一世紀

統計学を拓いた異才たち―経験則から科学へ進展した一世紀

若干読みづらいですが,統計学の発展してきた歴史的な経緯はとても興味深いです.統計学は,どこまでいっても現実の現象に寄り添って理解を手助けするためのツールなのだなと思うわけです.

統計学を拓いた異才たち - About connecting the dots.

マーケティングの科学―POSデータの解析 (シリーズ・予測と発見の科学)

マーケティングの科学―POSデータの解析 (シリーズ・予測と発見の科学)

マーケティングの科学―POSデータの解析 (シリーズ・予測と発見の科学)

マーケティング分析の事例的なものを知るために読んだ本です.やや理論によりすぎていてバランスは良くない感じがします.

Rによるマーケティング・シミュレーション

Rによるマーケティング・シミュレーション

Rによるマーケティング・シミュレーション

マーケティングモデルについては,上の本よりこちらの方がずっと良いと思います.問題は既に絶版で,中古で買うとやたらに高いところでしょうか...

コンピュータトレーディング入門 (現代の錬金術師シリーズ 49)

コンピュータトレーディング入門 (現代の錬金術師シリーズ 49)

コンピュータトレーディング入門 (現代の錬金術師シリーズ 49)

マーケット面白いですね.今年はシストレやりたい.

金融工学―経済学入門シリーズ (日経文庫)

金融工学―経済学入門シリーズ (日経文庫)

金融工学―経済学入門シリーズ (日経文庫)

計量経済学の勉強の一環で読みました.エッセンスがコンパクトにまとまっていてよいと思います.

バッドデータハンドブック

バッドデータハンドブック ―データにまつわる問題への19の処方箋

バッドデータハンドブック ―データにまつわる問題への19の処方箋

一つ一つの事例は興味深いですが,全体としては散漫な印象です.データ分析したことない人は,ヘート氏か思わず,日常的にしている人にはそんなことは知っとるがな,という感じの帯に短し襷に長しな感じがするんですよね...

Rパッケージガイドブック

Rパッケージガイドブック

Rパッケージガイドブック

  • 作者: 岡田昌史,荒木孝治,伊藤康広,里洋平,高柳慎一,棚瀬貴紀,谷村晋,中谷朋昭,蓮見亮,林真広,樋口千洋,福島真太朗,牧山文彦,横山貴央,akira,mickey24
  • 出版社/メーカー: 東京図書
  • 発売日: 2011/04/09
  • メディア: 単行本
  • 購入: 2人 クリック: 1,298回
  • この商品を含むブログ (16件) を見る

リファレンスですね.

完全独習 統計学入門

完全独習 統計学入門

完全独習 統計学入門

社内の初級統計勉強会用です.初歩の初歩についてよくまとまっているように思います.

ソフトウェア開発

コーディングを支える技術

面白かったです.こういう自分が使っている道具の根本部分を考え直すきっかけになる本は,非常に知的好奇心をかき立てられますね.

SQLアンチパターン

SQLアンチパターン

SQLアンチパターン

私はSQL周りのエキスパートではないので,こういうあるあるハマりパターン集は本当に参考になりました.駆け出しプログラマなひとは絶対に読むべき本だと思います.

Hadoop徹底入門 第2版

Hadoop徹底入門 第2版 オープンソース分散処理環境の構築

Hadoop徹底入門 第2版 オープンソース分散処理環境の構築

そりゃあ新版が出たら買いますよ.この本なしでHadoop運用する日本の会社はないでしょう.

Hadoopオペレーション

Hadoopオペレーション ―システム運用管理ガイド

Hadoopオペレーション ―システム運用管理ガイド

お仕事用ですね.日本版は大分増補があって実用的でお得な感じがします.