About connecting the dots.

data science related trivial things

2012-01-01から1年間の記事一覧

エリック・エヴァンスのドメイン駆動設計

エリック・エヴァンスのドメイン駆動設計 (IT Architects’Archive ソフトウェア開発の実践)作者: エリック・エヴァンス,今関剛,和智右桂,牧野祐子出版社/メーカー: 翔泳社発売日: 2011/04/09メディア: 大型本購入: 18人 クリック: 1,337回この商品を含むブロ…

kaggleで予測モデルを構築してみた (2) - Rで機械学習パッケージをまとめて試してみる

ということで,引き続き入手したデータをRStudioに読み込んで予測モデルを試すところに進みたいと思います. データ読み込み RStudioでのデータ読み込みは簡単で,下の図のように画面右上部分のボタンを押してファイルを読み出せば,csvファイルを普通に読み…

kaggleで予測モデルを構築してみた (1) - kaggleって何?

データ解析に適したデータというのは案外世の中にはないもので,官公庁データやらなんやらをみても,エクセルにまとめられた集計表がポンッとおいてあるだけだったりして,しょんぼりすることが多いですね.そんなおり,昨年のRのアドベントカレンダーでKagg…

データ解析の管理にまつわる処問題

ということで前回の続きで,今回はデータ解析周りの環境等をどう管理していくか,という話になります.ていうか,こちらが本題.というか問題って何なのか,というのをまずはまとめたいと思います. 個別の問題のリストアップとその対応策 データサイズ 問題…

RStudio & knitrによるRの解析結果のドキュメント化

はじめに データ解析を行った場合,後からやり直しや結果参照,解析の詳細を確認するのって,案外だるいと思いませんか? 私は思います.結果を後から見直して,これってどうやってやってたんだっけとか,この部分変えたいとか,データ処理の細かい部分を確…