About connecting the dots.

data science related trivial things

2013-01-04から1日間の記事一覧

kaggleで予測モデルを構築してみた (4) - データの背景を調べる

前回は,データの前処理に先立って,各データの概要をみました.その上で今回は,Web上で手に入るタイタニックの史実をまとめて,データ前処理のための手がかりをつかむことにしましょう. タイタニック号の客室区分 客室は主に1-3等の客室と,その上の特等…

kaggleで予測モデルを構築してみた (3) - データの構成を確認する

ということで,前回に引き続きタイタニックのデータを使って分析をしていきましょう.といっても今回は判別手法から戻って,データの前処理のお話です. データの前処理とは 今回のデータはところどころに欠損があったり,推測の値が入っていたりして,機械…