About connecting the dots.

data science related trivial things

2013-01-20から1日間の記事一覧

JobTrackerのヒープ領域を増やしてOOMEを防ぐ

Hadoopで重たいジョブをたくさん回していると,JobTrackerのヒープ領域がだんだん食われていって,そのうちOut of Memory Errorになって落ちちゃうことが結構多いんですよね.なんか適切にGCとかしてくれないのかなぁとか思うんですが,Dark side of Hadoop…

kaggleで予測モデルを構築してみた (7) - モデル作成とkaggleでのテスト実行

さて,長々と書いてきた予測モデルの構築についてですが,今回でいったんの区切りを付けたいと思います. モデル構築 これまでやってきた手順で,データの作成とモデル構築を以下のように行っていきます.モデルはランダムフォレストで,クロスバリデーショ…