quattro_4 scribble

scribble 落書き (調べた事をただ落書きする)

Study with Kaggle Titanic Tutorial

基礎的なデータ解析の考え方みたいなのができてないと思って、去年不定期に勉強してきたが、その中で今振り返ると最も良かったと思われる題材をメモ

Trevor Stephensという人のTutorial
Trevor Stephens — Titanic: Getting Started With R - Part 1: Booting...

Titanic: Machine Learning from Disaster | Kaggle New: Getting Started with R - Titanic: Machine Learning from Disaster | Kaggle

感じた点としては、自動パラメータチューニングとかで解決できなそうなポイントがスコアをアップする肝となっていたことから、人間が頭で解決しなければいけないポイントというのはある程度存在し続けるんだろうなと思った。
→ 具体的にはFamilyのまとまりを名前などから推測して変数に落とし込むところ

ツールの使い方は時間をかけて慣れればできるようになるが、考え方というのは意識していないといつまで経っても身につかないように思えた。


Titanicの手法のトレンドとか、どのくらいのスコアが良い結果なのかよくまとめられていたエントリ
kaggle初挑戦: タイタニック乗客のプロフィールから生存率をランダムフォレストで予測してみた - 機略戦記