Data Science from Scratch - O’Reilly Media を買ったので、読んだり手を動かしたログを書く。
- サンプルのソースはGitHubのjoelgrus/data-science-from-scratchにある
1章 導入
- DataSciencester社、入社初日という設定
- いろんなことをいろいろ試す
- 理論などはひとまず置いておいて、与えられているデータからとりあえず何らかの情報を取り出してみる、という感じ
2章 Python集中コース
- Python2.7を使う
- いろいろ入ったAnacondaオススメ
- 整数の割り算: 切り捨てられないようにする
from __future__ import division
- 他、いろいろ文法の説明
3章 データの視覚化
- matplotlib
- バーチャート、折れ線グラフ、散布図
4章 線形代数
- ベクトルとマトリクスの本当にちょっとした解説
5章 統計
- 平均、中央値、クォンタイル、モード
- 分散、標準偏差
- 共分散(Covariance):2つの変数がどう関係するか、それぞれ平均からの差同士を掛け合わせたものを、足し合わせる
- 単位が不明
- 相関(Correlation):共分散をそれぞれの標準偏差で割ったもの
- -1〜1に正規化される
.