Data Science from Scratch

2015-08-21

Data Science from Scratch - O’Reilly Media を買ったので、読んだり手を動かしたログを書く。

1章 導入

  • DataSciencester社、入社初日という設定
  • いろんなことをいろいろ試す
  • 理論などはひとまず置いておいて、与えられているデータからとりあえず何らかの情報を取り出してみる、という感じ

2章 Python集中コース

  • Python2.7を使う
  • いろいろ入ったAnacondaオススメ
  • 整数の割り算: 切り捨てられないようにする
    from __future__ import division
  • 他、いろいろ文法の説明

3章 データの視覚化

  • matplotlib
  • バーチャート、折れ線グラフ、散布図

4章 線形代数

  • ベクトルとマトリクスの本当にちょっとした解説

5章 統計

  • 平均、中央値、クォンタイル、モード
  • 分散、標準偏差
  • 共分散(Covariance):2つの変数がどう関係するか、それぞれ平均からの差同士を掛け合わせたものを、足し合わせる
    • 単位が不明
  • 相関(Correlation):共分散をそれぞれの標準偏差で割ったもの
    • -1〜1に正規化される

.