「Pythonと実データで遊んで学ぶ データ分析講座」の感想
Pythonと実データで遊んで学ぶ データ分析講座を読んだ感想と備忘録です。
「ある程度、中身を知って使える」を目指す入門書
これは表紙のキャッチコピーですが、まさにこのキャッチコピーの通りだと思います。
本書は、Pythonを使うための方法を学ぶことに加えて、統計の分析手法について簡単な説明がされています。
その説明が個人的にわかりやすかったです。この著者の方々は、統計に深い理解があり、説明が上手くて無駄がない印象を受けました。
中身の目次
構成は以下です。
- Pythonの導入
- Pythonを使ったデータ処理
- 教師あり 〜回帰〜
- 教師あり 〜分類〜
- 教師なし
- 評価指標
- ニューラルネットワーク
- その他の手法
Pythonの導入は、Anacondaを使ったローカルか、ブラウザで使えるGoogle Colaboratoryの導入方法の案内。
データ処理は、よく使う、numpy、pandasのライブラリの説明、matplotlib、sklearnやkerasライブラリの説明です。
教師あり〜回帰〜では、回帰分析(線形)の説明とボストン市内の地域別住宅価格データを用いた実践編などが書かれています。
教師なし〜分類〜では、ロジスティック回帰の説明、決定木、ランダムフォレスト。実践編にはTwitterのデータの分類を行っています。APIを使って特徴量を作成しています。
教師なしは主成分分析の説明。
評価指標ではよく使われる指標についての説明がされています。
最後のニューラルネットワークでは、ニューラルネットワークの基本と、画像分類の実践がされています。
対象読者
本書の対象の読者は、ある程度統計の知識があり、さらにある程度プログラミングもわかっている人だと思いました。
統計とPythonのおさらいだったり、基礎的な理解を深めるのに本書は最適です。
逆に合わないのは、実際の仕事で使うための技術をえる目的だったり、全く統計の知識もプログラミングの知識もない人です。
統計には落とし穴がたくさんありますが、そう言った箇所はあえて省くことで説明をわかりやすくシンプルにしているからです。
統計とPythonでのデータ分析が、なんとなくできるけどよく分からない…という方はぜひ本書に目を通すと良いと思いました。