第1章 Python數據分析基礎 1
1.1 認識數據分析 1
1.2 數據分析的應用場景 2
1.3 數據分析常用統計學知識 5
1.4 數據分析方法 5
1.5 數據分析流程 10
1.6 數據分析的工具 12
1.7 Python的 Anaconda發行版的下載與配置 12
1.8 Pycharm安裝與 Anaconda相關聯 18
1.9 JupyterNotebook的基本功能介紹 22
小 結 28
第2章 NumPy數值計算基礎 31
2.1 NumPy模塊介紹 31
2.2 NumPy數組對象ndarray 34
2.3 NumPy矩陣與通用函數 54
2.4 利用 NumPy進行統計分析 61
小 結 76
第3章 pandas數據分析基礎 79
3.1 Series數據及常用操作 79
3.2 DataFrame數據及常用操作 87
3.3 pandas的索引 98
3.4 層級索引 104
3.5 pandas數據結構之間的運算 111
3.6 pandas函數的應用 114
3.7 pandas可視化 122
3.8 pandas可視化簡單應用小示例———2018年幸福大數據 127
小 結 131
第4章 外部數據的讀取與存儲 132
4.1 文本數據的讀取與存儲 132
4.2 JSON和Excel數據的讀取與存儲 140
4.3 數據庫的讀取與存儲 146
小 結 151
第5章 數據清洗與整理 153
5.1 數據清洗 153
5.2 數據合并和重塑 170
5.3 標準化數據 178
5.4 字符串處理 182
5.5 綜合示例-泰坦尼克號的生還者數據 188
小 結 196
第6章 數據分組與聚合 198
6.1 數據分組 198
6.2 聚合運算 (聚合、過濾和變換) 202
6.3 數據透視表 215
6.4 綜合實例 220
小 結 227
第7章 數據可視化基礎 229
7.1 Matplotlib模塊介紹 229
7.2 利用散點圖和折線圖分析特征間的關系 236
7.3 利用直方圖、餅圖和箱線圖分析特征內部數據 239
7.4 seaborn數據可視化 251
小 結 265
第8章 利用機器學習sklearn構建模型與實現 267
8.1 認識機器學習 267
8.2 sklearn庫的簡介、安裝 269
8.3 使用sklearn轉換器處理數據的方法 270
8.4 構建并評價聚類模型 273
8.5 構建并評價分類模型 278
8.6 構建并評價回歸模型 280
8.7 神經網絡 282
8.8 支持向量機 286
8.9 綜合示例 287
小 結 300
第9章 客戶價值分析 301
9.1 K-means算法 301
9.2 使用K-means算法進行客戶分類 306
小 結 311
第10章 在線產品數據分析 312
10.1 案例背景 312
10.2 案例目標及實現思路 312
10.3 具體分析過程 313
小 結 328
第11章 文本情感分析 329
11.1 情感分析基本概述 329
11.2 情感分析的應用 331
11.3 文本情感分析方法 332
小 結 351
參考答案 352
參考文獻 356