機器學習基礎教程中文版由郭茂祖等翻譯。這是一本在豆瓣上獲得7.3分評分的書籍。本節內容東坡小編為大家整理帶來的是一份pdf格式機器學習基礎教程(中文版)電子書,書籍內容高清無水印,是一份不錯的電子讀物,如果你想要閱讀的話,點擊本文相應的下載地址進行下載即可!以下是該書的相關介紹,希望對大家有所幫助!
機器學習基礎教程目錄
出版者的話
譯者序
前言
第1章 線性建模:最小二乘法1
1.1 線性建模1
1.1.1 定義模型2
1.1.2 模型假設2
1.1.3 定義什么是好的模型3
1.1.4 最小二乘解:一個有效的例子4
1.1.5 有效的例子7
1.1.6 奧運會數據的最小二乘擬合8
1.1.7 小結9
1.2 預測9
1.2.1 第二個奧運會數據集10
1.2.2 小結12
1.3 向量/矩陣符號12
1.3.1 例子17
1.3.2 數值的例子18
1.3.3 預測19
1.3.4 小結19
1.4 線性模型的非線性響應19
1.5 泛化與過擬合22
1.5.1 驗證數據22
1.5.2 交叉驗證23
1.5.3 K折交叉驗證的計算縮放25
1.6 正則化最小二乘法25
1.7 練習27
其他閱讀材料28
第2章 線性建模:最大似然方法29
2.1 誤差作為噪聲29
2.2 隨機變量和概率30
2.2.1 隨機變量30
2.2.2 概率和概率分布31
2.2.3 概率的加法32
2.2.4 條件概率32
2.2.5 聯合概率33
2.2.6 邊緣化34
2.2.7 貝葉斯規則介紹36
2.2.8 期望值37
2.3 常見的離散分布39
2.3.1 伯努利分布39
2.3.2 二項分布39
2.3.3 多項分布40
2.4 連續型隨機變量——概率密度函數40
2.5 常見的連續概率密度函數42
2.5.1 均勻密度函數42
2.5.2 β密度函數43
2.5.3 高斯密度函數44
2.5.4 多元高斯44
2.5.5 小結46
2.6 產生式的考慮(續)46
2.7 似然估計47
2.7.1 數據集的似然值48
2.7.2 最大似然49
2.7.3 最大似然解的特點50
2.7.4 最大似然法適用于復雜模型52
2.8 偏差方差平衡問題53
2.9 噪聲對參數估計的影響53
2.9.1 參數估計的不確定性54
2.9.2 與實驗數據比較57
2.9.3 模型參數的變異性——奧運會數據58
2.10 預測值的變異性59
2.10.1 預測值的變異性——一個例子59
2.10.2 估計值的期望值61
2.10.3 小結63
2.11 練習63
其他閱讀材料64
第3章 機器學習的貝葉斯方法66
3.1 硬幣游戲66
3.1.1 計算正面朝上的次數67
3.1.2 貝葉斯方法67
3.2 精確的后驗70
3.3 三個場景71
3.3.1 沒有先驗知識71
3.3.2 公平的投幣76
3.3.3 有偏的投幣78
3.3.4 三個場景——總結80
3.3.5 增加更多的數據80
3.4 邊緣似然估計80
3.5 超參數82
3.6 圖模型83
3.7 奧運會100米數據的貝葉斯處理實例84
3.7.1 模型84
3.7.2 似然估計85
3.7.3 先驗概率85
3.7.4 后驗概率85
3.7.5 1階多項式87
3.7.6 預測89
3.8 邊緣似然估計用于多項式模型階的選擇90
3.9 小結91
3.10 練習91
其他閱讀材料92
第4章 貝葉斯推理94
4.1 非共軛模型94
4.2 二值響應94
4.3 點估計:最大后驗估計方案96
4.4 拉普拉斯近似100
4.4.1 拉普拉斯近似實例:近似γ密度101
4.4.2 二值響應模型的拉普拉斯近似102
4.5 抽樣技術103
4.5.1 玩飛鏢游戲104
4.5.2 Metropolis-Hastings算法105
4.5.3 抽樣的藝術110
4.6 小結111
4.7 練習111
其他閱讀材料111
第5章 分類113
5.1 一般問題113
5.2 概率分類器113
5.2.1 貝葉斯分類器114
5.2.2 邏輯回歸121
5.3 非概率分類器123
5.3.1 K近鄰算法123
5.3.2 支持向量機和其他核方法…125
5.3.3 小結132
5.4 評價分類器的性能133
5.4.1 準確率——0/1損失133
5.4.2 敏感性和特異性133
5.4.3 ROC曲線下的區域134
5.4.4 混淆矩陣135
5.5 判別式和產生式分類器136
5.6 小結136
5.7 練習136
其他閱讀材料137
第6章 聚類分析138
6.1 一般問題138
6.2 K均值聚類139
6.2.1 聚類數目的選擇141
6.2.2 K均值的不足之處141
6.2.3 核化K均值141
6.2.4 小結144
6.3 混合模型144
6.3.1 生成過程144
6.3.2 混合模型似然函數146
6.3.3 EM算法146
6.3.4 例子151
6.3.5 EM尋找局部最優153
6.3.6 組分數目的選擇153
6.3.7 混合組分的其他形式154
6.3.8 用EM估計MAP156
6.3.9 貝葉斯混合模型157
6.4 小結157
6.5 練習157
其他閱讀材料158
第7章 主成分分析與隱變量模型159
7.1 一般問題159
7.2 主成分分析161
7.2.1 選擇D164
7.2.2 PCA的局限性165
7.3 隱變量模型165
7.3.1 隱變量模型中的混合模型165
7.3.2 小結166
7.4 變分貝葉斯166
7.4.1 選擇Q(θ)167
7.4.2 優化邊界168
7.5 PCA的概率模型168
7.5.1 Qτ(τ)169
7.5.2 Qxn(xn)170
7.5.3 Qwn(wm)171
7.5.4 期望值要求171
7.5.5 算法172
7.5.6 例子173
7.6 缺失值174
7.6.1 缺失值作為隱變量176
7.6.2 預測缺失值176
7.7 非實值數據177
7.7.1 概率PPCA177
7.7.2 議會數據可視化180
7.8 小結184
7.9 練習184
其他閱讀材料184
詞匯表185
索引188
機器學習基礎教程內容簡介
本書通過大量的MATLAB/Octave腳本將算法和概念由抽象的等式轉化為解決實際問題的工具,利用它們讀者可以重新繪制書中的插圖,并研究如何改變模型說明和參數取值。
本書是一本機器學習入門教程,包含了數學和統計學的核心技術,用于幫助理解一些常用的機器學習算法。書中展示的算法涵蓋了機器學習的各個重要領域:分類、聚類和投影。本書對一小部分算法進行了詳細描述和推導,而不是簡單地將大量算法羅列出來。
機器學習基礎教程電子書內容截圖
- PC官方版
- 安卓官方手機版
- IOS官方手機版