機器學習實踐指南 ( 簡體 字) |
作者:〔英〕阿圖爾·特里帕蒂(Atul Tripathi) 著 | 類別:1. -> 程式設計 -> 機器學習 |
譯者: |
出版社:機械工業出版社 | 3dWoo書號: 48579 詢問書籍請說出此書號!【有庫存】 NT售價: 395 元 |
出版日:3/1/2018 |
頁數:345 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787111592129 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言:當今世界,數據已經成為新的“價值金礦”并以指數級的速度增長著。這種增長既包括現存數據的增長,也包括新數據的增長,這些新的數據以結構化和非結構化的形式展現,并來源于社交媒體、互聯網、文檔文獻以及物聯網等多種多樣的數據源。數據流必須實時地收集、處理、分析,并最終展現出來以確保數據的使用者能夠在如今快速變化的環境中做出理性且明智的決定。機器學習技術將待解決問題的上下文信息應用于這些數據上,用統計學技術確保不斷快速到達的復雜數據能夠以科學的方式加以分析。并利用機器學習算法從數據中進行迭代學習,發現數據中的隱藏模式和規律。機器學習的這種迭代學習的模式是非常重要的,正因如此,當機器學習模型被暴露在新的數據中時,它們才能從新的數據集中獨立地適應和學習以產出可靠的結論。
我們將首先介紹本書中包含的多種不同的機器學習主題,隨后,基于現實世界的問題在不同的章節中對各個主題進行一一探討,例如分類、聚類、模型選擇和正則化、非線性問題、監督學習、無監督學習、增強學習、結構化預測、神經網絡、深度學習,還有最后的案例研究。本書的機器學習算法以R語言作為編程語言。本書適用于R語言的初學者,但是熟悉R語言對理解和使用本書的代碼肯定是會有所幫助的。
你將學習如何合理地決定使用哪類算法以及如何應用這些算法得到最佳的效果。如果你想要對圖像、文字、語音或者其他形式的數據都建立有意義的多功能的應用,本書絕對會成為你的得力助手。
本書的主要內容
第1章涵蓋了機器學習的各種概念。本章使讀者初步了解本書涵蓋的各個主題。
第2章包括以下算法:判別函數分析、多元邏輯回歸、Tobit回歸、泊松回歸。
第3章包括以下主題和算法:層次聚類、二進制聚類、k均值聚類。
第4章包括以下主題和算法:壓縮方法、降維方法和主成分分析。
第5章包括以下主題和算法:廣義加性模型、平滑樣條、局部回歸。
第6章包括以下主題和算法:決策樹學習、樸素貝葉斯、隨機森林、支持向量機、隨機梯度下降。
第7章包括以下主題和算法:自組織映射和矢量量化。
第8章包括以下主題和算法:馬爾可夫鏈、蒙特卡洛模擬。
第9章包括以下主題和算法:隱馬爾可夫模型。
第10章包括以下主題和算法:神經網絡。
第11章包括以下主題和算法:遞歸神經網絡。
第12章包括世界銀行數據分析。
第13章包括再保險合同定價。
第14章包括用電量預測。
本書的重點
本書的重點是用R語言構建基于機器學習的應用。我們已經使用R語言構建過各種解決方案。我們的重點是利用R語言庫和函數以最佳方式來克服現實世界的挑戰。我們盡量保持所有代碼的友好性和可讀性。我們認為這將使讀者能夠很容易地理解代碼,并在不同的場景中隨時使用它。
本書的目標讀者
本書是為想構建實用的基于機器學習的應用的專業人士,以及統計、數據分析、機器學習、計算機科學或其他專業的學生和專業人士準備的。本書適用于R語言的初學者,但是熟悉R語言對理解和使用本書的代碼肯定是會有所幫助的。對于那些希望在現有技術棧中探索機器學習技術的有經驗的R語言程序員來說,本書也將是非常有用的。
特殊章節
在本書中,你將頻繁看到如下小節:準備工作和具體實施步驟。
為了更加清晰地說明怎樣完成一個機器學習方法,我們使用了如下特殊章節。
準備工作
該節告訴你機器學習方法需要哪些準備,并描述了如何設置該機器學習方法所要求的軟件或其他先決條件。
具體實施步驟
該節包含了機器學習方法的各個具體步驟。
下載示例代碼
本書的代碼位于GitHub上,讀者可從https://github.com/PacktPublishing/Practical-Machine-Learning-Cookbook下載。
下載本書的彩圖
本書還為你提供了一個PDF文件,其中包含了本書的彩圖。 |
內容簡介:本書由經驗豐富的機器學習專家撰寫,系統闡述處理復雜數據的各種實用機器學習算法和技術,通過基于真實數據的案例,從數據科學家視角深入探索機器學習現實應用所面臨的挑戰,并基于R語言提供大量實用解決方案。
本書首先簡要介紹書中所包含的多種不同的機器學習主題,然后基于現實世界的問題在不同的章節中對各個主題進行一一探討,例如分類、聚類、模型選擇和正則化、非線性問題、監督學習、無監督學習、增強學習、結構化預測、神經網絡、深度學習等,最后介紹三個不同的機器學習案例,有針對性地提供機器學習解決方案。本書的機器學習算法以R語言作為編程語言。通過閱讀本書,你將學習如何合理地決定使用哪類算法以及如何應用這些算法得到最佳的效果。如果你想要對圖像、文字、語音,或者其他形式的數據都建立有意義的多功能的應用,本書將是你的絕佳參考。
機器學習已經變成了新的“價值金礦”。當今世界面臨的一個重要挑戰是從已有遺漏數據以及新產生的結構和非結構化數據中挖掘數據的價值。使用機器學習算法對這些數據進行探索、理解、分析和預測的復雜度是另一個挑戰。本書將幫助你從一名數據科學家的角度解決這些挑戰。基于現實中的挑戰,不同數據科學技術的應用及其在不同真實數據集上的應用將幫助你學習不同情景下的各種技術。
本書前半部分將逐一講解非常復雜的機器學習系統中的相關技術。你將從中學到如何利用機器學習的技術去探索新應用的領域并提升其效率。具體包括分類、神經網絡、無監督和監督學習、深度學習、增強學習等方面的技術。
本書后半部分集中介紹三個不同的機器學習案例。所有案例都基于真實數據,并有針對性地提供了機器學習的解決方案。
通過閱讀本書,你將:
深入理解如何應用機器學習技術
逐一實現高級的機器學習技術
解決你所遇到的現實問題,使你的應用產生更為優化的結果
針對機器學習系統,獲得解決問題的實踐經驗
理解收集數據、數據預處理、訓練模型、評估模型性能和改進模型性能的方法 |
目錄:譯者序
前言
第1章 機器學習引言 1
1.1 什么是機器學習 1
1.2 分類方法概述 2
1.3 聚類方法概述 2
1.4 監督學習概述 3
1.5 無監督學習概述 4
1.6 增強學習概述 4
1.7 結構化預測概述 5
1.8 神經網絡概述 5
1.9 深度學習概述 6
第2章 分類 7
2.1 引言 7
2.2 判別函數分析:地下鹵水地質化學測量 8
2.3 多元邏輯回歸:理解學生的課程計劃選擇 15
2.4 Tobit回歸:評估學生的學術能力 20
2.5 泊松回歸:理解加拉帕戈斯群島現存物種 27
第3章 聚類 38
3.1 引言 38
3.2 層次聚類:世界銀行樣本數據集 39
3.3 層次聚類:1999∼2010年
亞馬遜雨林的燒毀情況 44
3.4 層次聚類:基因聚類 55
3.5 二進制聚類:數學測驗 68
3.6 k均值聚類:歐洲各國蛋白質消耗量 75
3.7 k均值聚類:食品 80
第4章 模型選擇和正則化 86
4.1 引言 86
4.2 壓縮方法:每天消耗的卡路里 87
4.3 降維方法:Delta航空公司航空隊 100
4.4 主成分分析:理解世界菜肴 109
第5章 非線性 114
5.1 廣義加性模型:衡量新西蘭的家庭收入 114
5.2 平滑樣條:理解汽車和速度 119
5.3 局部回歸:理解干旱警告和影響 129
第6章 監督學習 136
6.1 引言 136
6.2 決策樹學習:對胸痛患者的預先醫療護理指示 137
6.3 決策樹學習:基于收入的房地產價值分布 145
6.4 決策樹學習:預測股票走勢方向 154
6.5 樸素貝葉斯:預測股票走勢方向 170
6.6 隨機森林:貨幣交易策略 184
6.7 支持向量機:貨幣交易策略 193
6.8 隨機梯度下降:成人收入 201
第7章 無監督學習 208
7.1 引言 208
7.2 自組織映射:可視化熱圖 209
7.3 矢量量化:圖像聚類 212
第8章 增強學習 217
8.1 引言 217
8.2 馬爾可夫鏈:股票區制轉移模型 218
8.3 馬爾可夫鏈:多渠道歸因模型 229
8.4 馬爾可夫鏈:汽車租賃代理服務 239
8.5 連續馬爾可夫鏈:加油站的車輛服務 243
8.6 蒙特卡羅模擬:校準Hull-White短期利率 247
第9章 結構化預測 257
9.1 引言 257
9.2 隱馬爾可夫模型:歐元和美元 257
9.3 隱馬爾可夫模型:區制檢測 263
第10章 神經網絡 270
10.1 引言 270
10.2 為S&P 500建模 270
10.3 衡量失業率 278
第11章 深度學習 292
11.1 引言 292
11.2 循環神經網絡:預測周期信號 292
第12章 案例研究:探索世界銀行數據 299
12.1 引言 299
12.2 探索世界銀行數據 299
第13章 案例研究:再保險合同定價 316
13.1 引言 316
13.2 再保險合同定價 316
第14章 案例研究:用電量預測 329
14.1 引言 329
14.2 用電量測量 329 |
序: |