-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

機器學習技術與實戰:醫學大數據深度應用

( 簡體 字)
作者:〔加〕 洪松林(Hong Song Lin) 編著類別:1. -> 程式設計 -> 機器學習
譯者:
出版社:機械工業出版社機器學習技術與實戰:醫學大數據深度應用 3dWoo書號: 48997
詢問書籍請說出此書號!

缺書
NT售價: 445

出版日:5/1/2018
頁數:335
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787111595991
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

什么是機器學習?現在恐怕無需再做基本概念解釋了。在本書中,我們談機器學習的實用技術。我們知道,有了數據,就要做很多分析工作。其中很常見的、很基本的一個分析是,針對目標變量,我們需要從大量的候選變量(可能是幾百個、幾千個)中,探索、發現哪些變量與目標變量具有較強的廣義相關性。我們可能應用很多不同的算法,一一對每個候選變量與目標變量進行相關性探索嘗試,可有時還是沒能找到一個有顯著相關性的變量。不少人可能都覺得沒辦法了。但是,沒有找到顯著的獨立相關變量,不意味著不存在任何相關變量了,數據中有可能存在著多個變量組合與目標變量具有較強的相關性(多變量相關組),或者說,與目標變量具有較強相關性的某個變量在數據中被“拆分”成了多個與目標變量不具有較強相關性的分變量。那么,在幾百個甚至成千上萬個候選變量中,如何有效地找到一個或多個多變量相關組呢?這是機器學習技術與工程實踐中一個典型的深入課題。解決這個問題,就像下圍棋一樣,棋局太多、變化太多,著法也太多。機器學習中類似的分析課題有很多,這需要我們不斷地探索、不斷地實踐、不斷地創新、不斷地積累,以便在千變萬化的“棋局”中找到解決之道、制勝之道!

機器學習作為一種自動化、智能化的深度分析技術,從更高的層面上講,其目的就是要從由數據代表的真實世界事物中探索和挖掘潛在規律和隱含機理,因此,機器學習除了是一門實用的應用技術外,它的發展前沿還是奧秘揭示、知識發現、科學探索!更高瞻遠矚一些,機器學習隨著理論和實踐的不斷深入,已經不再是原先狹義的“數據利用”和“知識發現”了,正在越來越深入到數學發現、甚至哲學發現以及科學發現了。例如,機器學習通常從刻畫客觀事物的各類大數據中挖掘出內在的規律,并期望能得到可靠、精準的可預測性結果。但是,隨著機器學習應用和研究的深入,我們發現了大量不可預測的現象與問題。通常,技術人員會想是數據出現了問題?還是算法出現了問題?因為人們的傳統思維通常是建立在確定性理論基礎之上的。但是,科學家們已經越來越多地意識到、甚至認識到了世界上大量不確定性現象的客觀存在。

那么,數據中出現的這種不可預測性,很可能是由不確定性系統產生的。現實世界中,除了我們認識到的確定性系統之外,還存在著很多不確定性系統,這些系統中擁有大量的非線性的、無序的現象和事物。例如,量子力學中的不確定性原理、混沌學中確定性系統中的無序隨機性,都屬于不確定性,也就是說,至少是目前技術水平下,是不可預測的。但是,系統中存在著混沌性和無序性,并不意味著無規律性。實際上,很多系統中的非線性無序狀態中蘊含著許多規律性,只不過現代的理論和技術比較有限,尚不能很好地認識和應用這些規律。例如,混沌學中洛倫茨奇異吸引子是一個美麗的無序狀態,它是有規律的,數據的表現貌似隨機,但卻遵循著一定之規(數學模型)。

實際上,除了混沌學發現了大量的無序現象外,還有其他學科涉及不確定性系統的研究,例如,概率論也是研究無序(隨機)問題的一個分支學科。無序(隨機)與有序(確定)是相對的,而不同的無序(隨機)之間是相對的。以上都體現了系統的不確定性,由數據表達的時候,就出現了不可預測性。這就需要機器學習或者數據挖掘的理論、技術與實踐還要不斷創新和發展。因此,我們說,機器學習在現在和未來,作為現實世界科學探索的一個工具和技術,將不斷地探索和發現包括不確定性系統產生的大量客觀規律,以便更好地服務于各行各業的應用實踐!

我們在本書中盡可能將理論與實踐相結合,既重于實踐應用又深入理論原理。理論是灰色的,而實踐則是最鮮活的。本書是機器學習應用方面的書籍,我們希望盡可能多講些實踐和案例,并多用圖畫、圖表說明大部分的機器學習原理和應用,讓讀者更能貼近實際。

本書主要內容

第1章“機器學習基礎”介紹機器學習應用的基礎內容,希望能快速引領讀者進入機器學習領域。該章包括機器學習中一些基本概念,如數據的“形狀”、機器學習要素等;機器學習的應用概念,如事物與維度、分布與關系、描繪與預測、現象與知識、規律與因果;機器學習基礎概念,如無限三維嵌套空間,分數維度空間,不確定論等。

第2章“數據探索”介紹機器學習應用活動的前期工作,即數據探索和數據準備工作,包括數據關系探索、數據特征探索、數據選擇、數據處理。

第3章“機器學習技術”介紹機器學習的算法,一個好的、合適的算法在機器學習應用項目中起著至關重要的作用。本書從實際應用出發,介紹一些比較經典的算法,也包括一些我們為應用編寫的新算法,以及一些算法流程,算法包括聚類分析、特性選擇、特征抽取、關聯規則、分類和預測、時間序列、深度學習等。

第4章“機器學習應用案例”介紹應用上一章中提到的一些算法開發商業應用的案例。這些案例不僅體現了算法的實踐應用,也展現了機器學習應用各個環節的工作內容。該章將主要介紹特性選擇模型的應用、分類模型的應用等。

第5章“機器學習應用系統開發”介紹智能醫學科研系統IMRS的設計思路與步驟,包括從應用需求的產生、解決思路、系統設計、應用實現、效果評價與總結等完整過程,具體剖析IMRS的幾個重要模塊的開發方法,包括異常偵測模型、特征抽取模型,以及算法開發。

第6章“機器學習系統應用(一):結構數據挖掘”介紹如何使用機器學習應用系統IMRS。按照臨床科研的普遍需求,我們將IMRS的功能劃分為六個方向:分布探索、關系探索、特征探索、異常探索、推測探索和趨勢探索,該章介紹前五個方向的應用。

第7章“機器學習系統應用(二):非結構數據挖掘”繼續介紹如何使用機器學習應用系統IMRS,包括文本挖掘技術、文本數據挖掘在醫學上的應用、文本分詞的實現、文本智能搜索、文本聚類與分類的應用、文本主題提取應用。

第8章“基于機器學習的人工智能應用”介紹人工智能在醫學上的應用:智能醫學診斷系統的設計思路與應用,還介紹了混沌人工智能的概念、應用及展望。

致謝

現在,大數據和機器學習是熱門,長年從事這個領域工作的我及我的團隊都很忙,能夠出版這本書實屬不易。需要感謝的是我公司的Sun Chen (孫辰),他是來自澳大利亞的資深數據分析師,悉尼大學統計學碩士畢業,在本書的編寫和整理過程中做了不少的協助工作,在此表示由衷的感謝!當然,機械工業出版社的吳怡編輯給予了我一貫的支持,她嚴謹的學術態度和豐富的編輯專業經驗,不僅是本書質量的保證,也給我留下了深刻的印象,再次向吳老師表示衷心的感謝!最后,還要特別感謝我的家人,他們是我事業的最有力支持者,本書要獻給我親愛的兒子Eddie和我所有的家人!

知識無止境,學習無止境!我和我的團隊也還在不斷地學習。書中的錯誤和不當之處可能難免,敬請廣大讀者指正,不勝感謝!



洪松林(Hong Song Lin)

2017年12月26日
內容簡介:

本書作者有二十余年數據倉庫、數據挖掘、機器學習、人工智能等方面的研發和應用經驗。他結合自己多年的行業經歷,總結了機器學習在實際工程中的應用經驗,特別是在醫學大數據領域的應用經驗,提供了大量一線資料。本書共8章。第1章介紹機器學習應用的基礎內容,快速引領讀者進入機器學習領域。第2章介紹機器學習應用活動的前期工作,即數據探索的工作和數據準備工作,包括數據關系探索、數據特征探索、數據選擇、數據處理。第3章介紹機器學習的算法,從實際應用出發,介紹一些比較經典的算法,以及一些算法流程,包括聚類分析、特性選擇、特征抽取、關聯規則、分類和預測、時間序列、深度學習等。第4章介紹如何將算法用到商業應用的案例,如特性選擇模型的應用、分類模型的應用等。第5章介紹智能醫學科研系統IMRS的設計思路與步驟,具體剖析IMRS的幾個重要模塊的開發方法,包括異常偵測模型、特征抽取模型,以及算法開發。第6章介紹如何使用機器學習系統IMRS,以及幾個方向的應用,如分布探索、關系探索、特征探索、異常探索、推測探索等。第7章繼續介紹如何使用機器學習系統IMRS,包括文本挖掘技術、文本數據挖掘在醫學上的應用、文本分詞的實現、文本智能搜索、文本聚類與分類的應用、文本主題提取應用。第8章介紹智能醫學診斷系統的設計思路與應用展望,還介紹了混沌人工智能的概念以及解決復雜問題的思路。



機器學習是一門實用技術,而且是奧秘揭示、知識發現和科學探索的工具!更高瞻遠矚一些,機器學習隨著理論和實踐的不斷深入,已經不再是原先狹義的“數據利用”和“知識發現”了,正在越來越深入到數學發現,甚至哲學發現以及科學發現了。隨著機器學習應用和研究的深入,我們發現了大量不可預測的現象與問題。本書詳細介紹機器學習在醫學大數據領域的應用,作者總結了自己多年的實際工程經驗,提供了大量一線資料。

主要內容

從生活到工作、從理論到實踐,采用復雜問題簡單化的方法,對機器學習的概念、主要技術和典型應用加以介紹。

基于實踐應用方法講述經典機器學習算法,如K-Means、SVM、MDL、神經網絡、深度學習CNN和RNN等,也包括作者團隊研創的算法(大多為首次發表),如SRCF、WDSGM、MinEDTree、LCSSGM、WSimTXT等算法。

詳細介紹了結構化數據的機器學習技術與應用,以及非結構化數據——自然語言文本數據挖掘方法。

著重講解了機器學習系統IMRS的開發思路與步驟,涵蓋了機器學習應用系統的開發過程及詳細技術,講解巨細靡遺,極具啟發性。
目錄:

前言
第1章 機器學習基礎1
 1.1 認識機器學習1
1.1.1 機器學習概念1
1.1.2 機器學習與生活4
1.1.3 機器學習與知識6
 1.2 機器學習應用基礎6
1.2.1 事物與維度7
1.2.2 分布與關系9
1.2.3 描繪與預測12
1.2.4 現象與知識13
1.2.5 規律與因果13
 1.3 機器學習應用系統14
1.3.1 數據層14
1.3.2 算法層18
1.3.3 應用層23
1.3.4 經驗積累與應用26
 1.4 無限三維嵌套空間假說26
1.4.1 一維空間26
1.4.2 二維空間26
1.4.3 三維空間27
1.4.4 突破三維空間27
1.4.5 五維空間28
1.4.6 六維空間29
 1.5 分數維度空間30
1.5.1 分數維度30
1.5.2 自相似性31
1.5.3 無限迭代32
 1.6 不確定論33
 1.7 本章小結34
第2章 數據探索35
 2.1 數據關系探索36
2.1.1 業務發現36
2.1.2 關系發現38
2.1.3 數據質量探索38
2.1.4 數據整合42
 2.2 數據特征探索43
2.2.1 數據的統計學特征43
2.2.2 統計學特征應用50
2.2.3 變量相關性探索53
 2.3 數據選擇56
2.3.1 適當的數據規模57
2.3.2 數據的代表性57
2.3.3 數據的選取59
 2.4 數據處理61
2.4.1 數據標準化62
2.4.2 數據離散化63
 2.5 本章小結64
第3章 機器學習技術65
 3.1 聚類分析65
3.1.1 劃分聚類(K均值)66
3.1.2 層次聚類(組平均)70
3.1.3 密度聚類75
 3.2 特性選擇76
3.2.1 特性選擇概念76
3.2.2 線性相關80
3.2.3 相關因子SRCF82
 3.3 特征抽取91
3.3.1 主成分分析91
3.3.2 因子分析93
3.3.3 非負矩陣因子分解94
 3.4 關聯規則95
3.4.1 關聯規則概念95
3.4.2 Apriori算法96
3.4.3 FP樹頻集97
3.4.4 提升(Lift)97
 3.5 分類和預測98
3.5.1 支持向量機98
3.5.2 Logistic回歸102
3.5.3 樸素貝葉斯分類106
3.5.4 決策樹112
3.5.5 人工神經網絡116
3.5.6 分類與聚類的關系119
 3.6 時間序列120
3.6.1 灰色系統預測模型120
3.6.2 ARIMA模型預測126
 3.7 深度學習127
3.7.1 圖像深度學習:卷積神經網絡127
3.7.2 自然語言深度學習:循環神經網絡141
 3.8 本章小結145
第4章 機器學習應用案例146
 4.1 特性選擇的應用146
4.1.1 數據整合146
4.1.2 數據描繪147
4.1.3 數據標準化148
4.1.4 特性選擇探索148
 4.2 分類模型的應用——算法比較154
4.2.1 數據整合154
4.2.2 數據描繪155
4.2.3 數據標準化156
4.2.4 特性選擇探索156
4.2.5 分類模型160
 4.3 算法的綜合應用——腫瘤標志物的研究161
4.3.1 樣本選取161
4.3.2 癌胚抗原臨床特征主題分析165
4.3.3 癌胚抗原臨床特征規則分析169
4.3.4 癌胚抗原臨床特征規則的比較分析173
4.3.5 癌胚抗原相關因子分析174
4.3.6 不同等級癌胚抗原組差異分析177
 4.4 本章小結180
第5章 機器學習應用系統開發181
 5.1 IMRS的設計思路181
5.1.1 IMRS核心功能設計182
5.1.2 IMRS主要功能184
5.1.3 IMRS的模塊設計和應用實現185
5.1.4 IMRS的評估方法194
 5.2 機器學習應用系統:IMRS技術設計199
5.2.1 對數據源的分析200
5.2.2 IMRS的總體設計203
 5.3 IMRS異常偵測模型的開發210
5.3.1 異常偵測模型的功能展示211
5.3.2 技術開發要點214
 5.4 IMRS特征抽取模型的開發221
5.4.1 特征抽取模型的功能展示221
5.4.2 技術開發要點221
 5.5 IMRS的算法開發232
5.5.1 相關因子算法SRCF的實現232
5.5.2 樸素貝葉斯分類算法的實現237
 5.6 本章小結241
第6章 機器學習系統應用(一):結構數據挖掘242
 6.1 分布探索243
6.1.1 兩維度聚類模型應用243
6.1.2 高維度聚類模型應用248
 6.2 關系探索249
6.2.1 關聯規則的應用249
6.2.2 特性選擇的應用252
 6.3 特征探索257
6.3.1 不穩定心絞痛的特征總結258
6.3.2 動脈硬化性心臟病的臨床特征262
 6.4 異常探索264
6.4.1 生理指標的異常偵測264
6.4.2 異常偵測模型的比較267
 6.5 推測探索268
 6.6 應用系統的高級應用269
6.6.1 異常偵測的高級用法270
6.6.2 關聯規則的高級應用274
 6.7 本章小結278
第7章 機器學習系統應用(二):非結構數據挖掘280
 7.1 文本挖掘技術280
7.1.1 文本分詞算法280
7.1.2 文本相似性算法283
7.1.3 文本聚類算法287
7.1.4 文本分類算法290
 7.2 文本數據挖掘在醫學上的應用293
7.2.1 醫學自然文本挖掘的應用293
7.2.2 醫學自然文本挖掘的方法294
7.2.3 醫學自然文本挖掘的相關技術295
7.2.4 醫學自然文本挖掘系統的實現295
 7.3 文本分詞的實現296
7.3.1 專業語料庫與分詞算法的結合297
7.3.2 專業分詞庫的自完善297
 7.4 文本智能搜索298
7.4.1 文本相似性搜索298
7.4.2 文本相關性搜索299
 7.5 文本聚類與分類的應用299
7.5.1 文本聚類應用300
7.5.2 文本分類應用302
 7.6 文本主題提取應用303
 7.7 本章小結305
第8章 基于機器學習的人工智能應用306
 8.1 基于大數據和機器學習的人工智能306
8.1.1 廣義大數據306
8.1.2 人工智能307
8.1.3 基于大數據的人工智能應用308
8.1.4 基于小數據的人工智能應用311
 8.2 人工智能的應用:智能醫學診斷系統314
8.2.1 智能診斷推理機314
8.2.2 臨床智能診斷的實現319
8.2.3 臨床智能診斷的應用321
8.2.4 臨床智能診斷的驗證:基于群體特征的個案臨床評估323
 8.3 混沌人工智能325
8.3.1 混沌理論325
8.3.2 人類大腦的混沌性327
8.3.3 大腦混沌性的應用328
8.3.4 人工智能大腦展望332
 8.4 本章小結333
序: