臨床大數據分析與挖掘——基于Python和機器學習的臨床決策 @ 3dWoo大學簡體電腦書店

	-- 會員 / 註冊 --
帳號：　密碼：　 \| 註冊 \| 忘記密碼

3/26 新書到！ 3/19 新書到！ 3/14 新書到！ 12/12 新書到！
	購書流程‧Q & A‧站務留言版‧客服信箱

│ 3ds Max│ Maya│ Rhino│ After Effects│ SketchUp│ ZBrush│ Painter│ Unity│

│ PhotoShop│ AutoCad│ MasterCam│ SolidWorks│ Creo│ UG│ Revit│ Nuke│

│ C#│ C│ C++│ Java│ 遊戲程式│ Linux│ 嵌入式│ PLC│ FPGA│ Matlab│

│ 駭客│ 資料庫│ 搜索引擎│ 影像處理│ Fluent│ VR+AR│ ANSYS│ 深度學習│

│ 單晶片│ AVR│ OpenGL│ Arduino│ Raspberry Pi│ 電路設計│ Cadence│ Protel│

│ Hadoop│ Python│ Stm32│ Cortex│ Labview│ 手機程式│ Android│ iPhone│


可查書名,作者,ISBN,3dwoo書號		詳細書籍分類

臨床大數據分析與挖掘——基于Python和機器學習的臨床決策
( 簡體字)

作者：孫麗萍,張良均類別：1. -> 程式設計 -> 大數據
　　　2. -> 程式設計 -> Python
　　　3. -> 程式設計 -> 機器學習

譯者：

出版社：電子工業出版社 3dWoo書號： 53822
詢問書籍請說出此書號！
【缺書】
NT售價： 300 元

出版日：11/1/2020

頁數：268

光碟數：0

站長推薦：

印刷：黑白印刷語系： ( 簡體版 )

加入購物車 │加到我的最愛
(請先登入會員)

ISBN：9787121400391

作者序　|　譯者序　|　前言　|　內容簡介　|　目錄　|　序

(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)

作者序：

譯者序：

前言：
序
隨著大數據時代的到來，移動互聯網絡和智能手機迅速普及，多種形態的移動互聯應用蓬勃發展，電子商務、云計算、互聯網金融、物聯網、虛擬現實、機器人等不斷滲透并且重塑傳統產業，大數據當之無愧地成了新的產業革命核心。
聯合國教科文組織以 6 種聯合國官方語言正式發布的《北京共識——人工智能與教育》中提出，各國要制定相應政策，推動人工智能與教育、教學和學習系統性融合，利用人工智能加快建設開放靈活的教育體系，促進全民享有公平、有質量、適合每個人的終身學習機會。這表明基于大數據的人工智能和教育進入了新的階段，這是一個數據科學的“百年未有之大變局”。
高等教育是教育系統中的重要組成部分，高等院校作為人才培養的重要載體，肩負著為社會培育人才的重要使命。然而，大數據和人工智能相關專業是2016 年才獲批的新專業，專業建設、師資、課堂都面臨著巨大考驗，如何培養學生服務社會經濟發展的實踐能力，成為目前亟待解決的問題。2018 年6 月21 日，教育部陳寶生部長在新時代中國高等學校本科教育工作會議首次提出了“金課”的概念，“金專”“金課”“金師”迅速成為中國高等教育新時代的熱詞，大數據和人工智能相關專業如何形成中國特色、世界水平的金專、金課、金師和金教材是當代教育教學改革的難點和熱點。
同時，實踐教學是在一定的理論指導下，通過引導學習者的實踐活動，從而傳承實踐知識、形成技能、發展實踐能力、提高綜合素質的教學活動。目前，高校教學體系的設置有諸多限制因素，過多地偏向理論教學，課程設置與企業實際應用切合度不高，學生無法把理論轉化為實踐應用技能。課程內容設置方面看似繁多又各自為“政”，課程設置存在冗余、缺漏、體系不健全等問題。為此，“泰迪杯”組委會與電子工業出版社共同策劃“大數據專業系列圖書”，該系列圖書采用校企聯合編寫的形式，希望能有效解決大數據相關專業教材緊缺的問題。這與2019 年10 月24 日教育部發布的《關于一流本科課程建設的實施意見》（教高〔2019〕8 號）提出的“堅持分類建設、堅持扶強扶特、提升高階性、突出創新性、
增加挑戰度”遵循原則完全契合。本系列圖書的第一大特點是注重學生實踐能力的培養，根據高校實踐教學中的痛點，首次提出“魚骨教學法”的概念。以企業真實需求為導向，學生學習技能緊緊圍繞企業實際應用需求，將學生需要掌握的理論知識通過企業案例的形式進行銜接，達到知行合一、以用促學的目的。
大數據專業應該以大數據技術應用為核心，緊緊圍繞大數據應用閉環的流程進行教學，使學生從宏觀上理解大數據技術在行業中的具體應用場景及應用方法。高校現有的大數據課程集中在如何進行數據處理、建模分析、參數調整，使得模型的結果更加準確上，但是，完整的大數據應用卻往往是容易被忽視的部分。本系列圖書的第二大特點是圍繞大數據應用的整個流程，從數據采集、數據遷移、數據存儲、數據分析與挖掘，最終到數據可視化。覆蓋完整的大數據應用流程，涵蓋企業大數據應用中的各個環節，符合企業大數據應用真實場景。
在教育部全面實施“六卓越一拔尖”計劃 2.0 的背景下，如何響應我國高等教育人才培養體制機制的綜合改革，如何重新定位和全面提升我國高等教育的質量？希望本系列圖書能夠起到拋磚引玉的作用，從而加快推進新工科、新醫科、新農科、新文科為代表的一流本科課程的“雙萬計劃”建設；落實“讓學生忙起來，管理嚴起來和教學活起來”，讓中國大數據和人工智能的專業、課程、課堂、慕課等相關本科與高職的人才培養質量有一個質的提升；借助數據科學的引導，在文、理、農、工、醫等全方位發力，培養各個行業的卓越人才，培養未來的領軍人才。“泰迪杯”自2013 年創辦以來，賽題來源于企業、管理機構和科研院所等經過適當簡化加工的實際問題，貼近現實熱點需求；數據只做必要的脫敏處理，保持原始狀態。競賽圍繞大數據挖掘的整個流程，從數據采集、數據遷移、數據挖掘、專題應用到數據可視化，覆蓋完整的數據挖掘流程，涵蓋企業應用中的各個環節，與目前大數據專業人才培養目標高度一致，因而得到全國各高校的熱烈反響，也得到了全國各界專家學者的傾力支持與協助。其不依賴于數學建模，甚至不依賴于傳統模型的競賽形式，獲得了工業界、產業界、行業界的高度認可，已成為國內大學生乃至研究生的重要學科競賽。2018 年，“泰迪杯”增加數據分析技能賽子賽項，為高職及中職技能型人才培養提供理論、技術和資源方面的支持。經過多年的發展，“泰迪杯”已經成為全國高校大學生大數據技術最主要的交流平臺。截至2019 年，全國共有近800 所高校，約1 萬名研究生、5 萬名本科生、2 萬名高職生參加了“泰迪杯”的相關比賽。
不斷探究數據科學類專業課程體系、課程教學改革，以及課程思政建設，積極開展融入新時代中國特色社會主義建設中的成就和需要解決的重大課題也正是大數據和人工智能相關專業需要研究的教學課題。本系列圖書正是思考與實踐“立德樹人”這一根本任務在大數據專業、技術和課程上的具體化、操作化和目標化，并逐次展開，也希望讀者能將使用、實踐過程中的意見、建議及時反饋給我們，形成大數據時代的新型“編寫、使用、反饋”螺旋式上升的系列教材建設樣板。

前言
目前，無論是手機助手一類的應用，還是類似掃地機器人的實物產品，都在以更加智能化的方式，方便人們的工作與生活。這一切的基礎是海量的數據，而實現應用與產品智能化目標背后依靠的則是人工智能技術。海量的數據和人工智能技術之間相輔相成，如果沒有海量的數據，人工智能技術無從發展；如果沒有人工智能技術，海量的數據也無法發揮其應有的價值。雖然人工智能技術取得了令人矚目的成就，但其還尚未在真正意義上深入各個細分領域，市場上缺少人工智能和細分領域知識兩方面都熟悉的專業人才。就醫療健康領域而言，醫護從業人員具有極強的醫療健康領域的專業知識，但是缺乏對人工智能技術的認知與運用能力，無法發揮現有數據的價值，而人工智能相關的從業者往往缺乏醫療健康領域的專業知識。編寫本書主要目的就是打破人工智能技術和醫療健康領域的壁壘，推動人工智能技術與醫療健康領域的融合。
本書特色
本書內容由淺入深地進行安排，不僅講解機器學習基本原理和基本方法，而且通過大量醫療領域的案例實現對醫療健康數據的處理和分析，能夠在很大程度上輔助醫護人員進行臨床決策。通過本書學習，讀者不僅能夠掌握機器學習算法建模前的數據準備，篩選構造機器學習算法指標的特征工程、不同類別的機器學習算法，還能夠掌握臨床診療數據、電子病歷檔案數據及影像數據等多源異構數據的處理方法，以及醫療圖像、文本等數據的讀取、預處理、可視化
等知識。同時，本書還介紹了具有開源、去編程化的TipDM 數據挖掘建模平臺，通過拖曳的圖形化操作就能實現數據分析的全流程。希望通過本書，能夠提升醫學類學生的數據處理能力，醫學領域的創新創業能力，以及通過人工智能技術解決醫學領域實際問題的能力。本書可以作為醫學類院校數據科學與大數據技術專業的核心課程教材，以及醫工專業的專業核心課程或選修課程教材。在此基礎上，還可以作為臨床、口腔、醫技、檢驗、影像、公共衛生等醫學類專業進階層次的專業限選課程或拓展課程的教材。目前，本書配套的課程是上海健康醫學院的優質在線課程和校重點課程，同時是上海高校大學計算機課程教學改革立項項目。
本書適用對象
（1）學習機器學習相關課程的高校學生
目前國內不少高校將機器學習引入教學中，在互聯網、金融、醫療等行業的相關專業開設了與機器學習相關的課程，但目前這一課程將Python 基礎與機器學習割裂開來，在知識不夠系統的同時，也增加了課業負擔。本書將Python 基礎與機器學習常用編程精煉整合，幫助零基礎的讀者更快地學會機器學習編程。
（2）學習機器學習應用的開發人員
機器學習應用的開發人員的主要工作是將機器學習相關的算法應用到實際業務系統中。本書提供了詳細的機器學習接口的用法與說明，能夠幫助機器學習應用的開發人員快速而有效地建立起數據分析應用的算法框架，迅速完成機器學習應用的開發。
（3）進行機器學習應用研究的科研人員
科研人員理論基礎強，但其要實現機器學習算法，需要花費大量的時間。本書可以為科研人員提供一個算法快速實現的通道，在短時間內實現理論驗證，同時本書也可為科研系統提供機器學習相關的功能支撐。
代碼下載及問題反饋
為了幫助讀者更好地使用本書，泰迪云課堂提供了配套的教學視頻。對于本書配套的原始數據文件、Python 程序代碼，讀者可以從“泰迪杯”數據挖掘挑戰賽網站免費下載。為方便教師授課，本書還提供了PPT 課件等教學資源。
本書第 1 章由劉巧紅編寫，第2 章由張良均編寫，第3 章由李萍編寫，第4 章由陳棟編寫，第5 章由張敏編寫，第6 章由任和、李建華編寫，第7 章由凌晨編寫，第8 章～第11 章由孫麗萍編寫。
我們已經盡最大努力避免在文本和代碼中出現錯誤，但是由于水平有限，編寫時間倉促，書中難免出現一些疏漏和不足的地方。如果您有更多的寶貴意見，歡迎在微信公眾號：泰迪學社回復“圖書反饋”進行反饋，更多本系列圖書的信息可以在“泰迪杯”數據挖掘挑戰賽網站查閱。

內容簡介：
本書不僅講解了機器學習基本原理和基本方法，而且通過大量醫療領域的案例實現對醫療健康數據的處理和分析，能夠在很大程度上輔助醫護人員進行臨床決策。通過本書學習，讀者不僅能夠掌握機器學習算法建模前的數據準備、篩選構造機器學習算法指標的特征工程、不同類別的機器學習算法，還能夠掌握臨床診療數據、電子病歷檔案數據及影像數據等多源異構數據的處理方法，以及醫療圖像、文本等數據的讀取、預處理、可視化等知識。同時，本書還介紹了具有開源、去編程化的TipDM 數據挖掘建模平臺，通過拖曳的圖形化操作就能實現數據分析的全流程。本書可以作為醫學類院校數據科學與大數據技術專業的核心課程教材，以及醫工專業的專業核心課程或選修課程教材。在此基礎上，還可以作為臨床、口腔、醫技、檢驗、影像、公共衛生等醫學類專業進階層次的專業限選課程或拓展課程的教材。

目錄：
第1 章機器學習 ······1
1.1 機器學習簡介·····1
1.1.1 機器學習的概念····1
1.1.2 機器學習的應用領域····1
1.2 機器學習通用流程····2
1.2.1 目標分析·····2
1.2.2 數據準備·····3
1.2.3 特征工程·····4
1.2.4 模型訓練與調優····5
1.2.5 性能度量與模型應用····6
1.3 Python 機器學習工具庫簡介···6
1.3.1 數據準備相關工具庫····6
1.3.2 數據可視化相關工具庫·····7
1.3.3 模型訓練與評估相關工具庫···8
小結······9
課后習題 ······.10
第 2 章數據準備 ·····.12
2.1 數據質量校驗····.12
2.1.1 一致性校驗·····.12
2.1.2 缺失值校驗·····.15
2.1.3 異常值校驗·····.17
2.2 數據分布與趨勢探查·····.18
2.2.1 分布分析····.18
2.2.2 對比分析····.22
2.2.3 描述性統計分析·····.25
2.2.4 周期性分析·····.28
2.2.5 貢獻度分析·····.29
2.2.6 相關性分析·····.31
VIII
2.3 數據清洗·····.35
2.3.1 缺失值處理·····.35
2.3.2 異常值處理·····.38
2.4 數據合并·····.39
2.4.1 數據堆疊····.39
2.4.2 主鍵合并····.43
小結·····.45
課后習題 ······.45
第 3 章特征工程 ·····.48
3.1 特征變換·····.48
3.1.1 標準化·····.48
3.1.2 獨熱編碼····.54
3.1.3 離散化·····.55
3.2 特征選擇·····.58
3.2.1 子集搜索與評價·····.58
3.2.2 過濾式選擇·····.59
3.2.3 包裹式選擇·····.59
3.2.4 嵌入式選擇與L1 范數正則化···.60
3.2.5 稀疏表示與字典學習·····.61
小結·····.63
課后習題 ······.63
第 4 章有監督學習 ····.66
4.1 有監督學習簡介····.66
4.2 性能度量·····.66
4.2.1 分類任務性能度量····.66
4.2.2 回歸任務性能度量····.68
4.3 線性模型·····.69
4.3.1 線性模型簡介····.69
4.3.2 線性回歸····.69
4.3.3 邏輯回歸····.72
4.4 k 近鄰分類····.75
4.5 決策樹······.78
4.5.1 決策樹簡介·····.78
4.5.2 ID3 算法·····.79
4.5.3 C4.5 算法····.81
4.5.4 CART 算法····.83
4.6 支持向量機·····.86
4.6.1 支持向量機簡介·····.86
4.6.2 線性支持向量機·····.87
4.6.3 非線性支持向量機····.91
4.7 樸素貝葉斯·····.94
4.8 神經網絡·····.98
4.8.1 神經網絡介紹····.98
4.8.2 BP 神經網絡····.99
4.9 集成學習·····104
4.9.1 Bagging ····104
4.9.2 Boosting ·····106
4.9.3 Stacking ····115
小結·····116
課后習題 ······116
第 5 章無監督學習 ····118
5.1 無監督學習簡介····118
5.2 降維······118
5.2.1 PCA ····118
5.2.2 核化線性降維····121
5.3 聚類任務·····123
5.3.1 聚類性能度量指標····124
5.3.2 距離計算····125
5.3.3 原型聚類····126
5.3.4 密度聚類····137
5.3.5 層次聚類····139
小結·····142
課后習題 ······142
第 6 章智能推薦 ·····144
6.1 智能推薦簡介····144
6.1.1 推薦系統····144
6.1.2 智能推薦的應用·····144
6.2 推薦系統性能度量·····146
6.2.1 離線實驗評價指標····146
6.2.2 用戶調查評價指標····148
6.2.3 在線實驗評價指標····149
6.3 基于關聯規則的推薦技術····149
6.3.1 關聯規則和頻繁項集·····150
6.3.2 Apriori 算法·····150
6.3.3 FP-Growth 算法····154
6.4 基于協同過濾的推薦技術····159
6.4.1 基于用戶的協同過濾·····159
6.4.2 基于物品的協同過濾·····163
小結·····166
課后習題 ······167
第 7 章醫療保險的欺詐發現 ····169
7.1 目標分析·····169
7.1.1 背景····169
7.1.2 數據說明····170
7.1.3 分析目標····171
7.2 數據準備·····172
7.2.1 描述性統計分析·····172
7.2.2 數據清洗····172
7.2.3 分析投保人和醫療機構的信息···173
7.3 特征工程·····177
7.3.1 特征選擇····177
7.3.2 特征變換····178
7.4 模型訓練·····182
7.5 性能度量·····184
7.5.1 結果分析····184
7.5.2 聚類性能度量····188
小結·····190
第 8 章中醫證型關聯規則分析 ····191
8.1 目標分析·····191
8.1.1 背景····191
8.1.2 數據說明····191
8.1.3 分析目標····192
8.2 數據準備·····193
8.2.1 數據獲取····193
8.2.2 數據清洗····195
8.3 特征工程·····196
8.3.1 特征選擇····196
8.3.2 特征變換····197
8.4 模型訓練·····201
8.5 性能度量·····202
8.5.1 結果分析····203
8.5.2 模型應用····204
小結·····204
第 9 章糖尿病遺傳風險預測 ····205
9.1 目標分析·····205
9.1.1 背景····205
9.1.2 數據說明····206
9.1.3 分析目標····207
9.2 數據準備·····207
9.2.1 數據探索····207
9.2.2 數據清洗····209
9.3 特征工程·····209
9.4 模型構建·····211
9.4.1 交叉驗證····211
9.4.2 模型訓練····213
9.5 性能度量·····214
9.5.1 結果分析····214
9.5.2 模型評價····216
小結·····216
第 10 章基于深度殘差神經網絡的皮膚癌檢測····217
10.1 目標分析·····217
10.1.1 背景·····217
10.1.2 圖像數據說明·····218
10.1.3 分析方法與過程····219
10.2 圖像數據預處理····219
10.2.1 圖像預處理····219
10.2.2 查看處理后的圖像·····222
10.3 模型構建·····223
10.3.1 卷積神經網絡（CNN） ····223
10.3.2 殘差網絡（Residual Network） ···226
10.3.3 ImageDataGenerator 參數說明···228
10.3.4 訓練深度殘差神經網絡模型···229
10.4 性能度量·····231
10.4.1 性能分析·····231
10.4.2 結果分析·····232
小結·····234
第 11 章基于 TipDM 數據挖掘建模平臺實現醫療保險的欺詐發現··236
11.1 TipDM 數據挖掘建模平臺····236
11.1.1 首頁·····237
11.1.2 數據源····238
11.1.3 工程·····239
11.1.4 系統組件·····240
11.1.5 TipDM 數據挖掘建模平臺的本地化部署···241
11.2 快速構建醫療保險的欺詐發現工程····243
11.2.1 獲取數據·····244
11.2.2 數據準備·····247
11.2.3 特征工程·····250
11.2.4 模型訓練·····253
小結·····255
參考文獻 ·····256

序：