Python數據分析師修煉之道 @ 3dWoo大學簡體電腦書店

	-- 會員 / 註冊 --
帳號：　密碼：　 \| 註冊 \| 忘記密碼

4/1 新書到！ 3/25 新書到！ 12/20新書到！ 12/13 新書到！
	購書流程‧Q & A‧站務留言版‧客服信箱

│ 3ds Max│ Maya│ Rhino│ After Effects│ SketchUp│ ZBrush│ Painter│ Unity│

│ PhotoShop│ AutoCad│ MasterCam│ SolidWorks│ Creo│ UG│ Revit│ Nuke│

│ C#│ C│ C++│ Java│ 遊戲程式│ Linux│ 嵌入式│ PLC│ FPGA│ Matlab│

│ 駭客│ 資料庫│ 搜索引擎│ 影像處理│ Fluent│ VR+AR│ ANSYS│ 深度學習│

│ 單晶片│ AVR│ OpenGL│ Arduino│ Raspberry Pi│ 電路設計│ Cadence│ Protel│

│ Hadoop│ Python│ Stm32│ Cortex│ Labview│ 手機程式│ Android│ iPhone│


可查書名,作者,ISBN,3dwoo書號		詳細書籍分類

Python數據分析師修煉之道
( 簡體字)

作者：[美] 阿爾瓦羅?富恩特斯著類別：1. -> 程式設計 -> Python

譯者：劉璋譯

出版社：清華大學出版社 3dWoo書號： 51282
詢問書籍請說出此書號！
【缺書】
NT售價： 345 元

出版日：6/1/2019

頁數：122

光碟數：0

站長推薦：

印刷：黑白印刷語系： ( 簡體版 )

加入購物車 │加到我的最愛
(請先登入會員)

ISBN：9787302530169

作者序　|　譯者序　|　前言　|　內容簡介　|　目錄　|　序

(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)

作者序：

譯者序：

前言：
Python是高級數據分析師和統計人員所用的最常見和最流行的語言之一，可用于處理大型數據集和復雜的數據可視化任務。
本書介紹了Python語言中的核心工具和庫，以幫助讀者與數據分析處理過程協同工作、準備相關數據以執行簡單的統計學分析，進而構建具有實際意義的數據可視化結果。本書將討論Python語言中的各種庫，如NumPy、pandas、matplotlib、seaborn、SciPy和scikit-learn，并將其應用于實際數據分析和統計示例中。在閱讀過程中，讀者將會領略到如何高效地使用Jupyter Noyebook，并借助于NumPy和landas庫對數據進行操控。此外，還將利用Python庫實現簡單的預測模型、統計計算-分析和數據分析技術。
在閱讀完本書后，讀者在基于Python的數據分析方面將具備較為豐富的經驗。
適用讀者
本書面向初級數據分析師、數據工程師和BI專業人員，他們希望使用Python工具執行高效的數據分析。要理解本書所涉及的概念，讀者應具備Python編程方面的一些背景知識。
本書內容
第1章：Anaconda和Jupyter Notebook。本章介紹了Python中一些較為重要的數據科學庫，并對Python預測分析所用的主要對象、屬性、方法和函數進行了整體描述。
第2章：NumPy向量計算。本章討論NumPy庫，這也是Python項目中幾乎全部科學計算所使用的庫。學習如何使用NumPy數組，對于Python數據科學來說十分重要。
第3章：數據分析庫pandas。本章將整體介紹pandas庫。對于Python編程語言來說，pandas庫提供了高性能、易于使用的數據結構和分析工具，因而受到了數據科學家以及Python社區開發者的喜愛。本章將通過相關示例展示如何利用pandas執行描述性分析。
第4章：可視化和數據分析。本章將考查數據科學的可視化效果。Python針對不同的功能提供了多種可視化選項。本章將學習兩種最為流行的庫，即matplotlib和seaborn，并面向真實數據集執行探索性數據分析。
第5章：Python統計計算。本章解釋了如何利用Python執行統計計算，并據此考查包含青少年飲酒信息的數據集。
第6章：預測分析模型。本章簡要介紹了預測分析，并通過構建一個模型對青少年的飲酒習慣進行預測。
資源下載
本書將引領讀者整體了解Python中的數據分析過程、Python數據科學棧中的主要庫，并討論如何使用各種Python工具有效地分析、可視化和處理數據。
讀者可訪問http://www.packtpub.com并通過個人賬戶下載示例代碼文件。另外，在http://www.packtpub.com/support中注冊成功后，我們將以電子郵件的方式將相關文件發與讀者。
讀者可根據下列步驟下載代碼文件。
（1）訪問www.packtpub.com，利用電子郵件地址和密碼登錄，或注冊。
（2）選擇SUPPORT選項卡。
（3）單擊Code Downloads & Errata。
（4）在Serach文本框中輸入書名。
當文件下載完畢后，確保使用下列最新版本軟件解壓文件夾。
? Windows系統下的WinRAR/7-Zip。
? Mac系統下的Zipeg/iZip/UnRarX。
? Linux系統下的7-Zip/PeaZip。
另外，讀者還可訪問GitHub獲取本書的代碼包，對應網址為https://github.com/ PacktPublishing/Become-a-Python-Data-Analyst。此外，讀者還可訪問https://github.com/ PacktPublishing/，以了解豐富的代碼和視頻資源。
下載彩色圖像
另外，我們還進一步提供了本書所用截圖/圖表的彩色圖像，讀者可訪問http://www. packtpub.com/sites/default/files/downloads/BecomeaPythonDataAnalyst_ColorImages.pdf進行下載。
本書約定
本書通過不同的文本風格區分相應的信息類型。下面通過一些示例對此類風格以及具體含義的解釋予以展示。
代碼塊如下所示。

# The largest heading
## The second largest heading
###### The smallest heading

當某個代碼塊希望引起讀者的足夠重視時，一般會采用黑體表示，如下所示。

[default]
exten => s,1,Dial(Zap/1|30)
exten => s,2,Voicemail

(u100)
exten => s,102,Voicemail(b100)
exten =>

i,1,Voicemail(s0)

圖標則表示較為重要的說明事項。
圖標則表示提示信息和操作技巧。
讀者反饋和客戶支持
歡迎讀者對本書的建議或意見予以反饋。對此，讀者可向feedback@packtpub.com發送郵件，并以書名作為郵件標題。若讀者對本書有任何疑問，均可發送郵件至questions@packtpub.com，我們將竭誠為您服務。若讀者針對某項技術具有專家級的見解，抑或計劃撰寫書籍或完善某部著作的出版工作，則可訪問www.packtpub.com/authors。
勘誤表
盡管我們在最大程度上做到盡善盡美，但錯誤依然在所難免。如果讀者發現謬誤之處，無論是文字錯誤抑或是代碼錯誤，還望不吝賜教。對此，讀者可訪問http://www.packtpub.com/ submit-errata，選取對應書籍，然后單擊Errata Submission Form超鏈接，并輸入相關問題的詳細內容。
版權須知
一直以來，互聯網上的版權問題從未間斷，Packt出版社對此類問題異常重視。若讀者在互聯網上發現本書任意形式的副本，請告知網絡地址或網站名稱，我們將對此予以處理。關于盜版問題，讀者可發送郵件。

內容簡介：
本書詳細闡述了與Python數據分析相關的基本解決方案，主要包括Anaconda和Jupyter Notebook、NumPy向量計算、數據分析庫pandas、可視化和數據分析、Python統計計算、預測分析模型等內容。此外，本書還提供了相應的示例、代碼，以幫助讀者進一步理解相關方案的實現過程。
本書既可作為高等院校計算機及相關專業的教材和教學參考書，也可作為相關開發人員的自學教材和參考手冊。

目錄：
第1章Anaconda和JupyterNotebook1
1.1Anaconda1
1.2JupyterNotebook3
1.2.1創建自己的JupyterNotebook3
1.2.2JupyterNotebook用戶界面4
1.3使用JupyterNotebook5
1.3.1在代碼單元格中運行代碼5
1.3.2在文本單元格中運行markdown語法6
1.3.3鍵盤快捷操作9
1.4本章小結10
第2章NumPy向量計算11
2.1NumPy簡介11
2.2NumPy數組13
2.2.1在NumPy中創建數組13
2.2.2數組的屬性16
2.2.3數組中的基本數學運算17
2.2.4數組的常見操作19
2.3使用NumPy進行模擬23
2.3.1投擲硬幣23
2.3.2模擬股票收益25
2.4本章小結27
第3章數據分析庫pandas29
3.1pandas庫29
3.1.1導入pandas中的對象30
3.1.2Series30
3.1.3創建pandas中的Series31
3.1.4DataFrame34
3.1.5創建pandasDataFrame35
3.1.6剖析DataFrame36
3.2pandas操作37
3.2.1檢查數據37
3.2.2數據的選取、添加和刪除37
3.2.3DataFrame切片40
3.2.4基于標記的選擇操作40
3.3數據集42
3.3.1數據集中按部門劃分的員工數量42
3.3.2員工的流失率42
3.3.3平均時薪43
3.3.4平均工作年限43
3.3.5任職時間最長的員工44
3.3.6員工的整體滿意度44
3.4進一步思考46
3.4.1低滿意度員工46
3.4.2低工作滿意度和低工作參與度的員工47
3.4.3員工比較48
3.5本章小結53
第4章可視化和數據分析55
4.1matplotlib簡介55
4.2pyplot簡介58
4.3面向對象接口64
4.4常見的自定義方式70
4.4.1顏色70
4.4.2限定坐標軸71
4.4.3設置刻度和刻度標記71
4.4.4圖例73
4.4.5標注74
4.4.6生成網格、水平線和垂直線75
4.5基于seaborn和pandas的EDA76
4.5.1seaborn庫76
4.5.2執行探索性數據分析77
4.5.3核心目標78
4.5.4變量類型78
4.6單獨分析變量79
4.6.1理解主變量80
4.6.2數值變量81
4.6.3類別變量83
4.7變量間的關系86
4.7.1散點圖86
4.7.2箱形圖89
4.7.3復雜的條件圖92
4.8本章小結94
第5章Python統計計算95
5.1SciPy簡介95
5.1.1統計子包95
5.1.2置信區間98
5.1.3概率計算100
5.2假設測試101
5.3執行統計測試102
5.4本章小結107
第6章預測分析模型109
6.1預測分析和機器學習109
6.2理解scikit-learn庫110
6.3使用scikit-learn構建回歸模型113
6.4利用回歸模型預測房屋價格118
6.5本章小結122

序：