人人都會數據分析——從生活實例學統計( 簡體 字) | |
作者:謝運恩,李安富 | 類別:1. -> 程式設計 -> 綜合 |
出版社:電子工業出版社 | 3dWoo書號: 48084 詢問書籍請說出此書號! 有庫存 NT售價: 295 元 |
出版日:11/1/2017 | |
頁數:288 | |
光碟數:0 | |
站長推薦: | |
印刷:黑白印刷 | 語系: ( 簡體 字 ) |
ISBN:9787121329661 | 加入購物車 │加到我的最愛 (請先登入會員) |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社) | |
第1 章 生活在數據時代 1
1.1 數據分析無處不在 2 1.1.1 常用的國家統計指標 2 1.1.2 制造業的數據分析應用 .9 1.1.3 營銷領域的數據分析應用 13 1.1.4 醫療行業的數據分析應用 15 1.2 人人都能成為數據分析師 16 1.2.1 數據分析過程 17 1.2.2 數據分析工具 21 1.2.3 數據分析師的成長之路 26 第2 章 耳熟能詳的數據你真的了解嗎 29 2.1 數據的類型 30 2.1.1 數據的結構屬性分類 30 2.1.2 數據的連續性特征分類 . 31 2.1.3 數據的測量尺度分類 . 33 2.2 數據描述的三個維度 35 2.3 數據的集中趨勢描述 36 2.3.1 算術平均值 . 37 2.3.2 幾何平均值 . 39 2.3.3 眾數 . 40 2.3.4 中位數 . 41 2.4 數據的離散程度描述 42 2.4.1 極差 . 42 2.4.2 平均偏差 . 43 2.4.3 方差和標準差 . 44 2.4.4 變異系數 . 48 2.4.5 四分位極差 . 49 2.5 數據的分布形態描述 50 2.5.1 概率 . 50 2.5.2 概率分布 . 53 2.5.3 離散型概率分布:二項分布 . 54 2.5.4 離散型概率分布:多項分布 . 56 2.5.5 離散型概率分布:超幾何分布 . 57 2.5.6 離散型概率分布:泊松分布 . 59 2.5.7 連續型概率分布:指數分布 . 62 2.5.8 連續型概率分布:均勻分布 . 65 2.5.9 連續型概率分布:正態分布 . 66 2.5.10 正態分布作為二項分布近似 . 73 2.5.11 正態分布作為泊松分布近似 . 76 第3 章 數據分析的“內核”:推斷分析 . 79 3.1 見微知著的抽樣 80 3.1.1 抽樣的意義 . 80 3.1.2 抽樣方法 . 81 3.1.3 樣本推斷的理論基礎 . 84 3.2 數據的處理 86 3.2.1 數據處理的不良案例 . 86 3.2.2 正確的數據存儲形式 . 87 3.3 樣本到總體的橋梁:抽樣分布 88 3.3.1 抽樣分布的定義 . 88 3.3.2 ??分布 90 3.3.3 ??分布 95 3.3.4 切比雪夫定理 . 98 3.3.5 卡方(??2)分布 99 3.3.6 ??分布 100 3.4 數據分析的第一板“斧”:參數估計. 102 3.4.1 參數估計的類型 . 102 3.4.2 ??分布與總體均值的區間估計 . 104 3.4.3 ??分布與總體均值的區間估計 110 3.4.4 切比雪夫定理與總體均值的區間估計 113 3.4.5 卡方(??2)分布與總體方差的區間估計 115 3.4.6 ??分布與兩個總體方差比的區間估計 .119 3.4.7 兩個總體均值差的區間估計 . 121 3.4.8 總體比率的區間估計 . 133 3.4.9 樣本容量的確定 . 135 3.5 數據分析的第二板“斧”:假設檢驗. 142 3.5.1 假設檢驗的理論基礎 . 142 3.5.2 單樣本的假設檢驗 . 150 3.5.3 兩樣本的假設檢驗 . 159 3.5.4 多樣本的假設檢驗與方差分析 . 166 3.6 數據分析的第三板“斧”:非參數檢驗 . 184 3.6.1 非參數檢驗 . 185 3.6.2 卡方檢驗 . 187 3.6.3 ????????????????符號秩檢驗 191 第4 章 數據分析的終極目的:“為我所用” . 195 4.1 “相關”是繼續分析的前提 196 4.1.1 相關關系 . 196 4.1.2 相關分析 . 198 4.2 “回歸”是相關分析的歸宿 209 4.2.1 回歸分析綜述 . 209 4.2.2 簡單線性回歸分析 211 4.2.3 多元線性回歸分析 . 226 4.3 發現事物隨時間變化的規律 235 4.3.1 時間序列分析綜述 . 235 4.3.2 長期趨勢分析 . 238 4.3.3 季節變動趨勢分析 . 248 4.3.4 循環變動和不規則變動 . 252 4.3.5 時間序列分析應用 . 254 第5 章 給數據披上靚麗“外衣”:數據可視化 259 5.1 數據的可視化 260 5.1.1 數據可視化工具 . 260 5.1.2 常用的統計圖 . 261 5.2 條形圖、直方圖和餅圖 262 5.2.1 條形圖 . 262 5.2.2 直方圖 . 264 5.2.3 餅圖 . 266 5.3 線圖與面積圖 267 5.3.1 線圖 . 267 5.3.2 面積圖 . 267 5.4 散點圖 268 5.5 高低圖與箱線圖 270 5.5.1 高低圖 . 270 5.5.2 箱線圖 . 271 5.6 時間序列圖 272 5.7 帕累托圖 274 5.8 P-P 概率圖和Q-Q 概率圖 275 5.8.1 P-P 概率圖 275 5.8.2 Q-Q 概率圖 . 276 數據分析已經成為數據時代各行各業突破各自行業發展瓶頸的最有效手段,無論是公司職員還是個體商戶或大公司管理者,都需要有數據分析的能力。本書系統地介紹了數據分析的統計理論基礎內容,共5章。第1章闡述了數據分析在當今生活中的重要性,以及人們成為各自領域的數據分析師的必要性和學習路徑;第2章從數據描述的三個維度展開,詳細介紹了如何從集中趨勢、離散程度和分布形態對數據進行描述,從而使分析者充分了解自己手頭的數據;第3章介紹了推斷性數據統計分析的內容,介紹了如何通過樣本數據特性推斷出總體數據特征;第4章是關于預測分析內容,介紹了變量之間的相關分析,以及如何使用容易獲取的數據信息預測難以獲取的數據信息,用過去的歷史數據信息預測未來可能出現的數據信息;第5章介紹了數據結果可視化的內容,包括各種統計圖形的功能及使用場景。本書以數據分析的統計理論基礎為主題,大多數知識點都列舉了生活中的實用案例,適合高等院校學生、公司職員、個體商戶和企業管理者學習參考。
人人都應該會數據分析
數據分析已經成為數據時代各行各業突破各自行業發展瓶頸的最有效手段,無論是公司職員、個體商戶、大公司管理者都需要有數據分析的能力。很多人認為數據分析能力就是對數據進行描述和做出漂亮統計圖形的能力,這是狹隘的理解。數據分析能力的基礎在與數據分析的邏輯思維能力,而邏輯思維能力的培養必須建立在統計理論基礎之上。 統計學是數據分析的基礎 在移動互聯網時代,信息的獲取成本越來越低,這也導致拿來主義和實用主義盛行。數據分析科學是一門需要緊密聯系生活實際的科學。數據分析方法非常多,這是因為不同的數據分析環境需要選擇不同的數據分析方法來處理,因此在數據和數據分析方法之間,天然地存在鴻溝,拿來主義和實用主義經常行不通,而磨平鴻溝的方法就是學習統計理論基礎。 筆者接觸過很多希望學習數據分析或正在學習數據分析的朋友,發現他們身上都有一個通病,就是將學習各種分析軟件作為學習重點,覺得學習數據分析就是學習分析軟件操作。他們在進行具體數據分析時,通常的做法是套用別人的數據分析邏輯和方法,如果分析結果與參考結果一致,那么沒有問題,但是通常的情況是不一致,這時他們就需要浪費大量的時間和精力查找原因。而不一致的原因通常是數據情況不符合導致的,解決的辦法是根據實際的數據分析環境進行數據調整或選擇其他合適的數據分析方法,而要做到這些,歸根結底需要的還是扎實的統計理論基礎。 學習數據分析應該以統計理論基礎為主線,分析軟件僅僅是各種分析方法的實現工具,因此在開始學習時,應該附以一到兩種操作簡便的分析軟件,例如SPSS。這樣就能夠比較快速地建立統計理論框架,并掌握一款分析軟件。當你的統計理論基礎夯打扎實以后,會發現學習各種分析軟件都能夠游刃有余,甚至像R和Python這種需要編程語言的軟件也能在比較短的時間內掌握。 從生活案例開始學統計學 標準版的統計教材往往偏重于理論推導,描述語言專業嚴謹,這不可避免地帶來了晦澀難懂的問題。本書的寫作初衷就是為了解決沒有任何統計基礎的各行各業的數據分析學習者,他們學習和構建自己統計理論基礎的需求,大部分知識點都列舉了生活中的應用案例,能夠幫助學習者更好地理解和掌握各個知識點的分析邏輯,并內化為自己的統計理論基礎的知識框架。 除此之外,本書在章節設計上做了精心的安排,共包括5章。 第1章闡述了數據分析在當今生活中的重要性,以及人們成為各自領域的數據分析師的必要性和學習路徑。 第2章從數據描述的三個維度展開,詳細介紹了如何從集中趨勢、離散程度和分布形態對數據進行描述,從而使分析者充分了解自己手頭的數據。 第3章為推斷性數據統計分析的內容,介紹了如何通過樣本數據特性推斷出總體數據特征。 第4章為預測分析內容,介紹了變量之間的相關分析,以及如何使用容易獲取的數據信息預測難以獲取的數據信息,過去的歷史數據信息預測未來可能出現的數據信息。 第5章是數據結果可視化的內容,包括了各種統計圖形的功能及使用場景。 “不積跬步,無以至千里”,夯打基礎的過程總是比較乏味痛苦的,希望本書通俗的描述語言和鮮活的生活應用案例能夠幫助數據分析學習者順利的建立統計理論知識框架,形成數據分析思維邏輯,成為各自領域的佼佼者。 |