白話統計 ( 簡體 字) |
作者:馮國雙 | 類別:1. -> 程式設計 -> 綜合 |
譯者: |
出版社:電子工業出版社 | 3dWoo書號: 48470 詢問書籍請說出此書號!【缺書】 NT售價: 345 元 |
出版日:1/1/2018 |
頁數:296 |
光碟數:0 |
|
站長推薦: |
印刷:全彩印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787121335181 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言:序 宋代禪宗大師青原行思曾提出參禪的三重境界:參禪之初,看山是山,看水是水;禪有悟時,看山不是山,看水不是水;禪中徹悟,看山仍是山,看水仍是水。統計學的學習過程何嘗不是這樣:初學統計時,看到一種方法,覺得就是這種方法,如學到t檢驗,覺得t 檢驗就是用于兩組均值比較的方法;經過一段時間的學習,突然發現原來看過的方法并不是所想的那樣,如在線性回歸中也看到了t 檢驗的身影,這時覺得t 檢驗不再是自己想象中的t 檢驗了;再經過一段時間的學習,就會明白方法還是原來的方法,所謂的疑惑只是自己心動而已,這時就真正理解了t 檢驗的含義,而不再把它當作一種固定于特定場合的檢驗方法。 對于統計學初學者而言,通過課堂老師的講授,不難達到第一種境界;然后通過接觸各種資料,慢慢就會發現各種方法跟課堂上所講可能有所不同,剪不斷,理還亂,逐漸進入第二種境界;此時,如果不能厘清思路,則很容易陷入迷惑和混亂,想達到第三種境界就難上加難了。當然,你可以充分利用網絡資源查找各種信息,從而為自己解惑。然而這種資源雖然多,但較為零散,而且可能會看到眾說紛紜的情況,使得你更加凌亂。幸運的是,馮國雙博士的這本《白話統計》以通俗、幽默的語言深入淺出地介紹了統計學中的各種概念和思想,為很多人消除了留在心中多年的存疑,可以在這一階段幫助讀者答疑解惑。其中有些內容曾經發布在微信公眾號“小白學統計”中,也因此受到了很多網友的好評。 目前,歐美有不少類似白話介紹統計方法之類的書籍,這類書的特點是:不像教材那樣用沉重、拘謹的語言來介紹統計學方法,而是以風趣、淺顯的話語來解釋說明;內容不一定多,但盡量深入。相比之下,國內的這類書籍并不多見,在生物統計學領域尤其缺乏。這就導致很多非統計學專業人士覺得統計學“面目可憎”,始終無法真正喜歡上統計學。可喜的是,目前逐漸成長起來的年輕的統計學家已經意識到這一問題,馮博士的這本《白話統計》正是讓統計學盡量接地氣的一種有益嘗試。 《白話統計》凝結了作者十多年來對統計學的理解,采用別具一格的編寫理念和思路,對各種方法的介紹不再是介紹方法本身,而是試圖將各種方法之間的聯系闡述清楚;不再是介紹方法如何計算出結果,而是盡量說明方法背后的思想。本書對基本概念和方法的介紹沒有采用教材中非常嚴謹的語言,而是盡可能用白話來解釋說明。例如,在介紹累積分布和概率密度時,用到了《神雕俠侶》中的情節;在介紹假設檢驗思想時,用到了“女士品茶”的故事;在介紹中心極限定理時,采用了里約奧運會期間的一則虛擬故事。這不僅使得抽象理論形象化、復雜問題簡單化,也增加了本書的趣味性和可讀性,體現了作者深厚的理論功底和豐富的實踐經驗。 在此,我把《白話統計》這本著作推薦給各位讀者,無論是初學者、統計學專業人士,還是統計學應用工作者,相信都能從中獲益。
陳 峰 南京醫科大學教授 |
內容簡介:一本書如果沒有作者自己的觀點,而只是知識的堆疊,那么這類書是沒有太大價值的。尤其在當前網絡發達的時代,幾乎任何概念和知識點都可以從網絡上查到。但是有一點你很難查到,那就是統計分析的思路和觀點。比如,你可以很容易地在網上查到什么是線性回歸,但你卻查不到怎么“做”線性回歸分析,在你遇到實際數據時仍然不知道如何分析。在《白話統計》中,你可以獲得這些思路和觀點。盡管這些觀點未必是所有人都認可的,但根據筆者多年的分析經驗,它們在實踐中通常是奏效的。《白話統計》凝結了作者十多年來對統計分析的理解,對各種方法的介紹采用全新的理念和思路,不再是介紹方法本身,而是試圖將各種方法之間的聯系闡述清楚;不再是介紹方法如何計算出結果,而是盡量說明方法背后的思想。當然,本書同時提供了如何實現結果的軟件(涉及Excel、SAS、R、JMP、SPSS 等)操作。 |
目錄:第 1 篇 基礎篇 第1 章 為什么要學統計 2 1.1 統計學有什么用 3 1.2 生活世事皆統計 4 1.3 如何學統計 4
第 2 章 變異——統計學存在的基礎 6 2.1 隨機與變異 6 2.2 特朗普與羅斯福的勝出——抽樣調查到底可不可靠 8 2.3 什么是抽樣誤差 9
第 3 章 郭靖的內力能支撐多久——談概率分布 11 3.1 累積分布與概率密度的通俗理解 12 3.2 是生存還是死亡?這是一個問題——用Weibull 分布尋找生存規律 16 3.3 2003 年的那場SARS——用Logistic 分布探索疾病流行規律 20 3.4 “普通”的正態分布 23 3.5 幾個常用分布——t 分布、χ2 分布、F 分布 28
第 4 章 關于統計資料類型的思考 35 4.1 計數資料等于分類資料嗎 36 4.2 計數資料可否采用連續資料的方法進行分析 37 4.3 分類資料中的無序和有序是如何確定的 38 4.4 連續資料什么時候需要轉換為分類資料 39 4.5 連續資料如何分組——尋找cut-off 值的多種方法 41 4.6 什么是虛擬變量/啞變量 47
第 5 章 如何正確展示你的數據 52 5.1 均數和中位數——你被平均了嗎 53 5.2 方差與標準差——變異的度量 54 5.3 自由度——你有多少自由活動的范圍 56 5.4 百分位數——利用百分數度量相對位置 57 5.5 如何比較蘋果和橘子——利用Z 值度量相對位置 59 5.6 某百歲老人調查報告說:少運動才能活得久——談一下比例和率 61 5.7 在文章中如何正確展示百分比 63
第 6 章 尋找失蹤的運動員——中心極限定理 64 6.1 中心極限定理針對的是樣本統計量而非原始數據 65 6.2 樣本量大于30 就可以認為是正態分布了嗎 67
第 7 章 從“女士品茶”中領會假設檢驗的思想 70 7.1 女士品茶的故事 70 7.2 零假設和備擇假設 . 72 7.3 假設檢驗中的兩類錯誤 73 7.4 P 值的含義 76 7.5 為什么P 值小于0.05(而不是0.02)才算有統計學意義 78 7.6 為什么零假設要設定兩組相等而不是兩組不等 79
第 8 章 參數估計——一葉落而知秋 81 8.1 點估計 .81 8.2 最小二乘估計 82 8.3 最大似然估計 84 8.4 貝葉斯估計 86
第 9 章 置信區間估計——給估計留點余地 88 9.1 置信區間的理論與實際含義 88 9.2 置信區間與P 值的關系 90 9.3 利用標準誤計算置信區間 91 9.4 利用Bootstrap 法估計置信區間 . 92
第 2 篇 實用篇 第10 章 常用統計方法大串講 98 10.1 一般線性模型——方差分析與線性回歸的統一 99 10.2 廣義線性模型——線性回歸與Logistic 回歸的統一 103 10.3 廣義可加模型——脫離“線性”束縛 107 10.4 多水平模型——打破“獨立”條件 112 10.5 結構方程模型——從單因單果到多因多果 119
第 11 章 正態性與方差齊性 .127 11.1 用統計檢驗方法判斷正態性 127 11.2 用描述的方法判斷正態性 130 11.3 方差分析中的方差齊性判斷 .133 11.4 理解線性回歸中的方差齊性 135
第 12 章 t 檢驗——不僅是兩組比較 .138 12.1 從另一個角度來理解t 檢驗 138 12.2 如何正確應用t 檢驗 140 12.3 t 檢驗用于回歸系數的檢驗 141 12.4 t 檢驗的替代——Wilcoxon 秩和檢驗 142
第 13 章 方差分析與變異分解 145 13.1 方差分析中變異分解的思想 145 13.2 為什么回歸分析中也有方差分析 147 13.3 鐵打的方差分析,流水的實驗設計 148 13.4 方差分析后為什么要進行兩兩比較 152 13.5 多重比較方法的選擇建議 154 13.6 所有的多組都需要做兩兩比較嗎——兼談固定效應和隨機效應 164 13.7 重復測量方差分析詳解 166 13.8 方差分析的替代——Kruskal-Wallis 秩和檢驗 176 13.9 多組秩和檢驗后的兩兩比較方法 178
第 14 章 卡方檢驗——有“卡”未必走遍天下 181 14.1 卡方檢驗用于分類資料組間比較的思想 181 14.2 卡方用于擬合優度評價——從Hardy-Weinberg 定律談起 184 14.3 似然比χ2、M-H χ2、校正χ2 與Fisher 精確檢驗 186 14.4 等級資料到底可不可以用卡方檢驗 191 14.5 卡方檢驗的兩兩比較 193 14.6 Cochran-Armitage 趨勢檢驗 194 14.7 分類變量的賦值是如何影響分析結果的 196
第 15 章 相關分析與一致性檢驗 200 15.1 從協方差到線性相關系數 200 15.2 線性相關系數及其置信區間 203 15.3 如何比較兩個線性相關系數有無差異 206 15.4 分類資料的相關系數 207 15.5 基于秩次的相關系數 210 15.6 相關分析中的幾個陷阱 213 15.7 用ICC 和CCC 指標判斷一致性 215 15.8 用Bland-Altman 圖判斷一致性 218 15.9 Kappa 檢驗在一致性分析中的應用 219
第 16 章 線性回歸及其分析思路 .222 16.1 殘差——識別回歸模型好壞的關鍵 223 16.2 回歸系數的正確理解 226 16.3 回歸系數檢驗VS 模型檢驗 227 16.4 均值的置信區間VS 個體的預測區間 228 16.5 逐步回歸篩選變量到底可不可靠——談變量篩選策略 230 16.6 如何評價模型是好還是壞——交叉驗證思路 237 16.7 線性回歸的應用條件——你的數據能用線性回歸嗎 240 16.8 如何處理非正態——Box-Cox 變換 247 16.9 如何處理非線性——Box-Tidwell 變換 248 16.10 方差不齊怎么辦——加權最小二乘法 250 16.11 當共線性導致結果異常時怎么辦——嶺回歸、Lasso 回歸 .254 16.12 發現異常值應該刪除嗎——談幾種處理異常值的方法 .260 16.13 如何處理缺失值——是刪除還是填補 268 16.14 一個非教材的非典型案例——線性回歸的綜合分析 276 |
序: |