揭開數據真相:從小白到數據分析達人 ( 簡體 字) |
作者:李芳 | 類別:1. -> 程式設計 -> 綜合 |
譯者: |
出版社:電子工業出版社 | 3dWoo書號: 45369 詢問書籍請說出此書號!【有庫存】 NT售價: 345 元 |
出版日:10/1/2016 |
頁數:220 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787121299537 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言:引 言 “數學是宇宙與人類交流及吐露真相的方式。” ——伽利略 “數學比其他任何在人類社會中傳承的知識結構更 為強大有力。” ——笛卡兒 “數字是最高級別的知識。它就是知識本身。” ——柏拉圖 統計之所以如此美麗、如此強大有力,原因在于它對我們的希望、夢 想和信仰無動于衷——統計讓我們客觀地看待事物。可惜,統計數據常常 被當作裁判,當我們不喜歡統計數據告訴我們的結果時,我們可以與之辯 論,對其操縱。下面的實例提醒我們,忽視統計數據傳遞的信息極為危險。 1999 年,一家大型制藥企業的一種名為萬絡(Vioxx)的轟動一時的止 痛藥物進入最后試驗階段。萬絡能止痛,卻不像阿司匹林那樣會引發胃腸 道并發癥,它前途無量,不僅有可能幫助成千上萬的人,而且能為制藥廠 賺取數十億元的真金白銀。 引 言 XI 制藥公司明白,必須小心對待萬絡的最終試驗——尤其必須要小心選 擇萬絡的競爭藥物,經過深思熟慮,制藥公司決定選擇?普生(Aleve)作 為試驗競爭藥物(因為這種藥物對心臟病是否有防護作用還未知)。 9 個月以后,經過對臨床數據進行分析,得出了驚人的結果!服用萬 絡的試驗組發作心臟病的次數是服用?普生的試驗組發作心臟病的次數的 4 倍。統計結果提供的信息非常清楚——萬絡是心臟病發作的重大原因, 這一點可能性很大。 可惜,解釋統計數據的人往往做不到或不愿意客觀地審視統計數據, 他們很容易受到才能、意愿和貪婪的影響。因此,研究結論未指出萬絡導 致心臟病發病風險提高400%,而是指出?普生導致心血管疾病的發病率降 低80%。這個解釋讓人難以置信,因為,前面已經提到,?普生不像阿司 匹林,它對心臟的保護作用尚未可知。實際上,如果?普生確實能將心臟 病發病風險降低80%,那么它的效果將達到阿司匹林的2∼3 倍! 盡管臨床實驗清楚地表明萬絡存在危險,萬絡還是得到美國食品和藥 品管理局(FDA)的批準,隨后被數百萬人選用。4 年以后,萬絡從市場 上被撤下,然而這時它引發的心臟病以及死亡人數已經令人膽寒。FDA 估 計萬絡引發了88 000 至139 000 例心臟病——其中30%∼40%致命。1 在萬絡/?普生研究中得到的統計值顯示出清晰的信息,但這些信息遭 到忽視,造成千上萬人死去。 揭穿數據謊言 XII 這些話是伽利略、笛卡兒、柏拉圖對數學的力量的真知灼見。統計的 力量在我們的社會中已經作用了數百年;使用得當時,這種力量有可能拯 救數百萬人的性命。可惜,“統計警告”被歪曲、操縱、最小化的例子不勝 枚舉。這種知識和道德上的失敗所造成的結果是——數百萬人喪失本來不 必喪失的生命。 我們對于下列問題的統計警告實在反應太慢: ? 煙草 ? 石棉 ? 苯 ? 萬絡 ? 胃藥 ? 鉛 ? 賴式綜合癥/阿司匹林關系 ? 酒精 “數學是宇宙與人類交流及吐露真相的方式。” ——伽利略 “數學比其他任何在人類社會中傳承的知識結構 更為強大有力。” ——笛卡兒 “數字是最高級別的知識。它就是知識本身。” ——柏拉圖 引 言 XIII 由于濫用、操縱統計數據造成的慘劇不應該致使我們相信——統計永 遠會被操縱,永遠無用,永遠不可信。每一例不恰當使用統計的意外事件 總是對應著上百例公正、合理使用統計的實例——這給社會帶來極大好處。 下列5 個實例向我們展示了統計的有利用途: ? 有一個統計模型幫助人們在18 個月里防止了100 000 多例由于醫院 過錯導致的死亡。 ? 奧克蘭運動家隊聘用隊員的薪水差不多是業界最低的,卻依靠統計 成為最佳棒球隊之一。 ? 事實證明,一個數學公式比一群專業品酒師能更準確地預測出葡萄 酒的質量。 ? 一個統計模型比一群全國著名的法律專家能更準確地預測出最高 法院的投票結果。 ? 統計被用于幫助急診室醫生做出更好的判斷。 統計具有改善我們生活的能力,因此,懂得如何使用統計是我們的基 本要求。此外,由于操縱、欺詐和徹頭徹尾的謊言常常伴隨統計登場,懂 得解釋統計數據,對各種歪曲、濫用數據的技術有所了解也非常必要。 在閱讀本書的過程中,有一些例子可能會引讀者發笑,有一些則令讀 者憤慨。我希望,在讀完本書后,讀者不僅懂得如何質疑自己看見的統計 數據,而且能夠明白:統計學習并非人們常說的那樣枯燥、乏味。 揭穿數據謊言 XIV 別擔心,要是別的辦法都失敗了,我們 可以操縱數據,讓它看上去能飛。 |
內容簡介:統計數據之所以強大有力,原因在于它對我們的希望、夢想和信仰無動于衷——數據讓我們客觀地看待事物。不過,當人們不喜歡數據告訴我們的結果時,常常對其進行操縱……因此懂得解釋統計數據,了解各種歪曲、濫用數據的技術對于理解數據真相是非常必要的。本書教給讀者神圣的技術,讓你學會如何質疑“看得見”的數據,并挖出“看不見”的數據真相,還原基本的事實。 |
目錄:引 言 ........... X 第1 章 幾乎不可信的各種圖形 ......... 1 燕麥的降膽固醇功效 .......... 1 美化上升的犯罪率(純屬虛構) ....... 4 哪家汽車制造公司更棒? ......... 8 條形圖中的黨派差異 ........ 10 在線廣告衰退正式開始 ........ 12 美化SAT 成績 .......... 17 美國中西部生熱燃料消費價格飛漲 ...... 20 交通事故死亡人數減少了嗎? ....... 24 惡化房地產低迷狀況 ........ 25 超大號熊貓金幣 .......... 27 吊頂條形圖的巧妙騙術 ........ 28 第2 章 所比較的群體旗鼓相當嗎? ....... 31 加利福尼亞州是否比伊拉克更危險? ...... 31 全球變暖和聳人聽聞的颶風損失 ....... 33 揭穿數據謊言 VI 某中西部城市學習成績飆升的表象 ...... 36 租金輔助計劃與犯罪率上升有關系嗎? ...... 41 第3 章 先射箭,再畫靶 .......... 45 冥想實驗 ........... 46 關節炎患者的天大好消息——或者相反 ..... 48 舊車換現金計劃“慘敗” ......... 49 民意調查公司/智庫合作關系 ........ 51 杰·雷諾居然也操縱統計數據 ....... 54 第4 章 誠實統計的力量 .......... 56 忽視統計警告,喪失4000 條生命 ...... 56 數學對陣專業品酒師 ........ 58 數學對陣法律專家 .......... 60 統計——18 個月挽救100000 條性命 ....... 62 統計——幫助急診室醫生做出更好的判斷 ..... 64 統計——提高棒球隊成績?(棒球星探對陣計算機) .... 65 統計的早期利用,挽救數千生命 ....... 67 第5 章 故施迷霧 ........... 69 辛普森案 ........... 69 雷氏綜合征如何導致數百例兒童死亡——這本來可以避免! . 73 導致年輕女子中風的厭食劑 ....... 74 煙草行業——統計操縱與故布迷陣的行家里手 ..... 75 石棉:壽險公司所知道的、石棉行業故作不知的危險 .... 79 目 錄 VII 第6 章 資助效應 ........... 83 錢能控制數據,錢能限制公眾得知負面結果 ..... 83 制藥公司刻意壓制負面數據后果可能很嚴重 (抗抑郁藥物帕羅西汀的故事) ....... 85 錢可以影響醫生,可以給醫生帶來偏見 ...... 87 抗抑郁劑與安慰劑——出人意料的勝出者 ..... 88 資助效應甚至會傷害新生兒重癥監護室中最易受傷害的兒童. 90 第7 章 爛邏輯 ........... 93 新款雪佛蘭福特汽車的驚人燃油效率230 英里每加侖 .... 93 為什么患糖尿病的人越來越多? ....... 95 到2048 年,每一個美國人的體重都會超重 ..... 96 解開謎團:為什么加拿大人的預期壽命比美國高 ... 98 夸張的廣告 ........... 99 非常奇怪的邏輯 .......... 101 第8 章 因果與相關亂象 ........ 103 恢復前囚犯的投票權將降低犯罪率 ...... 104 因果關系混淆會導致喪失生命 ....... 108 學習成績好的關鍵是讓家長出席家長會 ...... 112 音樂與學習成績 .......... 113 第9 章 要看就看全部數據 ......... 116 選舉奧巴馬總統搞垮了股市 ....... 116 廣告商與有選擇地使用數據 ....... 119 您會選擇哪家賓館? ........ 121 揭穿數據謊言 VIII 我該買黃金嗎? .......... 123 有可能遭到操縱的合理圖形 ....... 125 第10 章 確認性偏差(所愿即所見) ....... 128 星座效應 ........... 128 預測死亡的貓 ......... 130 分母在哪里? ......... 133 畫中音樂 ........... 137 《秘密》 ........... 141 確認性偏差的負面特性 ........ 144 輔助溝通 ........... 148 第11 章 稻草人論證術 .......... 152 醫療保健辯論策略 .......... 152 2010 年煤礦爆炸以及首席執行官的稻草人辯護術 .... 156 第12 章 操縱均值、中位數和眾數 ....... 161 第13 章 軼事證據 ......... 168 疾病與軼事證據 .......... 169 磁療 ............ 171 占卜杖探測術 ......... 172 外星人奇遇 ........... 174 結論 ............ 176 第14 章 如果你的事業缺乏統計支持,那么,創造吧 ... 177 潛意識廣告的力量 .......... 177 目 錄 IX 死亡率畸高的神經性厭食癥 ....... 179 美國的300 萬名無家可歸者 ....... 180 其他影響公眾的錯誤統計 ....... 181 第15 章 令人費解的百分數 ........ 183 被百分數愚弄的醫生 ........ 183 住家孩子增長趨勢 .......... 184 移民家庭的刻苦孩子 ........ 185 需求神秘下降500% ........ 187 我當初真應該別開始鍛煉 ....... 188 了解百分數可以救人性命 ....... 191 第16 章 你的樣本合理嗎? ........ 195 代表性樣本的重要性 ........ 195 總統大選:羅斯福與蘭登 ....... 197 當研究參與人自我選擇或樣本有偏差,則結果幾乎總是無效的 . 198 雙盲的重要性,隨機臨床實驗 ....... 200 檢驗組大小的重要性 ........ 202 注釋 ............ 204 |
序: |