如虎添翼:數據處理的SPSS和SAS EG實現(第2版) ( 簡體 字) |
作者:經管之家 | 類別:1. -> 工具書、軟體 -> 統計軟體 |
譯者: |
出版社:電子工業出版社 | 3dWoo書號: 44020 詢問書籍請說出此書號!【缺書】 NT售價: 295 元 |
出版日:5/1/2016 |
頁數:280 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787121285325 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言:序言:這是一個用數據說話的時代 在CDA(注冊數據分析師)Level I 級教材付諸印刷之際,關于數據分析這個職業及其價值的報道就有很多,比如,下面兩條報道就充分體現了在大數據時代下,數據分析的價值。這在以前是從來沒有過的。 LinkedIn 的最新投票結果顯示,“統計分析和數據挖掘” 是2014 年最大的求職法寶。LinkedIn對全球超過3.3 億用戶的工作經歷和技能進行分析,公布2014 年最受雇主喜歡、最炙手可熱的25項技能,其中位列榜首的是統計分析和數據挖掘。 麥肯錫公司的一份研究預測稱,到2018 年,在“具有深入分析能力的人才”方面,美國可能面臨著14 萬到19 萬人的缺口,而“可以利用大數據分析來做出有效決策的經理和分析師”缺口則會達到150 萬人。 早在2010 年2 月,肯尼斯?庫克爾在《經濟學人》上發表了一份關于管理信息的特別報告——《數據,無所不在的數據》,文中寫道:“世界上有著無法想象的巨量數字信息,并以極快的速度增長……從經濟界到科學界,從政府部門到藝術領域,很多地方都已感受到了這種巨量信息的影響。”2011 年,麥肯錫發布了《大數據:下一個具有創新力、競爭力與生產力的前沿領域》,使人們在篇文章里認識到了數據的力量,于是,一夜之間,面向數據分析市場的新產品、新技術、新服務、新業態正在不斷涌現。從個人、企業到國家層面,都把數據作為一種重要的戰略資產,逐漸認識到了數據的價值,不同程度地滲透到每個行業領域和部門,大大提升了企業的經營利潤,推動了經濟的發展。 這是一個用數據說話的時代,也是一個依靠數據競爭的時代。目前世界500 強企業中,有90%以上都建立了數據分析部門。IBM、微軟、Google 等知名公司都積極投資數據業務,建立數據部門,培養數據分析團隊。各國政府和越來越多的企業意識到數據和信息已經成為企業的智力資產和資源,數據的分析和處理能力正在成為日益倚重的技術手段。 作為一個數學和統計學的強國,數據分析、數據挖掘和大數據價值挖掘行業在我國仍屬于朝陽行業,數據分析人才仍然比較稀缺。各行各業在平常工作中積累的各種各樣的數據分析問題仍然沒有得到及時有效地解決,有些問題,還是關乎本行業發展的至關重要的問題。數據積累越來越多,期待解決分析的數據問題也越來越多,人們逐漸習慣的使用數據作為決策的重要參考依據。據艾瑞的研究報告,未來與數據分析相關的就業崗位會在1000 萬左右,而目前來說國內合格的數據分析師不足5 萬左右,建立一個科學有效的數據分析師培訓體系迫在眉睫。 在這樣一個用數據說話的時代,積累了豐富的數據分析培訓經驗的人大經濟論壇承擔起使命,幾番調查研究,幾番反復推演論證,在2013 年,這個大數據的“元年”,CDA 注冊數據分析師應運而生! 2003 年,人大經濟論壇依托中國人民大學成立,在金融、管理、統計領域已積淀11 個年頭,在國內享有良好聲譽。 2006 年,人大經濟論壇數據分析培訓中心設立,至今經歷8 個春秋,建立了大陸、臺灣一線師資團隊,培養人才已達3 萬余人。 2013 年,“中國數據挖掘與數據分析俱樂部CDMC”在人大經濟論壇旗下成立,2014 年改名為“中國數據分析師俱樂部CDA”。來自政府、金融、電信、零售、電商、互聯網、教育等行業人士加入會員,成功舉辦了數十場行業聚會。緊接著,積累了數據分析培訓豐富經驗的人大經濟論壇在國內展開CDA 數據分析師系統培訓和認證考試,成功見證了1000 余名數據分析師的成長。 2015 年,人大經濟論壇將提供高水平、多層次的數據分析培訓服務,以在行業積累 多年的影響力,吸引更好更多的優秀師資,瞄準行業內重要的數據分析問題和難點,攻堅突破,建立更加規范的行業培訓體系,引領數據分析培訓行業向規范化、有效化和前瞻化方向發展,為數據分析培訓做出應有的貢獻。 其實,數學(含統計)和英語一樣重要,都是人們不可或缺的重要技能。既然英語全民這么重視,數學及其數據分析的技能更加需求于方方面面,更應被做大做強。讓我們共同期待人大經濟論壇辦成另一個數據的“新東方”!
前言 感謝您選擇“CDA 數據分析師”Level I 學習系列叢書之《如虎添翼!數據處理的SPSS 和SASEG 實現(第2 版)》。 該叢書按照數據分析師規范化學習體系而定,對于一名初學者,應該先掌握必要的概率、統計理論基礎,包括描述性分析、推斷性分析、參數估計、假設檢驗、方差分析、回歸分析等內容,這在第一本書《從零進階!數據分析的統計基礎(第2 版)》中進行了專業詳細的講解。其次,數據分析需要按照標準流程進行,即數據的獲取、儲存、整理、清洗、歸約等系列數據處理技術,這在《如虎添翼!數據處理的SPSS 和SAS EG 實現(第2 版)》中利用SAS EG、SPSS 和編程技術進行了操作過程的詳解。最后,經過處理的數據需要根據業務問題,利用相關方法進行建模分析,得出結果,結果檢驗,繪制圖表并解讀數據,這在《胸有成竹!數據分析的SPSS 和SAS EG 進階(第2 版)》中進行了詳細的講解和操作分析。 CDA 數據分析師叢書整體風格是“理論>技術>應用”的一個學習過程,最終目的在于商業業務應用、職場數據分析,為欲從事于數據分析領域的各界人士提供了一個規范化數據分析師的學習體系。 讀者對象 作為叢書中的一本,本書上承基礎理論部分,下啟最終建模及案例分析。本書將關注點集中到數據的探索及預處理上,通過本書的學習將會加深對基礎理論部分的理解,為后續的建模分析做好數據上的準備。本書適合那些想了解數據預處理,或者被數據的預處理占去大部分時間而想提高效率,或者囿于菜單操作的局限性而希望通過程序實現的數據分析人員。 閱讀指南 對數據分析師而言,合適的數據就像好的食材,對最終分析結果的影響不言而喻,但是在日常的工作中我們會經常遇到兩個問題,一是數據的質量不高,數據在收集、存儲等過程中不可避免地出現了臟數據、不一致數據、噪聲數據、重復數據等,如果我們不做任何預處理而直接輸入模型,就會出現“garbage in, garbage out”,即垃圾進垃圾出的情況。二是數據的形式不符,因為不同的模型,建模技術都有一定的前提假設,對數據的展現形式、分布狀態等都有較為嚴格的要求,如果不做預處理,模型出來的結果很可能與數據底層真正蘊含的規律背道而馳,對這種形式的數據盲目地進行建模分析,極容易誤人誤己。 數據預處理占到整個數據挖掘的60%∼80%的時間,要想高效正確地完成數據的預處理工作其實不是一件容易的事情,本書作者根據在咨詢公司、電信及金融行業的多年經驗,將常用的數據預處理思路融入到SAS EG、SPSS 的菜單操作中,并配以SAS 程序的講解,使得讀者在熟悉菜單的同時,能用簡單的SAS 語言完成相對復雜的數據處理要求。 全書共分為10 章: 第1 章介紹了SAS EG、SPSS 軟件,并介紹了三種常見的數據分析流程; 第2 章介紹了如何通過多種方式使SAS EG、SPSS 可以輕松地訪問多種形式的外部數據; 第3 章介紹了探索性數據分析的基本思路,以及數據清理的相關理論,并分別演示了如何對類別數據、數值數據進行清理; 第4 章、第5 章介紹了如何對數據觀測進行篩選和排序、抽樣,以及數據的分組和匯總,如何對數據進行轉置,使用函數等; 第6 章介紹了如何在整體上對數據集進行操作,包括如何對數據集進行橫向連接和縱向連接,數據集之間的比較創建格式等; 第7 章講解了數據的可視化及圖表、報告的編制方法; 第8 章、第9 章介紹了如何在SAS EG 中運用提示、程序等來提高數據處理效率; 第10 章介紹了SQL 語言基礎和MySQL 入門。各部分相互獨立,讀者可以根據自己的需要選擇性閱讀。本書在第1 版的基礎上,新增了第10章,其他各章分別對應加入了SPSS 的操作。 本書特點 1.關于SAS EG 模塊和SPSS 實現功能比較的首本實戰中文教材,通過比較,讀者能更快掌握這兩個應用最廣、功能最強大的統計軟件; 2.非單純的逐個講解菜單,而是將數據分析的基本思路、流程融入到軟件的操作之中; 3.每一章節通過設置商業背景,基本理論講解的形式更貼近讀者的實際工作; 4.本書除講解軟件操作,還同時介紹了各種操作的SAS 語言的實現過程,讀者可以根據自己的基礎逐步學習,進而走進SAS 處理數據的大門。 學習方法 本書在編寫上力求從讀者的實戰角度出發,每章基本上分為五部分: 1.商業背景的介紹; 2.相關的理論介紹; 3.EG 軟件的解決方案; 4.程序實現,包含實現菜單的程序的簡單必要功能,讀者可以輕松過渡到編程; 5.SPSS 菜單解決方案; 6.擴展閱讀,對于想深入學習SAS 編程、數據準備的讀者,進一步介紹了相關的學習內容及方向。 讀者可以根據自己的需要來閱讀,本書的菜單操作部分以SAS Eenterprise guide 5.1,SPSS22 為例進行示范,代碼部分以SAS 9.3 為基礎進行編寫,讀者在理解基本思路之后可以方便將其應用到其它版本之上。 |
內容簡介:《如虎添翼!數據處理的SPSS和SAS EG實現(第2版)》作為SAS EG 和SPSS 數據處理比較的首本實戰中文教材,本書并非單純地逐個講解菜單的操作,而是將數據分析的基本思路、流程融入到軟件的操作之中。每章通過設置商業背景,配以SAS EG 和SPSS 的實戰演練,講解形式更貼近讀者的實際工作,使讀者真正理解數據分析、數據處理的精髓。本書除講解軟件操作,還同時介紹了對應菜單操作的SAS 程序語言實現過程,讀者可以根據自己的需要逐步學習,進而走進用SAS 程序處理數據的大門。 |
目錄:第1 章 軟件入門介紹 .. 1 1.1 SAS EG 介紹 .. 2 1.1.1 SAS EG 簡介 . 2 1.1.2 SAS EG 的窗口及菜單 . 3 1.2 SPSS 介紹 . 4 1.2.1 SPSS 簡介 .. 4 1.2.2 SPSS 窗口及菜單 5 1.3 數據挖掘的流程介紹 . 9 1.3.1 KDD 介紹 9 1.3.2 CRISP-DM .. 10 1.3.3 SEMMA . 11 1.3.4 三種數據挖掘流程的比較 .. 11 1.4 課后練習 . 11 第2 章 使用數據 .. 12 2.1 通過SAS 邏輯庫訪問數據 .. 13 2.1.1 商業背景 .. 13 2.1.2 SAS 相關功能介紹 .. 13 2.1.3 EG 菜單解決方案 . 14 2.1.4 SAS 程序實現 . 15 2.1.5 SPSS 菜單解決方案 .. 16 2.2 理解SAS 與SPSS 數據集的定義 19 2.2.1 理解數據集的含義 .. 19 2.2.2 商業背景 .. 19 2.2.3 SAS 與SPSS 相關概念介紹 .. 19 2.2.4 EG 菜單解決方案 . 25 2.2.4 SAS 程序實現 . 26 2.2.5 SPSS 菜單解決方案 28 2.3 導入其他格式的數據文件 30 2.3.1 商業背景 .. 30 2.3.2 SAS 相關功能介紹 .. 30 2.3.3 EG 菜單解決方案 . 31 2.3.4 SAS 程序實現 . 33 2.3.5 SPSS 菜單解決方案 35 2.4 數據來源 . 36 2.4.1 直接來源 .. 36 2.4.2 間接來源 .. 37 2.5 擴展閱讀 . 37 2.6 課后練習 . 38 第3 章 探索性數據分析及數據的清理 39 3.1 探索性數據分析 . 40 3.1.1 基本理論講解 . 40 3.1.2 EG 菜單解決方案 . 40 3.1.3 SPSS 菜單解決方案 44 3.2 數據清理介紹 .. 54 3.2.1 商業背景 .. 54 3.2.2 需要清理的數據類型 . 55 3.3 類別變量的清理 . 57 3.3.1 EG 菜單解決方案 . 57 3.3.2 SAS 程序實現 . 61 3.3.3 SPSS 菜單解決方案 62 3.4 數值型變量的清理 66 3.4.1 EG 菜單解決方案 . 66 3.4.2 SAS 程序實現 . 70 3.4.3 SPSS 菜單解決方案 71 3.5 正態分布的驗證 . 75 3.5.1 商業背景 .. 75 3.5.2 相關理論介紹 . 75 3.5.3 EG 菜單解決方案 . 75 3.5.4 SAS 程序實現 . 78 3.5.5 SPSS 菜單解決方案 80 3.6 擴展閱讀 . 83 3.7 課后練習 . 84 第4 章 數據的行處理 . 85 4.1 數據篩選 . 86 4.1.1 商業背景 .. 86 4.1.2 相關理論介紹 . 86 4.1.3 EG 菜單解決方案 . 86 4.1.4 SAS 程序實現 . 88 4.1.5 SPSS 菜單解決方案 93 4.2 排序與求秩 94 4.2.1 商業背景 .. 94 4.2.2 理論介紹 .. 95 4.2.3 EG 菜單解決方案 . 95 4.2.4 SAS 程序實現 .. 101 4.2.5 SPSS 菜單解決方案 . 103 4.3 抽樣 105 4.3.1 商業背景 105 4.3.2 抽樣理論介紹 .. 105 4.3.3 EG 菜單解決方案 .. 108 4.3.4 SAS 程序實現 .. 110 4.3.5 SPSS 菜單解決方案 . 111 4.4 數據分組和匯總 .. 111 4.4.1 商業背景 111 4.4.2 EG 菜單解決方案 .. 111 4.4.3 SAS 程序實現 .. 113 4.4.4 SPSS 菜單解決方案 . 113 4.5 擴展閱讀 .. 115 4.6 課后練習 .. 115 第5 章 數據的列處理 .. 116 5.1 計算新變量 . 117 5.1.1 商業背景 117 5.1.2 EG 菜單解決方案 .. 117 5.1.3 SPSS 菜單解決方案 . 120 5.2 拆分列 .. 123 5.2.1 商業背景 123 5.2.2 EG 菜單解決方案 .. 123 5.2.3 SPSS 菜單解決方案 . 125 5.3 堆疊列 .. 128 5.3.1 商業背景 128 5.3.2 EG 菜單解決方案 .. 129 5.3.3 SPSS 菜單解決方案 . 131 5.4 轉置列 .. 136 5.4.1 商業背景 136 5.4.2 EG 菜單解決方案 .. 136 5.4.3 SAS 程序實現 .. 138 5.4.4 SPSS 菜單解決方案 . 139 5.5 函數及運算符的使用 140 5.5.1 運算符 . 140 5.5.2 SAS 函數 142 5.5.3 常用SPSS 函數與SAS 函數的對應關系 150 5.6 對列重編碼 . 151 5.6.1 商業背景介紹 .. 151 5.6.2 EG 菜單解決方案 .. 151 5.6.3 SAS 程序實現 .. 155 5.6.4 SPSS 菜單解決方案 . 157 5.7 標準化 .. 158 5.7.1 商業背景 158 5.7.2 相關理論介紹 .. 159 5.7.3 EG 菜單實現 . 159 5.7.4 SAS 實現程序 .. 161 5.7.5 SPSS 菜單解決方案 . 162 5.8 擴展閱讀 .. 163 5.9 課后練習 .. 163 第6 章 數據集的操作 .. 164 6.1 縱向連接 .. 165 6.1.1 商業背景 165 6.1.2 相關的理論 165 6.1.3 EG 菜單解決方案 .. 165 6.1.4 SAS 程序實現 .. 168 6.1.5 SPSS 菜單解決方案 . 172 6.2 橫向連接 .. 174 6.2.1 商業背景 174 6.2.2 相關理論介紹 .. 174 6.2.3 EG 菜單解決方案 .. 174 6.2.4 SAS 程序實現 .. 178 6.2.5 SPSS 菜單解決方案 . 182 6.3 數據集的比較 183 6.3.1 商業背景介紹 .. 183 6.3.2 相關理論介紹 .. 183 6.3.3 EG 菜單解決方案 .. 183 6.3.4 SAS 程序實現 .. 186 6.3.5 SPSS 菜單解決方案 . 187 6.4 創建格式 .. 191 6.4.1 商業背景 191 6.4.2 相關理論介紹 .. 191 6.4.3 EG 菜單解決方案 .. 193 6.4.4 SAS 程序實現 .. 196 6.5 刪除數據集和格式 . 197 6.5.1 EG 菜單解決方案 .. 197 6.5.2 SAS 程序實現 .. 198 6.6 擴展閱讀 .. 198 6.7 課后練習 .. 199 第7 章 數據的展示:圖形及報告的編制 200 7.1 數據可視化與圖表 . 201 7.1.1 商業背景 201 7.1.2 相關理論介紹 .. 201 7.1.3 EG 菜單解決方案 .. 204 7.1.4 SPSS 菜單解決方案 . 207 7.2 創建Listing 報表 . 208 7.2.1 商業背景 208 7.2.2 相關理論介紹 .. 208 7.2.3 EG 菜單解決方案 .. 209 7.2.4 SAS 程序實現 .. 212 7.2.5 SPSS 菜單解決方案 . 213 7.3 擴展閱讀 .. 216 7.4 課后練習 .. 216 第8 章 在SAS EG 中使用提示和條件處理 .. 217 8.1 提示與宏變量 218 8.1.1 商業背景 218 8.1.2 相關的理論介紹 . 218 8.1.3 EG 菜單解決方案 .. 219 8.2 條件處理 .. 223 8.2.1 商業背景 223 8.2.2 EG 菜單解決方案 .. 223 8.3 擴展閱讀 .. 227 第9 章 在SAS EG 中使用程序 .. 228 9.1 如何在SAS EG 中使用程序 229 9.2 SAS 程序 231 9.2.1 SAS 語言元素 .. 231 9.2.2 DATA 步 . 232 9.2.3 PROC 步 . 233 9.2.4 SAS 的模塊介紹(圖9-9) . 234 9.3 擴展閱讀 .. 234 第10 章 SQL 語言基礎與MySQL 入門 . 235 10.1 SQL 語言概況與MySQL 的安裝 236 10.1.1 SQL 語言概況 236 10.1.2 MySQL 安裝 .. 237 10.1.3 MySQL 內創建數據庫 . 238 10.2 查詢語句 238 10.2.1 簡單查詢并對數據過濾與排序 .. 240 10.2.2 用表達式創建新列 . 241 10.2.3 對列重編碼 . 242 10.2.4 在查詢中對數據分組和匯總 243 10.2.5 表的橫向連接和子查詢 .. 244 10.2.6 子查詢 .. 250 10.2.7 集合操作語句 251 10.3 創建表或視圖 . 252 10.3.1 創建表 .. 252 10.3.2 創建視圖 . 252 附錄A SAS EG 菜單對應關系 254 附錄B SPSS 菜單對應關系表 256 附錄C SAS 和SPSS 關鍵術語、命令對應關系 258 附錄D CDA 數據分析師致力于最好的數據分析人才建設 . 261 參考文獻 265 |
序: |