-- 會員 / 註冊 --
 帳號:
 密碼:
  | 註冊 | 忘記密碼
站長推薦
NT售價: 295
NT售價: 345
NT售價: 345
NT售價: 345
NT售價: 290

2/22 新書到! 2/2 新書到! 1/17 新書到! 1/12 新書到!
C.G.Next購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUGRevit
PhotoShopCorelDrawIllustratorAutoCadMasterCamSolidWorksCreo
CC++Java遊戲程式Linux嵌入式PLCFPGAMatlabNuke
駭客資料庫Oracle搜索引擎影像處理FluentSPSSANSYSUnity
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
C#HadoopPythonstm32手機程式CortexLabviewAndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

胸有成竹:數據分析的SPSS和SAS EG進階(第2版)

( 簡體 字)
作者:經管之家類別:1. -> 工具書、軟體 -> 統計軟體
譯者:
出版社:電子工業出版社胸有成竹:數據分析的SPSS和SAS EG進階(第2版) 3dWoo書號: 44150
詢問書籍請說出此書號!

有庫存
NT售價: 295

出版日:5/1/2016
頁數:296
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787121285318
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
作者序:

譯者序:

前言:

序言:這是一個用數據說話的時代
在CDA(注冊數據分析師)Level I 級教材付諸印刷之際,關于數據分析這個職業及其價值的報道就有很多。比如,下面兩條報道就充分體現了在大數據時代下,數據分析的價值。這在以前是從來沒有過的。
LinkedIn 的最新投票結果顯示,‘統計分析和數據挖掘’是2014 年最大的求職法寶。LinkedIn對全球超過3.3 億用戶的工作經歷和技能進行分析,公布2014 年最受雇主喜歡、最炙手可熱的25項技能,其中位列榜首的是統計分析和數據挖掘。
麥肯錫公司的一份研究預測稱,到2018 年,在“具有深入分析能力的人才”方面,美國可能面臨著14 萬到19 萬人的缺口,而“可以利用大數據分析來做出有效決策的經理和分析師” 缺口則會達到150 萬人。數據科學家將成為2015 年最熱門的職業。
早在2010 年2 月,肯尼斯?庫克爾在《經濟學人》上發表了一份關于管理信息的特別報告——《數據,無所不在的數據》,文中寫道:“世界上有著無法想象的巨量數字信息,并以極快的速度增長……從經濟界到科學界,從政府部門到藝術領域,很多地方都已感受到了這種巨量信息的影響。”2011 年,麥肯錫發布了《大數據:下一個具有創新力、競爭力與生產力的前沿領域》,使人們在這篇文章里認識到了數據的力量。于是,一夜之間,面向數據分析市場的新產品、新技術、新服務、新業態正在不斷涌現。從個人、企業到國家層面,都把數據作為一種重要的戰略資產,逐漸認識到了數據的價值,不同程度地滲透到每個行業領域和部門,大大提升了企業的經營利潤,推動了經濟的發展。
這是一個用數據說話的時代,也是一個依靠數據競爭的時代。目前世界500 強企業中,有90%以上都建立了數據分析部門。IBM、微軟、Google 等知名公司都積極投資數據業務,建立數據部門,培養數據分析團隊。各國政府和越來越多的企業意識到數據和信息已經成為企業的智力資產和資源,數據的分析和處理能力正在成為日益倚重的技術手段。
作為一個數學和統計學的強國,數據分析、數據挖掘和大數據價值挖掘行業在我國仍屬于朝陽行業,數據分析人才仍然比較稀缺。各行各業在平常工作中積累的各種各樣的數據分析問題仍然沒有得到及時有效的解決,有些問題,還是關乎本行業發展的至關重要的問題。數據積累越來越多,期待解決分析的數據問題也越來越多,人們逐漸習慣使用數據作為決策的重要參考依據。據艾瑞的研究報告,未來與數據分析相關的就業崗位會在1000 萬人左右,而目前來說國內合格的數據分析師不足5 萬人,建立一個科學有效的數據分析師培訓體系迫在眉睫。
在這樣一個用數據說話的時代,積累了豐富的數據分析培訓經驗的經管之家承擔起使命,幾番調查研究,幾番反復推演論證,在2013 年,這個大數據的“元年”,CDA 注冊數據分析師應運而生!
2003 年,經管之家(原人大經濟論壇)依托中國人民大學成立,在金融、管理、統計領域已積淀11 個年頭,在國內享有良好聲譽。
2006 年,經管之家數據分析培訓中心設立,至今經歷8 個春秋,建立了大陸、臺灣一線師資團隊,培養人才已達3 萬余人。
2013 年,“中國數據挖掘與數據分析俱樂部CDMC”在經管之家旗下成立,2014 年改名為“CDA數據分析師俱樂部”。來自政府、金融、電信、零售、電商、互聯網、教育等行業人士加入會員,成功舉辦了數十場行業聚會。緊接著,積累了數據分析培訓豐富經驗的經管之家在國內展開CDA 數據分析師系統培訓和認證考試,成功見證了數千名數據分析師的成長。
2015 年,經管之家將繼續提供高水平、多層次的數據分析培訓服務,以在行業積累多年的影響力,吸引更好更多的優秀師資,瞄準行業內重要的數據分析問題和難點,攻堅突破,建立更加規范的行業培訓體系,引領數據分析培訓行業向規范化、有效化和前瞻化方向發展,為數據分析培訓做出應有的貢獻。
其實,數學(含統計)和英語一樣重要,都是人們不可或缺的重要技能。既然英語全民這么重視,數學及其數據分析的技能更加需求于方方面面,更應被做大做強。讓我們共同期待經管之家辦成另一個數據分析的“新東方”!
前言
感謝您選擇“CDA 數據分析師”LevelⅠ學習系列叢書”之《胸有成竹!數據分析的SPSS 和SASEG 進階(第2 版)》。
該叢書按照數據分析師規范化學習體系而定,對于一名初學者,應該先掌握必要的概率、統計理論基礎,包括描述性分析、推斷性分析、參數估計、假設檢驗、方差分析、回歸分析等內容,這在第一本書《從零進階!數據分析的統計基礎(第2 版)》中進行了專業詳細的講解。其次,數據分析需要按照標準流程進行,即數據的獲取、儲存、整理、清洗、歸約等系列數據處理技術,這在《如虎添翼!數據處理的SPSS 和SAS EG 實現(第2 版)》中利用統計軟件和編程技術進行了操作過程的詳解。最后,經過處理的數據需要根據業務問題,利用相關方法進行建模分析,得出結果,結果檢驗,繪制圖表并解讀數據,這在《胸有成竹!數據分析的SPSS 和SAS EG 進階(第2 版)》中進行了詳細的講解和操作分析。
CDA 數據分析師叢書整體風格是“理論>技術>應用”的一個學習過程,最終目的在于商業業務應用、職場數據分析,為欲從事于數據分析領域的各界人士提供了一個規范化數據分析師的學習體系。
讀者對象
本書是一本面向商業數據分析初學者的教材,從具體的商業數據分析案例入手,使讀者掌握數據分析的目的、理念、思路與分析步驟。本書力圖淡化技術,對于方法的介紹也盡量避免涉及過多的數學內容,和高等數學相關的內容只在線形回歸和主成分分析這兩節中涉及到,而且都輔以圖形作形象的展現。因此本書的讀者只需要具有高中水平的數學基礎即可。但是本書強調每種方法的假設、適用條件和與商業數據分析主題的匹配。實踐教學中,發現業務經驗豐富和有較好商業模式理解的學員,在學習數據分析有更好的效果,這主要原因可能是因為這類學員有較強的思辨能力、分析能力、學習目的性和質量意識,而不是簡單的模仿和套用數學公式。
本書以SPSS Statistics(以下簡稱SPSS) 和SAS Enterprise Guide(以下簡稱SAS EG)為演示軟件,但是操作方法可以方便的轉換為其他統計軟件,同時也是學習SAS 編程的捷徑。
工具介紹
SPSS 作為一個入門級數據分析軟件,是每個從業者必會的。其可視化界面可以很好的展現數據分析的流程。但是SPSS 的功能畢竟有限,尤其在數據清洗和整理方面更是捉襟見肘,因此需要和SAS EG 結合使用。SAS EG 是一個以項目為導向的Windows 應用軟件,它被用于實現對SAS 系統大多數分析能力的快速訪問。它通常會被統計專家、業務分析員以及 SAS 程序員使用。利用SAS 多平臺的強大能力,SAS EG 能夠使用戶訪問本地或SAS 服務器上的數據、管理數據、編寫基本報表和匯總,做基本和復雜的數據分析,運用最高質量的SAS 圖形能力,最后將結果輸出或發送到SAS服務器或其他基于服務器或Windows 的應用中。在SAS EG 中進行的工作也可以容易地被其他的EG使用者分享。通過生成SAS 代碼,大多數在SAS EG 中進行的工作也可以被EG 外部的SAS 使用者共享。
SAS EG 面向企業中數據輕度使用客戶,它的同類產品是SPSS。而與R、Stata 和Eviews 等科研教學類軟件有明顯不同。SAS EG 基本繼承了SAS Base 的所有功能,可以方便地調用其他模塊的程序。可以說在商業數據分析領域,SAS EG 是SAS Base 的升級換代產品。SAS EG 和SPSS 類似,都是可以直接使用鼠標點擊操作的,這降低了使用人員的入門難度,而且記錄腳本可以便于使用者學習SAS 語言。它的文檔管理功能是目前統計軟件中最強大的。其中的流程圖使單次分析過程一目了然,這與SPSS 等有明顯差別。SPSS 較難記錄分析過程,而SAS EG 可以將分析過程記錄下來,便于使用者反復使用和組織內部共享分析文檔。在統計方法方面,SAS EG 菜單中實現的統計方法少而精煉,滿足90%以上的商業分析需求,而且其拓展性強大,可以調用SAS 其他模塊的過程,可以實現SPSS 無法很好實現的時間序列和面板數據分析。在和其他軟件銜接方面,SAS EG 以SAS Base為基礎,而SAS Base 在某些公司作為ETL 工具,可見SAS 具有強大的數據管理功能,可以和企業內部數據庫做透明訪問。
目前各大金融機構、國有企業和著名外企,尤其是咨詢公司都在使用SAS 產品。SAS Base 是面向數據處理程序員的,入門難度較大,只在專門的數據分析部門使用。而SAS EG 的用戶多為業務部門的工作人員,入門難度較低。在公司內部培訓的過程中,發現公司數據分析人員和業務人員對學習SAS EG 有較大興趣,部門領導也傾向于讓員工多學習SAS EG 的課程。而且SAS 公司也逐步將其部分產品免費化,其中University-Edition 就是一個有益的嘗試,其操作方式和SAS EG 類似。相信在統計技能大眾化的今天,SAS EG 有著巨大的發展潛力。
當前R 和Python 等開源軟件方興未艾,但是這類軟件學習曲線緩慢,使很多初學者的熱情在進入數據分析的核心領域之前就已經消逝殆盡。真正商業數據分析的目的是為了業務的分析需求,構造穩健的數據挖掘模型。數據挖掘產品的質量是通過對分析流程的嚴格掌控而得以保障的。SAS EG產品正是針對分析流程設計的,這對于數據分析初學者大有裨益。而開源軟件在這方面基本上沒有支持,而要求其使用者具有豐富的實戰經驗。因此使用SAS EG 這個產品作為演示工具,無論將來讀者使用何種分析工具,都可以通過本書的學習獲得分析流程的經驗。
閱讀指南
本書包括5 章,涉及使用SPSS 和SAS EG 做數據分析的主要分析方法。其中,第1 章為數據分析方法概述,第2 章至第4 章為橫截面數據分析方法。第5 章為時間序列分析方法。每章都根據所涉及的知識點的不同,選取了實用的案例,并為讀者準備了相應的思考和 練習題。
詳細的章節內容如下。
第1 章 數據分析方法概述
數據分析的目的是使工作更有效率、資源分配更合理、對事物的發展脈絡更為清晰或是提高對未來預測的準確性。閱讀本章可以使讀者在具體接觸數據分析之前,了解整個數據分析的脈絡,明確將要學習的內容。
第2 章 描述數據特征
數據統計指標描述是數據分析的重點,對數據的直覺也是通過對數據的探索建立起來的。數據可視化則是將統計指標轉換成圖形和圖表。通過本章的學習,讀者可以掌握完成一份市場分析報告的基本技能。
第3 章 描述性數據分析方法
該部分是上一章的自然延伸,是大數據背景之下描述類數據分析方法的主要手段。分別針對變量過多和觀測樣本過多這兩個問題,進行變量和觀測這兩個維度的信息壓縮。通過本章的學習,可以完成客戶畫像、因素分析、客戶感知圖等較高質量的分析報告。
第4 章 預測性數據分析方法
傳統意義上的數據分析建模特指預測性數據分析。在完成本章的學習之后,對于橫截面數據分析方法就算結束了。通過本章的學習,可以構造精細的精準營銷、流失預警和信用評級等分類模型。
第5 章 時間序列
本章主要介紹兩種單變量時間序列分析方法。分別是趨勢分解法和基于動態差分方程的ARIMA法。對于非統計學背景的讀者,只要學會分析軟件提供的圖表就可以掌握該分析方法,滿足一般的商業指標預測需要。
為方便讀者學習, 本書提供了書中實例的源文件下載, 請讀者進入經管之家
(http://bbs.pinggu.org/),注冊后搜索“CDA 教材源文件”關鍵詞下載相應的源文件。
本書特點
本書作為市場上第一本使用SPSS 和SAS EG 面向商業數據分析的書籍,和其他統計軟件圖書有
很大的不同,文體結構新穎,案例貼近實際,講解深入透徹。主要表現在以下幾方面:
場景式設置
本書從實際電信、銀行等商業案例中進行精心歸納、提煉出各類數據分析的運用場景,方便讀者搜尋與實際工作相似的問題。
開創式結構
本書案例中的“解決方案”環節是對問題的思路解說,結合“操作方法”環節中的步 驟讓人更容易理解。“原理分析”環節則主要解釋所使用代碼的工作原理或者詳細解釋思路。“知識擴 展”環節包括與案例相關的知識點的補充,可拓展讀者的視野,同時也有利于理解案例本身的解決思路。
啟發式描述
本書注重培養讀者解決問題的思路,以最樸實的思維方式結合啟發式的描述,幫助讀者發現規律、總結規律和運用規律,從而啟發讀者快速找出問題的解決方法。
學習方法
俗話說打把勢全憑架勢,像不像,三分樣。只有對分析的流程熟悉了,才能實現從模仿到靈活運用的提升。在產品質量管理方面,對流程的掌控是成功的關鍵,在數據分析當中,流程同樣是重中之重。數據分析是一個先后銜接的過程,一個步驟的失誤會帶來完全錯誤的結果。一個分析的流程大致包括抽樣、數據清洗、數據轉換、建模和模型評估這幾個步驟。如果抽樣中的取數邏輯不正確,就有可能使因果關系倒置,得到完全相反的結論。數據轉換方法如果選擇不正確,模型就難以得到預期的結果。而且,數據分析是一個反復試錯的過程,每一步都要求有詳細的記錄和操作說明,否則分析人員很可能迷失方向。
學習數據分析最好的方法就是動手做一遍,本書語言通俗但高度凝煉,很少有公式,這會讓讀者產生麻痹大意的思想,如果不動手做一遍,很難體會到書中表述的思想。本書按照相關商業數據分析主題提供了相應的演練用數據,也同時給出了相關方面的參考資料,供學員學習。
售后服務
本書讀者可以在經管之家的“數據挖掘與商業智能(http://bbs.pinggu.org/forum-133-1.html)” 版塊就書中的問題進行提問,也歡迎大家就自己遇到的業務問題和大家討論。同時,也可以向作者發郵件,作者郵箱為guozhen.c@gmail.com。
致謝
本書由經管之家策劃,常國珍和趙仁乾負責編寫和完成統稿。
叢書從策劃到出版,傾注了電子工業出版社計算機圖書分社張慧敏、石倩、王靜、張童等多位編輯的心血,特在此表示衷心的感謝!
為保證叢書的質量,使其更貼近讀者,我們組織了經管之家的多位版主和高級會員參與了本書的預讀工作,他們是種法輝、丁亞軍、關繼杰、殷子涵。感謝各位預讀員的辛勤、耐心與細致,使得本叢書能以更加完善的面目與各位讀者見面,特別感謝覃智勇圓滿地組織了本次預讀工作和審校工作。
盡管作者們對書中的案例精益求精,但疏漏仍然在所難免,如果您發現書中的錯誤或某個案例有更好的解決方案,敬請登錄社區網站向作者反饋,我們將盡快在社區中給出回復,且在本書再次印刷時修正。
再次感謝您的支持!
內容簡介:

本書共5章,涉及使用SAS EG做數據分析的主要分析方法。其中,第1章為數據分析方法概述,第2章至第4章為橫截面數據分析方法。第5章為時間序列分析方法。每章都根據所涉及的知識點的不同,選取了實用的案例,并為讀者準備了相應的思考和練習題。 本書是一本面向商業數據分析初學者的教材,從具體的商業數據分析案例入手,使讀者掌握數據分析的目的、理念、思路與分析步驟。本書力圖淡化技術,對于方法的介紹也盡量避免涉及過多的數學內容,和高等數學相關的內容只在線形回歸和主成分分析這兩節中涉及到,而且都輔以圖形作形象的展現。因此本書的讀者只需要具有高中水平的數學基礎即可。

目錄:

第1 章 數據分析方法概述 1
1.1 數據分析概述 .. 2
1.1.1 數據分析過程 2
1.1.2 數據分析的商業驅動 3
1.2 數據分析與挖掘方法分類介紹 . 5
1.2.1 描述性——無監督的學習 . 7
1.2.2 預測性——有監督的學習 .. 10
1.3 數據分析的方法論 . 12
1.3.1 數據挖掘的項目管理方法論:CRISP-DM 13
1.3.2 數據整理與建模的方法論:SEMMA .. 14
1.3.3 SAS EG 和SPSS 任務菜單編排與SEMMA 之間的關系. 16
第2 章 描述數據特征 .. 19
2.1 認識數據類型 20
2.2 單變量描述統計方法 21
2.2.1 分類變量的描述 21
2.2.2 連續變量的描述 22
2.3 創建頻數報表 35
2.4 生成匯總統計量 .. 38
2.5 用匯總表任務生成匯總報表 41
2.6 繪制條形圖 . 46
2.7 繪制地圖 .. 53
2.8 使用SPSS 進行描述統計 .. 55
2.8.1 頻率過程 .. 56
2.8.2 描述過程 .. 57
2.8.3 探索過程 .. 58
2.8.4 P-P 圖與Q-Q 圖 58
2.9 使用SPSS 繪制統計圖形 .. 60
2.9.1 作圖方法 .. 60
2.9.2 餅圖、柱圖與條圖 .. 64
2.9.3 線圖、高低圖和雙軸圖 70
2.9.4 散點圖 73
第3 章 描述性數據分析/挖掘方法 . 75
3.1 客戶細分方法介紹 . 76
3.1.1 客戶細分的意義 76
3.1.2 根據客戶利潤貢獻進行劃分 . 77
3.1.3 根據個人或公司的生命歷程進行劃分 78
3.1.4 根據客戶的產品偏好進行劃分 79
3.1.5 根據客戶交易/消費行為進行劃分 . 80
3.1.6 根據客戶的多維行為屬性細分 81
3.1.7 展現客戶/產品結構的戰略細分 .. 81
3.1.8 客戶細分:綜合運用 . 82
3.2 連續變量間關系探索與變量約減 . 82
3.2.1 多元統計基礎 . 82
3.2.2 多元變量壓縮的思路 . 87
3.2.3 主成分分析 .. 89
3.2.4 因子分析 . 103
3.2.5 對應分析 . 112
3.2.6 最優尺度分析 .. 119
3.2.7 多維尺度分析 .. 124
3.3 聚類分析 133
3.3.1 基本邏輯 . 134
3.3.2 系統聚類 . 135
3.3.3 快速聚類 . 146
3.3.4 兩步聚類 . 155
第4 章 預測性數據分析方法 .. 161
4.1 假設檢驗概念 . 162
4.1.1 統計推斷基本概念 164
4.1.2 變量分布的圖形探索 .. 165
4.1.3 均值的置信區間 . 167
4.1.4 假設檢驗基礎 .. 168
4.1.5 T 檢驗 . 169
4.2 構造對連續變量的預測模型 . 174
4.2.1 方差分析(ANOVA) 174
4.2.2 線性回歸 . 190
4.2.3 線性回歸的模型診斷 .. 203
4.2.4 線性回歸的全流程 211
4.3 構造對二分類變量的預測模型 217
4.3.1 分類變量之間的相關性檢驗 .. 217
4.3.2 邏輯回歸 . 224
第5 章 時間序列 .. 240
5.1 時間序列的趨勢分解法 241
5.1.1 趨勢分解法簡介 . 241
5.2.2 使用SAS EG 進行時間序列趨勢分解 .. 242
5.2.3 使用SPSS 進行時間序列趨勢分解 244
5.2 平穩時間序列(ARMA)模型設定與識別 . 245
5.2.1 平穩時間序列定義 245
5.2.2 平穩時間序列模型建模 . 246
5.2.3 ARMA 的模型設定與識別 .. 247
5.3 非平穩時間序列(ARIMA)模型設定與識別 .. 250
5.4 SAS EG 時間序列建模步驟 .. 252
5.5 SPSS 時間序列建模步驟 . 258
5.5.1 SPSS 構造ARIMA 模型使用的任務菜單 .. 258
5.5.2 “定義日期”任務 .. 260
5.5.3 “序列圖”任務 261
5.5.4 “自相關”任務 262
5.5.5 “創建模型”任務 .. 263
5.5.6 “使用模型”任務 .. 267
5.5.7 其他內容 . 267
附錄A 數據說明 .. 271
附錄B CDA 數據分析師致力于最好的數據分析人才建設 .. 278
參考文獻 282
序: