數據分析——基于內容與結構的網絡輿情分析報告(2015)( 簡體 字) | |
作者:饒元等 | 類別:1. -> 程式設計 -> 綜合 |
出版社:電子工業出版社 | 3dWoo書號: 43229 詢問書籍請說出此書號! 有庫存 NT售價: 390 元 |
出版日:12/1/2015 | |
頁數:1 | |
光碟數:0 | |
站長推薦: | |
印刷:黑白印刷 | 語系: ( 簡體 字 ) |
ISBN:9787121278082 | 加入購物車 │加到我的最愛 (請先登入會員) |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社) | |
第1章 社會網絡分析研究概況 1
1.1 基于論壇的網絡輿情分析基礎 2 1.2 數據特征分析 4 第2章 分析方法、模型和數據指標的構建 9 2.1 社會化網絡分析方法 9 2.2 主要模型的構建 12 2.3 數據分析指標 17 2.4 主要算法 24 2.5 本章小結 27 第3章 領域輿情整體網及數據視圖 28 3.1 整體網絡特征分析 28 3.2 經濟社區網絡特征分析 29 3.3 政治社區網絡特征分析 36 3.4 民生社區網絡特征分析 42 3.5 生態社區網絡特征分析 49 3.6 國際和軍事社區網絡特征分析 56 3.7 本章小結 62 第4章 經濟領域的相關輿情分析 64 4.1 經濟領域熱點專題和熱點詞分析 64 4.2 經濟領域意見領袖分析 67 4.3 專題1:房市與房價專題 70 4.4 專題2:股市與股票 85 4.5 專題3:貨幣與匯率 99 4.6 本章小結 112 第5章 政治領域的相關輿情分析 113 5.1 政治領域熱點專題熱點詞分析 113 5.2 政治領域意見領袖分析 117 5.3 專題1:國企改革 119 5.4 專題2:反腐風暴 133 5.5 專題3:依法治國 147 5.6 本章小結 159 第6章 民生領域的相關輿情分析 161 6.1 民生領域熱點專題和熱點詞分析 161 6.2 民生領域意見領袖分析 165 6.3 專題1:教育與就業 168 6.4 專題2:收入分配 183 6.5 專題3:社會與醫療保障 199 6.6 本章小結 213 第7章 生態領域的相關輿情分析 215 7.1 生態領域熱點專題和熱點詞分析 216 7.2 生態領域意見領袖分析 220 7.3 專題1:生態環境 222 7.4 專題2:生態資源 236 7.5 專題3:技術或措施 249 7.6 本章小結 260 第8章 國際與軍事領域的相關輿情分析 261 8.1 國際與軍事領域熱點專題和熱點詞分析 261 8.2 國際與軍事領域意見領袖分析 265 8.3 專題1:領土與主權 268 8.4 專題2:合作共榮 285 8.5 專題3:國際事故 299 8.6 本章小結 312 第9章 社會輿情分析工作總結與展望 314 9.1 社會輿情分析總結 314 9.2 下一步工作展望 317 主要參考文獻 318 后記 320 在Web2.0技術與應用不斷深化以及移動應用不斷產生的新時代,互聯網已成為社會民意與民聲的重要來源。利用互聯網中用戶產生的各種數據進行社會輿情分析,已成為當前信息檢索與情報獲取的一個重要研究方向。人們深刻地認識到,網絡信息不僅有研究與應用價值,而且是保證國家或企業安全的重要基礎,具有重要的戰略意義與社會經濟價值。本書對2014年天涯論壇網民在經濟、政治、民生、生態以及國際與軍事等幾個關鍵領域的網絡民意,從網絡文本數據挖掘的角度進行了初步分析。此外,應用社會網絡分析方法直觀地展示了一些與內容分析相符的結論。通過這些相關的分析,反映出熱點事件以及相關民意,期望為相關機構和部門信息決策提供參考。
網絡技術特別是移動互聯網絡技術與應用的快速發展,推動了大數據時代的來臨。一方面,人們越來越多地依賴網絡,將其工作與生活的見解、經驗、評價與情感以O2O的方式即時地共享和發布到網絡之中;另一方面,人們也希望將這一些由群體共同創建的信息所組成的大數據資源,通過一些合理的分析方法與共享機制來實現數據信息的價值利用。面對網絡中存在的這樣一些海量的、結構無序的和以內容為核心的特殊數據,借助社會網絡的分析方法與文本挖掘的方法,人們可以更好地從數據之間存在的關系網絡結構特征以及內容文本特征中尋找到分析問題的新視角。這也是本研究報告在對網絡輿情進行分析與研究工作基礎之上,希望建構與表達的一種數據分析的整體框架;這也是在2014年由科學出版社出版的第一本報告之后,一年來我們對網絡輿情研究與分析方法的一次升級與提升。 社會網絡分析方法研究是一種相對較為成熟但近年來又十分活躍的領域,該方法原本應用于社會科學領域,通過調查問卷獲取采樣數據并分析不同的社會結構組成、社會網絡中不同組成成員之間的聯系、社會結構的演化行為等內容,為人們理解構成社會的人群靜態結構特征以及不同類型人群之間的動態行為特征之間的關系,并為管理與決策提供更優的決策依據。 但是,隨著網絡技術與應用的發展,特別是即時交流工具與Web2.0的一些應用,極大地推動了現實物理社會向網絡虛擬社會的行為遷移。在這種信息遷移的過程中,人們極大地突破了時間與空間的界限。一方面,使過去以口述自然語言的無記錄交流方式,變成了以網絡語言的文字或多媒體數據記錄的方式進行交流,從而沉淀了大量的文本數據與多媒體數據內容,而且這些數據的規模每年均以指數方式爆炸性增長,從而改變了傳統的社會網絡分析過程中的數據抽樣模式;另一方面,不同的人群沉積的信息中存在大量有價值的信息與知識,如何利用人類歷史上最有效的信息共享機制,深度挖掘這些信息中存在的寶貴內容知識資源,為更多的人提供知識與信息服務,已成為新的數據時代下人們面對的一個新機遇與新挑戰。因此,社會網絡分析也正在向社會計算與社會智能的方向發展與演化。 因此,有人開始對未來網絡社會的工作與交流模式進行了預測,并驚呼“淘寶”“微信”等社會化工具的最為令人擔心的一件事情就是:隨著時間的流逝,網絡記錄了一代人的成長、朋友、交流、交易、娛樂等多種類型的個性化數據信息,從而通過這一些數據的分析,很容易形成一個個人或者機構的輪廓模型,通過這個模型可以分析小到普通百姓消費者、大到單位機構甚至國家領導人的行為偏好與情感交流特征,這也是為什么Google、IBM、Facebook等國際巨頭不惜重金在網絡領域與輿情分析領域開展深入研究的根本原因之一。特別是在美國斯諾登曝光的“棱鏡門”事件后,使人們更加深刻地認識到,網絡信息不僅具有理論研究價值與商業應用價值,同時是保證一個國家或企業安全的重要基礎,因此具有重要的戰略意義與社會經濟價值。 西安交通大學軟件學院社會智能與復雜數據處理實驗室自2012年成立起,便開始從事網絡內容與行為的研究,特別希望從文本挖掘與自然語言處理以及社會網絡分析方法的角度,探索網絡輿情分析方法與社會計算的技術研究策略。三年來,已發布兩份社會輿情分析報告,而本報告則是在前面兩份報告的基礎上,對網絡輿情分析方法與指標體系的進一步完善與優化,并對2014年1月到2015年3月期間的網絡熱點事件進行了跟蹤與數據分析,期望通過這些相關的分析,找出中國在經濟、政治、民生、生態以及國際事務與軍事等范疇下的一些關鍵網絡事件,以及人們在事件討論過程中所折射出來的草根民意,也期望可以為相關機構與決策部門提供一些參考信息。 本報告得到了眾多熱心人士的支持幫助,特別是西安交通大學軟件學院的領導與老師曾經提供了研究環境與設備資源,還有一些老師將關鍵的技術、業務分析方法以及數據處理的建議毫無保留地進行分享,在此一并道謝。同時,感謝責任編輯為本報告的面世提供了積極的建議與幫助。特別要感謝的是西安交通大學軟件學院社會智能與復雜數據處理實驗室的所有老師以及研究生們,通過三年來持續的研究與實踐,探索了從簡單的數據處理到集成輿情分析平臺的設計與開發實現,這些工作為后續不斷地深入研究與實踐提供了大量的技術與人才儲備。另外,通過年度報告研究與發布,鍛煉和培養一批優秀的青年才俊。這些青年人才及其努力向上的精神是這個實驗室最核心的、最寶貴的智力資產與共同精神財富。 本報告由馮妮同學協助進行整體規劃,宋明爽、員鵬、眭欣陽參與了報告的指標定義、算法實現以及全文的整理,并負責了相關內容的數據分析,為本實驗室的知識服務平臺以及金融風險預測與評估平臺的建設奠定了相應的技術基礎。我們相信,通過實驗室所有人員的共同努力,不僅能夠為更多的網民、企業以及政府機構提供越來越深入、越來越有價值的文本挖掘與網絡輿情分析成果,也可以將相關共性技術應用于不同的研究領域。希望本報告的面世能“拋磚引玉”,建立一個向同行專家學習和交流的新平臺,一方面可以不斷促進我們專業分析水平的提升,另一方面可以加強與更多專業機構的協同交流與合作共享。 特別要說明的是,本系列報告的目的在于研究如何利用信息技術與軟件工具對網絡中的信息進行分析與文本數據的挖掘,也期望利用技術來解決實際中的一些問題。為了保證數據來源的真實性與客觀性,在本報告中涉及部分網民的“真實的”網名,在此特別聲明,我們僅僅為了表明在研究過程中的客觀性,并沒有其他的用意。 由于我們的技術水平以及分析能力的限制,本報告雖然較以往的工作有了新的進展,但尚有許多亟待進一步提升與改進的空間,所以希望同行的學者、專家與同仁不吝賜教。希望未來十年,我們可以利用系列報告的方式來不斷提升我們的研究與分析水平與能力,以及提高內容與信息挖掘的使用價值,為更多人提供專業的信息與知識服務。 本報告得到了國家科技部“火炬計劃”(2012GH571817)、國家社科基金重大項目“基于多學科理解的社會網絡分析模型研究——虛擬Web網絡空間中的社會網絡模型與個體行為機制研究”(13ZD177)、2015年度陜西省科技廳協同創新計劃(2015XT-21)“基于網絡化感知計算的智慧社區管理關鍵技術應用示范研究”項目、2015年西安市科技局產學研協同創新計劃(CXY1514(5))“基于內容挖掘的專利地圖可視化服務的關鍵技術研究”項目以及中央高校“科研基金”(08143003)等項目的支持,在此一并表示衷心的感謝。 編 者 西安交通大學軟件學院 社會智能與復雜數據處理實驗室 2015年6月25日 |