自己動手做推薦引擎( 簡體 字) | |
作者:[印] 蘇雷什?庫馬爾?戈拉卡拉(Suresh Kumar Gorakala) | 類別:1. -> 程式設計 -> 綜合 |
出版社:機械工業出版社 | 3dWoo書號: 52097 詢問書籍請說出此書號! 有庫存 NT售價: 395 元 |
出版日:11/27/2019 | |
頁數:268 | |
光碟數:0 | |
站長推薦: | |
印刷:黑白印刷 | 語系: ( 簡體 字 ) |
ISBN:9787111641087 | 加入購物車 │加到我的最愛 (請先登入會員) |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社) | |
作者簡介
技術評審員簡介 前言 第1章 推薦引擎介紹1 1.1推薦引擎定義1 1.2推薦系統的必要性3 1.3大數據對推薦系統的推動作用4 1.4推薦系統類型4 1.4.1協同過濾推薦系統4 1.4.2基于內容的推薦系統5 1.4.3混合推薦系統6 1.4.4情境感知推薦系統7 1.5推薦系統技術的發展8 1.5.1Mahout在可擴展推薦系統中的應用8 1.5.2Apache Spark在可擴展實時推薦系統中的應用9 1.6本章小結12 第2章 構建第一個推薦引擎13 2.1構建基礎推薦引擎14 2.1.1載入并格式化數據15 2.1.2計算用戶相似度17 2.1.3為用戶預測未知評級18 2.2本章小結24 第3章 推薦引擎詳解25 3.1推薦引擎的發展26 3.2基于近鄰算法的推薦引擎27 3.2.1基于用戶的協同過濾29 3.2.2基于項目的協同過濾30 3.2.3優點32 3.2.4缺點32 3.3基于內容的推薦系統32 3.3.1用戶畫像生成35 3.3.2優點36 3.3.3缺點36 3.4情境感知推薦系統37 3.4.1情境定義38 3.4.2前置過濾法40 3.4.3后置過濾法40 3.4.4優點41 3.4.5缺點41 3.5混合推薦系統41 3.5.1加權法42 3.5.2混合法42 3.5.3層疊法42 3.5.4特征組合法42 3.5.5優點43 3.6基于模型的推薦系統43 3.6.1概率法44 3.6.2機器學習法44 3.6.3數學法44 3.6.4優點45 3.7本章小結45 第4章 數據挖掘技術在推薦引擎中的應用46 4.1基于近鄰算法的技術47 4.1.1歐氏距離47 4.1.2余弦相似度48 4.1.3Jaccard相似度51 4.1.4皮爾遜相關系數51 4.2數學建模技術53 4.2.1矩陣分解53 4.2.2交替最小二乘法55 4.2.3奇異值分解55 4.3機器學習技術57 4.3.1線性回歸57 4.3.2分類模型59 4.4聚類技術69 4.5降維71 4.6向量空間模型75 4.6.1詞頻75 4.6.2詞頻-逆文檔頻率76 4.7評估技術78 4.7.1交叉驗證79 4.7.2正則化80 4.8本章小結82 第5章 構建協同過濾推薦引擎83 5.1在RStudio上安裝recommenderlab83 5.2recommenderlab包中可用的數據集85 5.3探討數據集88 5.4使用recommenderlab構建基于用戶的協同過濾89 5.4.1準備訓練數據和測試數據90 5.4.2創建一個基于用戶的協同模型90 5.4.3在測試集上進行預測92 5.4.4分析數據集93 5.4.5使用k折交叉驗證評估推薦模型95 5.4.6評估基于用戶的協同過濾96 5.5構建基于項目的推薦模型99 5.5.1構建IBCF推薦模型100 5.5.2模型評估103 5.5.3模型準確率度量104 5.5.4模型準確率繪圖105 5.5.5IBCF參數調優107 5.6使用Python構建協同過濾110 5.6.1安裝必要包110 5.6.2數據源110 5.7數據探討111 5.7.1表示評級矩陣113 5.7.2創建訓練集和測試集114 5.7.3構建UBCF的步驟115 5.7.4基于用戶的相似度計算115 5.7.5預測活躍用戶的未知評級116 5.8使用KNN 進行基于用戶的協同過濾117 5.9基于項目的推薦118 5.9.1評估模型119 5.9.2KNN訓練模型120 5.9.3評估模型120 5.10本章小結120 第6章 構建個性化推薦引擎121 6.1個性化推薦系統122 6.2基于內容的推薦系統122 6.2.1構建一個基于內容的推薦系統123 6.2.2使用 R語言構建基于內容的推薦123 6.2.3使用Python語言構建基于內容的推薦133 6.3情境感知推薦系統144 6.3.1構建情境感知推薦系統144 6.3.2使用R語言構建情境感知推薦145 6.4本章小結150 第7章 使用Spark構建實時推薦引擎151 7.1Spark 2.0介紹152 7.1.1Spark架構152 7.1.2Spark組件154 7.1.3Spark Core154 7.1.4Spark的優點156 7.1.5Spark設置156 7.1.6SparkSession157 7.1.7彈性分布式數據集158 7.1.8關于ML流水線158 7.2使用交替最小二乘法進行協同過濾160 7.3使用PySpark構建基于模型的推薦系統162 7.4MLlib推薦引擎模塊163 7.5推薦引擎方法164 7.5.1實現164 7.5.2基于用戶的協同過濾172 7.5.3模型評估173 7.5.4模型選擇和超參數調優174 7.6本章小結179 第8章 通過Neo4j構建實時推薦180 8.1圖數據庫種類181 8.2Neo4j183 8.2.1Cypher查詢語言184 8.2.2節點語法184 8.2.3關系語法185 8.2.4構建第一個圖185 8.3Neo4j Windows安裝192 8.4Neo4j Linux安裝194 8.4.1下載Neo4j194 8.4.2設置Neo4j195 8.4.3命令行啟動Neo4j195 8.5構建推薦引擎197 8.5.1將數據加載到Neo4j197 8.5.2使用Neo4j生成推薦200 8.5.3使用歐氏距離進行協同過濾201 8.5.4使用余弦相似度進行協同過濾206 8.6本章小結209 第9章 使用Mahout構建可擴展的推薦引擎210 9.1Mahout簡介211 9.2配置Mahout211 9.2.1Mahout單機模式211 9.2.2Mahout分布式模式218 9.3Mahout的核心構建模塊220 9.3.1基于用戶的協同過濾推薦引擎組件220 9.3.2使用Mahout構建推薦引擎223 9.3.3數據描述223 9.3.4基于用戶的協同過濾225 9.4基于項目的協同過濾228 9.5協同過濾評估231 9.6基于用戶的推薦評估231 9.7基于項目的推薦評估232 9.8SVD推薦系統235 9.9使用Mahout進行分布式推薦236 9.10可擴展系統的架構240 9.11本章小結241 第10章 推薦引擎的未來242 10.1推薦引擎的未來242 10.2推薦系統的發展階段243 10.2.1一般的推薦系統243 10.2.2個性化推薦系統244 10.2.3未來的推薦系統245 10.2.4下一個最佳舉措249 10.2.5使用案例249 10.3流行方法251 10.4推薦引擎的時效性252 10.4.1A/B測試253 10.4.2反饋機制254 10.5本章小結255 推薦引擎,是主動發現用戶當前或潛在需求,并主動推送信息給用戶的信息網絡。挖掘用戶的喜好和需求,主動向用戶推薦其感興趣或者需要的對象。近些年該技術得到普遍使用,應用于各種應用程序中。因此,更多的開發者開始關注個性推薦引擎的搭建。本書是人工智能數據科學家Suresh Kumar Gorakala經多年實踐及研究所著,由淺入深介紹了推薦引擎搭建的方法,并展望了推薦引擎的未來發展。
|