
0人評分過此書
科技巨頭的演算法大揭祕:資料科學家必讀的資料科學與機器學習實戰筆記
學習頂尖公司的演算法與資料科學,啟發AI創新應用!
完整蒐集頂尖科技公司的演算法,學習AI世界的經驗精華!
全面解析及整理頂尖科技公司的機器學習模型,借鏡打造AI創新路徑!
♚瞭解資料科學:說明資料科學概念,深入淺出演算法
♚掌握實例應用:學習科技公司技術,掌握各種應用場景
♚運用實戰案例:涵蓋各種機器學習模型來打造實用功能
♚清楚內容編排:針對所需主題閱讀,充分理解演算法概念
【內容簡介】
本書內容改編自第14屆iThome鐵人賽AI& Data組的冠軍系列文章《那些在科技公司和App背後的資料科學》。你是否好奇全球頂尖的科技公司是如何利用資料科學打造出創新且成功的產品呢?本書將會深入介紹Spotify、Meta、Netflix、Uber和Airbnb等科技巨頭如何借助於資料科學和機器學習的技術,來為其產品注入革命性的創新。
本書整理及解析頂尖科技公司的機器模型與應用,內容從閱讀本書所需具備的概念開始,包括推薦系統、多臂式吃角子老虎機、A/B測試及排序模型的常見指標,再分別介紹科技巨頭的演算法內容,如Spotify和Netflix的多媒體內容推薦、Meta的社交內容推薦及排序、Airbnb的搜尋系統及房源排序模型、Uber和Uber Eats的預測模型及推薦系統等,我們將可瞭解這些演算法的理論知識,更可透過案例來學習這些模型是如何應用於實際產品之中。
【目標讀者】
✔想要對科技公司的演算法一探究竟的資料科學家。
✔想借鏡於頂尖科技公司如何利用資料科學,來改善個人的產品或服務的科技產業工作者。
✔想進一步發展自身技能的資料科學家和工程師。
✔對資料科學、科技和創新有濃厚興趣的讀者。
【專業推薦】
「本書非常有結構地介紹現在科技巨頭賴以維生的各種推薦與媒合演算法。內容由淺入深地討論這些科技巨頭如何使用海量數據來揣度人心,闡釋為何看似相同的推薦與媒合問題在不同公司卻有本家家難念的經。」
─ 黃從仁,國立臺灣大學心理學系模型建構與資訊學實驗室
完整蒐集頂尖科技公司的演算法,學習AI世界的經驗精華!
全面解析及整理頂尖科技公司的機器學習模型,借鏡打造AI創新路徑!
♚瞭解資料科學:說明資料科學概念,深入淺出演算法
♚掌握實例應用:學習科技公司技術,掌握各種應用場景
♚運用實戰案例:涵蓋各種機器學習模型來打造實用功能
♚清楚內容編排:針對所需主題閱讀,充分理解演算法概念
【內容簡介】
本書內容改編自第14屆iThome鐵人賽AI& Data組的冠軍系列文章《那些在科技公司和App背後的資料科學》。你是否好奇全球頂尖的科技公司是如何利用資料科學打造出創新且成功的產品呢?本書將會深入介紹Spotify、Meta、Netflix、Uber和Airbnb等科技巨頭如何借助於資料科學和機器學習的技術,來為其產品注入革命性的創新。
本書整理及解析頂尖科技公司的機器模型與應用,內容從閱讀本書所需具備的概念開始,包括推薦系統、多臂式吃角子老虎機、A/B測試及排序模型的常見指標,再分別介紹科技巨頭的演算法內容,如Spotify和Netflix的多媒體內容推薦、Meta的社交內容推薦及排序、Airbnb的搜尋系統及房源排序模型、Uber和Uber Eats的預測模型及推薦系統等,我們將可瞭解這些演算法的理論知識,更可透過案例來學習這些模型是如何應用於實際產品之中。
【目標讀者】
✔想要對科技公司的演算法一探究竟的資料科學家。
✔想借鏡於頂尖科技公司如何利用資料科學,來改善個人的產品或服務的科技產業工作者。
✔想進一步發展自身技能的資料科學家和工程師。
✔對資料科學、科技和創新有濃厚興趣的讀者。
【專業推薦】
「本書非常有結構地介紹現在科技巨頭賴以維生的各種推薦與媒合演算法。內容由淺入深地討論這些科技巨頭如何使用海量數據來揣度人心,闡釋為何看似相同的推薦與媒合問題在不同公司卻有本家家難念的經。」
─ 黃從仁,國立臺灣大學心理學系模型建構與資訊學實驗室
- 推薦序
- 序言
- 關於本書
-
Chapter 01 科技產品演算法的先備知識
-
1.1 什麼是推薦系統?
-
1.1.1 推薦系統的基本概念
-
1.1.2 推薦系統的三種模型
-
1.1.3 推薦系統的挑戰
-
-
1.2 多臂式吃角子老虎機
-
1.2.1 MAB 的兩種行為選擇
-
1.2.2 MAB 的四種策略和獎賞計算方式
-
-
1.3 A/B 測試
-
1.3.1 A/B 測試的基本介紹
-
1.3.2 為什麼要使用A/B 測試?
-
1.3.3 實驗數據的統計分析
-
-
1.4 排序模型的常見指標
-
1.4.1 NDCG
-
1.4.2 Precision@k
-
-
1.5 參考文獻
-
-
Chapter 02 Spotify
-
2.1 Spotify 的使用者調查
-
2.1.1 Spotify 使用者心態
-
2.1.2 Spotify 的資料蒐集
-
2.1.3 小結
-
-
2.2 Spotify 的推薦模型:BART 模型
-
2.2.1 Spotify 推薦歌曲的權衡
-
2.2.2 BART 模型
-
2.2.3 小結
-
-
2.3 Spotify 在推薦播放清單時,同時考量用戶和音樂內容的特徵
-
2.3.1 新的獎賞函式
-
2.3.2 使用雙分群以同時考量用戶和音樂內容特徵
-
2.3.3 情境式吃角子老虎機
-
2.3.4 小結
-
-
2.4 利用用戶的音樂播放紀錄來推薦Podcast 節目
-
2.4.1 跨領域推薦
-
2.4.2 模型使用的特徵
-
2.4.3 實驗結果
-
2.4.4 實驗分析
-
2.4.5 小結
-
-
2.5 Spotify 使用NLP 打造Podcast 搜尋
-
2.5.1 Spotify 既有搜尋系統的問題
-
2.5.2 新的搜尋系統
-
2.5.3 實驗結果
-
2.5.4 小結
-
-
2.6 參考文獻
-
-
Chapter 03 Netflix
-
3.1 Netflix 的首頁設計
-
3.2 Netflix 的推薦演算法
-
3.2.1 Netflix 的最初演算法
-
3.2.2 個人化影片排名器
-
3.2.3 現正熱播
-
3.2.4 繼續觀賞
-
3.2.5 因為您觀賞過
-
3.2.6 每個地區的前十名
-
3.2.7 小結
-
-
3.3 Netflix 的首頁生成:內容列的選擇與排序
-
3.3.1 Netflix 的首頁設計與考量
-
3.3.2 Netflix 內容列的排序方法
-
3.3.3 小結
-
-
3.4 Netflix 的證據選擇演算法
-
3.4.1 使用證據選擇演算法
-
3.4.2 小結
-
-
3.5 Netflix 的搜尋系統
-
3.5.1 建立搜尋演算法
-
3.5.2 小結
-
-
3.6 Netflix 面臨的挑戰
-
3.6.1 挑戰一:影片版權的地區和時效性問題
-
3.6.2 挑戰二:文化多樣性
-
3.6.3 挑戰三:語言問題
-
3.6.4 挑戰四:Netflix 的個人化推薦
-
3.6.5 小結
-
-
3.7 參考文獻
-
-
Chapter 04 Meta
-
4.1 Facebook 的用戶調查
-
4.1.1 調查方式
-
4.1.2 小結
-
-
4.2 Facebook 的貼文推薦產生
-
4.2.1 候選清單生成
-
4.2.2 評分與排名
-
4.2.3 小結
-
-
4.3 Instagram 的不同頁面和其演算法
-
4.3.1 Instagram 開發模型的三個必要工具
-
4.3.2 Instagram 的首頁
-
4.3.3 動態消息
-
4.3.4 建議貼文
-
4.3.5 限時動態
-
4.3.6 探索頁面
-
4.3.7 小結
-
-
4.4 參考文獻
-
-
Chapter 05 Airbnb
-
5.1 Airbnb 的搜尋系統
-
5.1.1 Airbnb 是市場搜尋平台
-
5.1.2 搜尋階段
-
5.1.3 小結
-
-
5.2 Airbnb 的房源排序模型
-
5.2.1 用深度神經網路模型和成對損失函數建構房源排序模型
-
5.2.2 Airbnb 觀察用戶需求來優化房源排序模型
-
5.2.3 小結
-
-
5.3 優化房源排序模型來提升個人化推薦
-
5.3.1 房源嵌入的訓練
-
5.3.2 相似房源推薦
-
5.3.3 小結
-
-
5.4 增加房源排序模型的多樣化
-
5.4.1 現況觀察
-
5.4.2 多樣化方法一:提升唯一房源的排名
-
5.4.3 多樣化方法二:提升被模型低估的新房源排序
-
5.4.4 多樣化方法三:降低相似房源的排名
-
5.4.5 小結
-
-
5.5 Airbnb 考量屋主喜好來排序搜尋結果
-
5.5.1 房東的偏好
-
5.5.2 如何預測房東偏好
-
5.5.3 小結
-
-
5.6 優化Airbnb 搜尋頁面的顯示內容
-
5.6.1 利用NER 了解顧客需求和房東擁有的設備
-
5.6.2 優化照片呈現:Airbnb 使用ResNet50 標記房間圖片
-
5.6.3 預測市場動態來制定最佳市場價格
-
5.6.4 Airbnb 提供市場洞察資訊,幫助用戶做出訂房決策
-
5.6.5 小結
-
-
5.7 Airbnb 的新功能:Airbnb Categories
-
5.7.1 第一步:定義房源類別
-
5.7.2 第二步:房源特徵的資料蒐集
-
5.7.3 第三步:基於規則的候選清單生成
-
5.7.4 第四步:人工審核
-
5.7.5 第五步:訓練機器學習模型
-
5.7.6 Airbnb Categories 的排名系統
-
5.7.7 小結
-
-
5.8 參考文獻
-
-
Chapter 06 Uber
-
6.1 Uber 的資料蒐集
-
6.1.1 乘客旅程狀態
-
6.1.2 Uber 的地圖資料
-
6.1.3 小結
-
-
6.2 Uber 的模型
-
6.2.1 Uber 的即時需求及特殊事件的預測
-
6.2.2 預測機場的乘車需求
-
6.2.3 配對司機和乘客
-
6.2.4 小結
-
-
6.3 Uber 用DeeprETANet 估計外送時間
-
6.3.1 傳統的ETA 估計工具:路線引擎
-
6.3.2 Uber 的ETA 估算模型:ETA 後處理系統
-
6.3.3 小結
-
-
6.4 Uber Eats
-
6.4.1 Uber Eats 要如何預測外送員將食物送達的時間
-
6.4.2 Uber Eats 的推薦系統
-
6.4.3 身為三邊市場的Uber Eats 要平衡三方需求
-
6.4.4 小結
-
-
6.5 參考文獻
-
- 結語
- 出版地 : 臺灣
- 語言 : 繁體中文
評分與評論
請登入後再留言與評分