0人評分過此書

圖解資料科學的工作原理

出版日期
2023/06/01
閱讀格式
PDF
書籍分類
學科分類
ISBN
9786263244603

本館館藏

借閱規則
當前可使用人數 30
借閱天數 14
線上看 0
借閱中 0
選擇分享方式

推薦本館採購書籍

您可以將喜歡的電子書推薦給圖書館,圖書館會參考讀者意見進行採購

讀者資料
圖書館
* 姓名
* 身分
系所
* E-mail
※ 我們會寄送一份副本至您填寫的Email中
電話
※ 電話格式為 區碼+電話號碼(ex. 0229235151)/ 手機格式為 0900111111
* 請輸入驗證碼
內容簡介:書中收錄給新手的重點詞彙集!

從分析方法到AI基本概念,圖解所有應該掌握的知識

圖表、數值種類、資料結果等,從基礎知識開始講解!
技術相關項目也會圖解說明,幫助初學者理解內容!
完整收錄統計學、AI基礎概念等相關知識!
網羅資訊社會中資料運用的問題點與課題!

資料科學家(Data Scientist)一詞已經使用超過10年,資料科學(Data Science)也時有耳聞。AI、物聯網愈發受到注目,IT工程人員紛紛投入資料分析的業務,運用他人的分析結果建構系統的事例亦不斷增加。相信不久的將來,在商務中使用資料會將變得理所當然。

稍微掌握基礎知識後,會想要嘗試複雜的分析手法。然而即便完成高階分析,如果接收者無法理解分析結果,就失去資料分析的意義了。

分析人員對分析手法會有深入了解,會仔細調查新的分析方法,但接收分析結果的受眾,不見得有充實的背景知識。

因此,如果最後的結論相同,建議使用比較簡單的方法。即便不用高階統計方法、機器學習,簡單的圖表也足以解釋背後的意義。有時也不需要使用數值資料準確地分析,簡單易懂的圖解就十分足夠。

然而接收分析結果的人不宜毫無背景知識,也不應因方便而要求使用簡單的分析方法。不僅是分析人員,接收分析結果的人的也需要學習。

本書將會圖解介紹各種分析方法的概要,但收錄的內容終究僅是概略的內容,想要進一步深入了解的話,建議搭配專業書籍來閱讀。不過,了解有哪些分析方法、掌握各種手法的特徵,其實本書就綽綽有餘了。在運用手邊的資料之前,一起學習資料的分析方法及處理時的注意事項吧。

-增井敏克
  • 前言
  • 第1章 資料科學的相關技術~未來需求漸升的必修科目~
    • 1-1 21世紀的資源 資料、資訊
    • 1-2 資料增加的原因 資訊化社會、物聯網、資訊社會、感測器
    • 1-3 結合各種知識進行分析 資料科學、資料探勘
    • 1-4 找出資料價值的職業 資料科學家、資料工程師、資料分析師
    • 1-5 資料需要加工處理 結構化資料、非結構化資料
    • 1-6 巨量資料是座寶山 大數據、3V
    • 1-7 人類和電腦容易處理的資料不同 雜亂資料、整潔資料
    • 1-8 描述資料本身的資料 主檔資料、元資料
    • 1-9 將資料集結起來 資料基礎建設、儀表板、資料管道
    • 1-10 檢討高效率的處理程序 演算法、資料結構
    • 1-11 套用推論規則 模型、建模
    • 1-12 處理資料的程設語言 R、Python、Julia
    • 1-13 任誰皆可免費使用的資料 開放資料、e-Stat、WebAPI
    • 1-14 邊玩邊學分析手法 Kaggle、程式設計競賽、CTF
    • 1-15 以資訊科技創造新商務 數位轉型(DX)、資訊數位化、技術數位化
    • 1-16 運用分析資料的例子 聊天機器人、推薦功能
    • 1-17 購買此商品的顧客也同時購買 購物籃分析、關聯分析、RFM 分析
    • 1-18 根據資料改變定價 動態定價、FinTech
    • 1-19 小範圍嘗試 PoC、small start
    • 1-20 持續進行改善 PDCA循環、OODA循環、回饋循環
    • 1-21 設立目標並有策略地執行 KPI、KGI、KSF
    • 1-22 掌握資料的關係人 使用案例、權益人
    • 嘗試看看:調查運用資料的案例
  • 第2章 資料的基本知識~資料的表達方式與閱讀方式~
    • 2-1 資料種類 名目尺度、順序尺度、區間尺度、等比尺度、定性變數、定量變數
    • 2-2 依範圍區分資料 次數分布表、組別、次數、組距、直方圖
    • 2-3 區分使用圖表 長條圖、折線圖
    • 2-4 表達比例的圖表 圓餅圖、帶狀圖
    • 2-5 以1個圖表描述多個資料 雷達圖、盒形圖
    • 2-6 當作資料基準的數值 代表值、平均數、中位數、穩健性、眾數
    • 2-7 掌握資料的離散程度 變異數、標準差
    • 2-8 以1個基準進行判斷 變異係數、標準化、T分數
    • 2-9 處理不適當的資料 離群值、遺漏值
    • 2-10 八成的營業額來自兩成的商品? 柏拉圖法則、柏拉圖分析(ABC 分析)、柏拉圖、長尾效應
    • 2-11 視覺化表達 資料視覺化、熱點圖、文字雲
    • 2-12 任誰都可分析資料的便利工具 商業智慧工具、線上分析處理
    • 2-13 統一管理資料 資料倉儲(DWH)、資料湖、資料市集
    • 2-14 檢討資料的連動 ETL、EAI、ESB
    • 2-15 視覺化資料結構 實體關係圖、資料流程圖、CRUD表、CRUD圖
    • 2-16 設計資料庫 正規化、反正規化
    • 2-17 讀取印刷資料的內容 OCR、OMR
    • 2-18 高速高準確率讀取資料 條碼、QR碼、NFC
    • 嘗試看看:根據欲傳達的內容選擇圖表
  • 第3章 資料處理與運用~歸類並預測資料~
    • 3-1 依取得時間點變動的資料 時序資料、趨勢、雜訊、週期性
    • 3-2 程式自動輸出的資料 日誌、dmp檔案
    • 3-3 捕捉長期間的變化 移動平均數、移動平均線、加權移動平均數
    • 3-4 掌握兩軸的關係 散布圖、共變異數、相關係數
    • 3-5 不受騙於虛假的關係 相關關係、因果關係、偽相關
    • 3-6 以多個座標軸統計 交叉統計、聯合分析、直交表
    • 3-7 減少座標軸數量來掌握特徵 維度、主成分分析
    • 3-8 兩點間距離的討論方式 歐幾里德距離、曼哈頓距離
    • 3-9 調查相似的角度 餘弦相似度、Word2Vec
    • 3-10 資料分析不只是聽起來酷炫 前處理、資料準備、資料清理、統合彙整
    • 3-11 釐清多個座標軸的關係 迴歸分析、最小平方法
    • 3-12 了解高階的迴歸分析 多元迴歸分析、邏輯迴歸分析
    • 3-13 預測分類 判別分析、馬哈拉諾比斯距離
    • 3-14 由已知資訊推論數值 費米推論
    • 3-15 實踐擲骰子的操作 亂數、擬隨機數、種子、蒙地卡羅法
    • 3-16 反覆預測提高準確率 德菲法、指數平滑法
    • 3-17 了解各種分析手法 多變量分析、數量化理論Ⅰ類、數量化理論Ⅱ類、數量化理論Ⅲ類
    • 嘗試看看:彙整問卷調查的結果
  • 第4章 該知道的統計學知識~由資料推論答案~
    • 4-1 統計學的種類 敘述統計學、推論統計學
    • 4-2 取出資料 母群體、樣本、隨機抽樣
    • 4-3 以數值表示容易發生的程度 統計機率、古典機率、機率、期望值
    • 4-4 多個事件同時發生的機率 聯合機率、獨立、互斥、條件機率、機率的乘法定理
    • 4-5 根據結果討論原因 事前機率、事後機率、貝氏定理、概度
    • 4-6 了解資料的分布情況 機率分布、均勻分布、二項分布、常態分布、標準常態分布
    • 4-7 資料蒐集得愈多,愈接近實際數值 中央極限定理、大數法則
    • 4-8 使用函數描述分布情況 機率密度函數、累積分布函數
    • 4-9 由抽樣資料估計原始群體 不偏估計值、點估計、區間估計、信賴區間
    • 4-10 變異數未知時的估計 標準誤差、不偏變異數、自由度、t分布
    • 4-11 統計性檢定 檢定、虛無假設、對立假設、拒絕
    • 4-12 決定判斷為真的基準 檢定統計量、拒絕域、顯著水準、雙側檢定、單側檢定
    • 4-13 判斷檢定結果 p值、顯著差異、錯誤、第一類型錯誤、第二類型錯誤
    • 4-14 檢定平均數 z檢定、t 檢定
    • 4-15 檢定變異數 X2 分布、X2 檢定、F 檢定
    • 嘗試檢定身邊的食品
  • 第5章 需要知道的AI知識 ~常用的手法與工作原理~
    • 5-1 製作如人類般聰明的電腦 人工智慧(AI)、杜林測試
    • 5-2 實踐人工智慧的方法 機器學習、監督式學習、非監督式學習、增強式學習
    • 5-3 評鑑人工智慧的指標 混淆矩陣、準確率、精確率、召回率、F值、交叉驗證
    • 5-4 掌握訓練的進行情況 過度配適、不當配適
    • 5-5 仿效大腦的學習方法 類神經網路、損失函數、誤差反向傳播法
    • 5-6 逐漸接近最佳解 梯度下降法、局部解、學習率
    • 5-7 增加階層並學習大量的資料 深度學習、CNN、RNN、LSTM
    • 5-8 量化誤差 偏差方差分解、消長關係
    • 5-9 提升準確率 正規化、套索迴歸、脊迴歸
    • 5-10 區分成多個群組 叢集分析、k-平均法
    • 5-11 區分成任意個數 階層式叢集分析、沃德法、最短距離法、最長距離法
    • 5-12 以樹狀結構訓練 決策樹、不純度、資訊獲利
    • 5-13 以複數AI採取多數決 隨機森林、集成式學習、裝袋演算法、提升演算法
    • 5-14 評鑑規則的指標 支持度、信賴度、增益率
    • 5-15 最大化與邊界的間距 支援向量機、超平面、硬間距、軟間距
    • 5-16 自動執行機器學習 AutoML、可解釋的人工智慧
    • 5-17 結合各種手法找出解決方法 作業研究、數學最佳化、數學規劃法、機率規劃法
    • 嘗試看看:搜尋最新論文
  • 第6章 資訊安全與隱私問題~資訊社會今後的走向~
    • 6-1 有道德地使用資料 資訊倫理、資料倫理
    • 6-2 搖擺不定的資料信賴性 統計造假、技術人員倫理
    • 6-3 因錯誤認識而失真的準確率 資料偏誤、演算法偏誤
    • 6-4 日本的個人資料運用 個人資料保護法、隱私標章
    • 6-5 各國的個人資料運用 GDPR、CCPA
    • 6-6 運用個人資料 假名化、匿名化、k-匿名化
    • 6-7 資料流通與運用 資料主導的社會、超智能社會、資訊銀行
    • 6-8 決定資料的處理規則 資訊安全政策、隱私權政策
    • 6-9 公開蒐集資料的理由 使用目的、選擇加入、選擇退出
    • 6-10 資料本身的權利 智慧財產權、著作權
    • 6-11 自動取得外部資料 網路搜刮、網路爬行
    • 6-12 管理儲存資料的存取 存取控制、備份
    • 6-13 防止由內部帶出資料 稽核、DLP
    • 6-14 每次都得到相同的結果 冪等性
    • 嘗試看看:閱讀你的服務隱私權政策
  • 詞彙集
  • 索引
  • 出版地 臺灣
  • 語言 繁體中文

評分與評論

請登入後再留言與評分
幫助
您好,請問需要甚麼幫助呢?
使用指南

客服專線:0800-000-747

服務時間:週一至週五 AM 09:00~PM 06:00

loading