0人評分過此書

Python 從網路爬蟲到生活應用超實務:人工智慧世代必備的資料擷取術

出版日期
2020/12/02
閱讀格式
PDF
書籍分類
學科分類
ISBN
9789864345397

本館館藏

借閱規則
當前可使用人數 30
借閱天數 14
線上看 0
借閱中 0

計次服務

借閱規則
借閱天數 14
選擇分享方式

推薦本館採購書籍

您可以將喜歡的電子書推薦給圖書館,圖書館會參考讀者意見進行採購

讀者資料
圖書館
* 姓名
* 身分
系所
* E-mail
※ 我們會寄送一份副本至您填寫的Email中
電話
※ 電話格式為 區碼+電話號碼(ex. 0229235151)/ 手機格式為 0900111111
* 請輸入驗證碼
☀ 科技來自於人性,讓程式設計回歸生活上的應用!
☀ 本書不只讓你學會Python,還要讓它「真正」進入你的日常生活!


【內容簡介】

人工智慧世代必備的資料擷取術 ─ 網路爬蟲,幫你建立 Python 網路爬蟲 SOP 標準作業程序
☛ 資料是王 ( Data is King ),誰擁有資料,誰就能主宰世界。從 Python 網路爬蟲到生活應用,完整說明你需要必備的 Python 資料擷取術。
☛ 網路爬蟲就是從 HTML 網頁取得資料。你可以想像在 Web 星球 ( WWW ) 上有眾多果園 ( 網站 ) 和 HTML 果樹 ( 網頁 ),你的工作是拿著水果籃進入指定的果園後,爬上果樹摘下樹上的水果 ( HTML 標籤 ),你需要定位水果在哪裡以及規劃摘取順序,才能成功摘下整棵樹的水果,放進水果籃。
☛ 本書讓你學得到 Python,用得到 Python,還能夠「真正活用」Python 來解決你日常生活、學習和工作上,各種資料擷取和處理的問題。


適用讀者
✎ 已經有其他程式語言基礎、或對運算思維有興趣的初學者。
✎ 適合讀者自學 Python 程式設計,亦可作為 Python 程式設計相關課程的上課教材。
  • 01 Python程式設計入門
    • 1-1 Python變數、資料型別與運算子
    • 1-2 流程控制
    • 1-3 函式、模組與套件
    • 1-4 容器型別
    • 1-5 類別與物件
    • 1-6 檔案處理
  • 02 爬取的資料來源:HTML、CSV和JSON
    • 2-1 HTML與CSS基礎
    • 2-2 資料標籤–文字和圖片標籤
    • 2-3 群組標籤–清單、表格和結構標籤
    • 2-4 網站巡覽–超連結標籤
    • 2-5 互動介面–表單標籤
    • 2-6 CSV與JSON
  • 03 作業步驟一:認識網路爬蟲與HTML網頁分析
    • 3-1 網路爬蟲與URL網址
    • 3-2 認識JavaScript動態網頁內容
    • 3-3 建立Python網路爬蟲的SOP
    • 3-4 使用開發人員工具分析HTML網頁結構
    • 3-5 生活應用:分析BBC News新聞清單的標籤結構
  • 04 作業步驟二:Requests和Selenium取得網路資料
    • 4-1 使用requests取得網路資料
    • 4-2 使用Selenium取得網路資料
    • 4-3 取得HTML表單送回的網路資料
    • 4-4 使用Web API取得網路資料
    • 4-5 生活應用:取得無限捲動分頁的網路資料
    • 4-6 生活應用:剖析摩根台股指數的JSON資料
  • 05 作業步驟三:BeautifulSoup剖析和擷取網頁資料
    • 5-1 使用BeautifulSoup擷取網頁資料
    • 5-2 使用正規表達式擷取網頁資料
    • 5-3 Selenium+BeautifulSoup擷取網頁資料
    • 5-4 如何破解網站的防爬機制
    • 5-5 生活應用:爬取BBC News新聞清單
    • 5-6 生活應用:Selenium自動登入Facebook
  • 06 作業步驟四:Pandas資料清理、讀取與儲存
    • 6-1 Pandas基本使用
    • 6-2 Pandas資料讀取與儲存
    • 6-3 Pandas常用的資料處理
    • 6-4 Pandas資料清理
    • 6-5 生活應用:使用Pandas繪製視覺化圖表
  • 07 應用實務:爬取食衣住行和娛樂資訊
    • 7-1 擷取單一網頁的單一資料
    • 7-2 擷取單一網頁的單筆記錄
    • 7-3 擷取單一網頁的多筆記錄
    • 7-4 擷取多頁網頁的多筆記錄
    • 7-5 生活應用:爬取台鐵列車時刻/ 車次查詢資料
  • 08 應用實務:爬取排行榜和網路趨勢資訊
    • 8-1 爬取網站的排行榜資訊
    • 8-2 認識Google Trends網路趨勢
    • 8-3 pytrends套件爬取Google Trends網路趨勢
    • 8-4 生活應用:視覺化分析新冠肺炎的網路趨勢
  • 09 整合應用:IFTTT、LINE和Telegram發送通知訊息
    • 9-1 註冊與使用IFTTT服務
    • 9-2 申請與使用LINE Notify
    • 9-3 設定與使用Telegram Bot機器人
    • 9-4 整合應用:IFTTT和LINE/Telegram發送即時天氣訊息
  • 10 應用實務:爬取YouTube等影音網站
    • 10-1 爬取YouTube影片搜尋頁面
    • 10-2 使用pytube3套件下載YouTube 影片
    • 10-3 下載YouTube聲音檔與字幕
    • 10-4 生活應用:批次下載YouTube播放清單的影片
    • 10-5 生活應用:爬取無限捲動分頁YouTube影片資料
    • 10-6 生活應用:使用You-Get下載影音網站的影片
  • 11 應用實務:爬取Imgur和PTT表特版圖片
    • 11-1 爬取與下載網頁圖片
    • 11-2 爬取Imgur網路相簿網站
    • 11-3 爬取PTT BBS文章和表特版圖片
    • 11-4 生活應用:使用Python批次下載爬取圖片
    • 11-5 生活應用:爬取和下載Instagram圖片
  • 12 整合應用:自動排程通知、爬取/下載資料和Telegram Bot
    • 12-1 使用APScheduler套件建立自動排程
    • 12-2 建立Telegram Bot機器人
    • 12-3 整合應用:自動排程送出通知訊息
    • 12-4 整合應用:自動排程下載多媒體資料
    • 12-5 整合應用:Telegram Bot管家機器人
  • 13 應用實務:爬取金融與商務資料
    • 13-1 爬取即時匯率和匯率的歷史資料
    • 13-2 使用twder 套件爬取新台幣匯率
    • 13-3 爬取上市櫃公司的金融數據
    • 13-4 生活應用:爬取台灣證交所的券商資料
    • 13-5 生活應用:使用上市公司月營收選出好股票
  • 14 應用實務:爬取股市指數和股價數據
    • 14-1 爬取股價指數和股價資料
    • 14-2 使用twstock套件爬取台股股價
    • 14-3 爬取yahoo! finance股價資料
    • 14-4 爬取台股三大法人買賣超日報表
    • 14-5 生活應用:繪製台積電股價的移動平均線
    • 14-6 生活應用:使用twstock套件分析股票買賣點
  • 15 整合應用:SQLite資料庫和Plotly繪製互動圖表
    • 15-1 SQLite資料庫的基本使用
    • 15-2 使用Plotly套件繪製網頁互動圖表
    • 15-3 整合應用:將爬取的股票資料存入資料庫
    • 15-4 整合應用:Plotly繪製台積電股票的OHLC圖表
  • 16 整合應用:Web API和LINE/Telegram Bot聊天機器人
    • 16-1 Flask的基本使用
    • 16-2 使用Ngrok取得外部URL網址
    • 16-3 整合應用:Flask建立Web API
    • 16-4 整合應用:Flask建立LINE Bot聊天機器人
    • 16-5 整合應用:Flask建立Telegram Bot聊天機器人
  • A 安裝與使用Python開發環境 - Anaconda和WinPython
    • A-1 Anaconda整合散發套件
    • A-2 WinPython整合散發套件
    • A-3 Spyder整合開發環境的使用
    • A-4 Python IDLE整合開發環境的使用
    • A-5 使用pip安裝Python套件

評分與評論

請登入後再留言與評分
幫助
您好,請問需要甚麼幫助呢?
使用指南

客服專線:0800-000-747

服務時間:週一至週五 AM 09:00~PM 06:00

loading