
0人評分過此書
Python 從網路爬蟲到生活應用超實務:人工智慧世代必備的資料擷取術
☀ 科技來自於人性,讓程式設計回歸生活上的應用!
☀ 本書不只讓你學會Python,還要讓它「真正」進入你的日常生活!
【內容簡介】
人工智慧世代必備的資料擷取術 ─ 網路爬蟲,幫你建立 Python 網路爬蟲 SOP 標準作業程序
☛ 資料是王 ( Data is King ),誰擁有資料,誰就能主宰世界。從 Python 網路爬蟲到生活應用,完整說明你需要必備的 Python 資料擷取術。
☛ 網路爬蟲就是從 HTML 網頁取得資料。你可以想像在 Web 星球 ( WWW ) 上有眾多果園 ( 網站 ) 和 HTML 果樹 ( 網頁 ),你的工作是拿著水果籃進入指定的果園後,爬上果樹摘下樹上的水果 ( HTML 標籤 ),你需要定位水果在哪裡以及規劃摘取順序,才能成功摘下整棵樹的水果,放進水果籃。
☛ 本書讓你學得到 Python,用得到 Python,還能夠「真正活用」Python 來解決你日常生活、學習和工作上,各種資料擷取和處理的問題。
適用讀者
✎ 已經有其他程式語言基礎、或對運算思維有興趣的初學者。
✎ 適合讀者自學 Python 程式設計,亦可作為 Python 程式設計相關課程的上課教材。
☀ 本書不只讓你學會Python,還要讓它「真正」進入你的日常生活!
【內容簡介】
人工智慧世代必備的資料擷取術 ─ 網路爬蟲,幫你建立 Python 網路爬蟲 SOP 標準作業程序
☛ 資料是王 ( Data is King ),誰擁有資料,誰就能主宰世界。從 Python 網路爬蟲到生活應用,完整說明你需要必備的 Python 資料擷取術。
☛ 網路爬蟲就是從 HTML 網頁取得資料。你可以想像在 Web 星球 ( WWW ) 上有眾多果園 ( 網站 ) 和 HTML 果樹 ( 網頁 ),你的工作是拿著水果籃進入指定的果園後,爬上果樹摘下樹上的水果 ( HTML 標籤 ),你需要定位水果在哪裡以及規劃摘取順序,才能成功摘下整棵樹的水果,放進水果籃。
☛ 本書讓你學得到 Python,用得到 Python,還能夠「真正活用」Python 來解決你日常生活、學習和工作上,各種資料擷取和處理的問題。
適用讀者
✎ 已經有其他程式語言基礎、或對運算思維有興趣的初學者。
✎ 適合讀者自學 Python 程式設計,亦可作為 Python 程式設計相關課程的上課教材。
-
01 Python程式設計入門
-
1-1 Python變數、資料型別與運算子
-
1-2 流程控制
-
1-3 函式、模組與套件
-
1-4 容器型別
-
1-5 類別與物件
-
1-6 檔案處理
-
-
02 爬取的資料來源:HTML、CSV和JSON
-
2-1 HTML與CSS基礎
-
2-2 資料標籤–文字和圖片標籤
-
2-3 群組標籤–清單、表格和結構標籤
-
2-4 網站巡覽–超連結標籤
-
2-5 互動介面–表單標籤
-
2-6 CSV與JSON
-
-
03 作業步驟一:認識網路爬蟲與HTML網頁分析
-
3-1 網路爬蟲與URL網址
-
3-2 認識JavaScript動態網頁內容
-
3-3 建立Python網路爬蟲的SOP
-
3-4 使用開發人員工具分析HTML網頁結構
-
3-5 生活應用:分析BBC News新聞清單的標籤結構
-
-
04 作業步驟二:Requests和Selenium取得網路資料
-
4-1 使用requests取得網路資料
-
4-2 使用Selenium取得網路資料
-
4-3 取得HTML表單送回的網路資料
-
4-4 使用Web API取得網路資料
-
4-5 生活應用:取得無限捲動分頁的網路資料
-
4-6 生活應用:剖析摩根台股指數的JSON資料
-
-
05 作業步驟三:BeautifulSoup剖析和擷取網頁資料
-
5-1 使用BeautifulSoup擷取網頁資料
-
5-2 使用正規表達式擷取網頁資料
-
5-3 Selenium+BeautifulSoup擷取網頁資料
-
5-4 如何破解網站的防爬機制
-
5-5 生活應用:爬取BBC News新聞清單
-
5-6 生活應用:Selenium自動登入Facebook
-
-
06 作業步驟四:Pandas資料清理、讀取與儲存
-
6-1 Pandas基本使用
-
6-2 Pandas資料讀取與儲存
-
6-3 Pandas常用的資料處理
-
6-4 Pandas資料清理
-
6-5 生活應用:使用Pandas繪製視覺化圖表
-
-
07 應用實務:爬取食衣住行和娛樂資訊
-
7-1 擷取單一網頁的單一資料
-
7-2 擷取單一網頁的單筆記錄
-
7-3 擷取單一網頁的多筆記錄
-
7-4 擷取多頁網頁的多筆記錄
-
7-5 生活應用:爬取台鐵列車時刻/ 車次查詢資料
-
-
08 應用實務:爬取排行榜和網路趨勢資訊
-
8-1 爬取網站的排行榜資訊
-
8-2 認識Google Trends網路趨勢
-
8-3 pytrends套件爬取Google Trends網路趨勢
-
8-4 生活應用:視覺化分析新冠肺炎的網路趨勢
-
-
09 整合應用:IFTTT、LINE和Telegram發送通知訊息
-
9-1 註冊與使用IFTTT服務
-
9-2 申請與使用LINE Notify
-
9-3 設定與使用Telegram Bot機器人
-
9-4 整合應用:IFTTT和LINE/Telegram發送即時天氣訊息
-
-
10 應用實務:爬取YouTube等影音網站
-
10-1 爬取YouTube影片搜尋頁面
-
10-2 使用pytube3套件下載YouTube 影片
-
10-3 下載YouTube聲音檔與字幕
-
10-4 生活應用:批次下載YouTube播放清單的影片
-
10-5 生活應用:爬取無限捲動分頁YouTube影片資料
-
10-6 生活應用:使用You-Get下載影音網站的影片
-
-
11 應用實務:爬取Imgur和PTT表特版圖片
-
11-1 爬取與下載網頁圖片
-
11-2 爬取Imgur網路相簿網站
-
11-3 爬取PTT BBS文章和表特版圖片
-
11-4 生活應用:使用Python批次下載爬取圖片
-
11-5 生活應用:爬取和下載Instagram圖片
-
-
12 整合應用:自動排程通知、爬取/下載資料和Telegram Bot
-
12-1 使用APScheduler套件建立自動排程
-
12-2 建立Telegram Bot機器人
-
12-3 整合應用:自動排程送出通知訊息
-
12-4 整合應用:自動排程下載多媒體資料
-
12-5 整合應用:Telegram Bot管家機器人
-
-
13 應用實務:爬取金融與商務資料
-
13-1 爬取即時匯率和匯率的歷史資料
-
13-2 使用twder 套件爬取新台幣匯率
-
13-3 爬取上市櫃公司的金融數據
-
13-4 生活應用:爬取台灣證交所的券商資料
-
13-5 生活應用:使用上市公司月營收選出好股票
-
-
14 應用實務:爬取股市指數和股價數據
-
14-1 爬取股價指數和股價資料
-
14-2 使用twstock套件爬取台股股價
-
14-3 爬取yahoo! finance股價資料
-
14-4 爬取台股三大法人買賣超日報表
-
14-5 生活應用:繪製台積電股價的移動平均線
-
14-6 生活應用:使用twstock套件分析股票買賣點
-
-
15 整合應用:SQLite資料庫和Plotly繪製互動圖表
-
15-1 SQLite資料庫的基本使用
-
15-2 使用Plotly套件繪製網頁互動圖表
-
15-3 整合應用:將爬取的股票資料存入資料庫
-
15-4 整合應用:Plotly繪製台積電股票的OHLC圖表
-
-
16 整合應用:Web API和LINE/Telegram Bot聊天機器人
-
16-1 Flask的基本使用
-
16-2 使用Ngrok取得外部URL網址
-
16-3 整合應用:Flask建立Web API
-
16-4 整合應用:Flask建立LINE Bot聊天機器人
-
16-5 整合應用:Flask建立Telegram Bot聊天機器人
-
-
A 安裝與使用Python開發環境 - Anaconda和WinPython
-
A-1 Anaconda整合散發套件
-
A-2 WinPython整合散發套件
-
A-3 Spyder整合開發環境的使用
-
A-4 Python IDLE整合開發環境的使用
-
A-5 使用pip安裝Python套件
-
- 出版地 : 臺灣
- 語言 : 繁體中文
評分與評論
請登入後再留言與評分