
0人評分過此書
Python × Excel VBA × JavaScript|網路爬蟲 × 實戰演練
.進階封包分析技巧,掌握數據來源熟悉度。
.逐步說明的實戰範例,輕鬆學會網站爬蟲技巧。
.清楚分類網站類型,系統性了解網站全貌。
.多語言開發技巧,快速提升程式開發能力。
.多元開發技巧,節省自行搜尋與研究時間。
本書著重多語言操作應用(Excel VBA、Python、JavaScript)與多解法開發爬蟲程式、網路封包側錄分析、網站資料尋找分析,有別於坊間爬蟲書籍僅以Python作為爬蟲操作語言與單一方式解決問題的作法。
著重原理與觀念,多角度學習,效果更佳
承襲《Excel VBA 實戰技巧|金融數據x網路爬蟲》中提過的觀念,「爬蟲原理與觀念通了,任何程式語言都可以做爬蟲程式」與多元開發的精神。本書在加入Python後,並以Python常見的爬蟲模組來解決同一個爬蟲問題,讓讀者可從多角度去學習Python與爬蟲程式的開發技巧。
JavsScript加密混淆破解技法大公開
JavaScript對於網頁是非常重要的腳本語言,而讀者遇到以JavaScript做加密、混淆、美化等技巧的網頁,往往就望之興嘆無法再進行分析與開發爬蟲,藉由Excel VBA、Python對JavaScript操作範例練習,讓讀者面對相關網頁不再裹足不前。
針對封包側錄與發送過程進行詳細的探討與解說
封包分析是開發爬蟲程式最重要的一環,若封包側錄、分析、發送等環節出錯,將會導致開發爬蟲程式出現嚴重錯誤,陷入「一步錯步步錯」的窘境,要解決此問題就必須對封包發送內容能清楚掌握,本書針對封包側錄與發送過程進行詳細的探討與解說,透過工具設定與操作,明確封包內容資訊,進一步提升爬蟲分析能力。
分析網站資料產生的流程,分成網頁操作、封包側錄與分析、連線測試等階段,將每個階段的特徵記錄、整理、歸納而成「網頁操作分析表」,讓讀者在分析網站能一目了然網頁全貌,可避免分析了後面忘了前面的分析,導致開發爬蟲程式遺漏了關鍵步驟而造成無法抓取網頁資料。
各界推薦
國立政治大學應用數學系副教授 蔡炎龍
Tivo168教你Excel輕鬆投資理財 Tivo Chang
算利教官 楊禮軒
.逐步說明的實戰範例,輕鬆學會網站爬蟲技巧。
.清楚分類網站類型,系統性了解網站全貌。
.多語言開發技巧,快速提升程式開發能力。
.多元開發技巧,節省自行搜尋與研究時間。
本書著重多語言操作應用(Excel VBA、Python、JavaScript)與多解法開發爬蟲程式、網路封包側錄分析、網站資料尋找分析,有別於坊間爬蟲書籍僅以Python作為爬蟲操作語言與單一方式解決問題的作法。
著重原理與觀念,多角度學習,效果更佳
承襲《Excel VBA 實戰技巧|金融數據x網路爬蟲》中提過的觀念,「爬蟲原理與觀念通了,任何程式語言都可以做爬蟲程式」與多元開發的精神。本書在加入Python後,並以Python常見的爬蟲模組來解決同一個爬蟲問題,讓讀者可從多角度去學習Python與爬蟲程式的開發技巧。
JavsScript加密混淆破解技法大公開
JavaScript對於網頁是非常重要的腳本語言,而讀者遇到以JavaScript做加密、混淆、美化等技巧的網頁,往往就望之興嘆無法再進行分析與開發爬蟲,藉由Excel VBA、Python對JavaScript操作範例練習,讓讀者面對相關網頁不再裹足不前。
針對封包側錄與發送過程進行詳細的探討與解說
封包分析是開發爬蟲程式最重要的一環,若封包側錄、分析、發送等環節出錯,將會導致開發爬蟲程式出現嚴重錯誤,陷入「一步錯步步錯」的窘境,要解決此問題就必須對封包發送內容能清楚掌握,本書針對封包側錄與發送過程進行詳細的探討與解說,透過工具設定與操作,明確封包內容資訊,進一步提升爬蟲分析能力。
分析網站資料產生的流程,分成網頁操作、封包側錄與分析、連線測試等階段,將每個階段的特徵記錄、整理、歸納而成「網頁操作分析表」,讓讀者在分析網站能一目了然網頁全貌,可避免分析了後面忘了前面的分析,導致開發爬蟲程式遺漏了關鍵步驟而造成無法抓取網頁資料。
各界推薦
國立政治大學應用數學系副教授 蔡炎龍
Tivo168教你Excel輕鬆投資理財 Tivo Chang
算利教官 楊禮軒
-
基礎篇
-
Chapter 01 Python 環境安裝與指令操作
-
1.1 Python 版本
-
1.2 套件安裝、查詢、更新與移除
-
1.3 虛擬環境建立
-
-
Chapter 02 Python 開發環境
-
2.1 Python IDLE 開發環境
-
2.2 Jupyter Notebook 開發環境
-
2.3 VS code 開發環境
-
2.4 Spyder 開發環境
-
-
Chapter 03 Excel 與Python 相互操作
-
3.1 Excel 操作Python
-
3.2 Python 操作Excel
-
3.3 Excel、Python 雙向操作
-
-
Chapter 04 Excel VBA、Python 與腳本語言操作
-
4.1 Excel VBA 與JavaScript
-
4.2 Python 與JavaScript
-
-
Chapter 05 側錄發送封包
-
5.1 Fiddler 環境設定
-
5.2 Postman 設定「Proxy」與發送封包
-
5.3 IE 瀏覽器「Proxy」設定
-
5.4 不透過「網際網路選項」設定Proxy
-
5.5 Excel VBA 發送封包
-
5.6 Python 發送封包
-
-
-
實戰篇
-
Chapter 01 全家超商門市
-
1.1 實際操作網頁
-
1.2 簡易判斷網頁資料所在位置
-
1.3 分析封包尋找資料來源
-
1.4 URL 與傳送參數驗證
-
1.5 網頁操作分析表
-
1.6 Excel VBA 抓資料
-
1.7 Python 抓資料
-
-
Chapter 02 證交所三大法人
-
2.1 實際操作網頁
-
2.2 簡易判斷資料所在位置
-
2.3 分析封包尋找資料來源
-
2.4 網頁操作分析表
-
2.5 Excel VBA 抓資料
-
2.6 Python 抓資料
-
2.7 網頁反爬蟲機制
-
2.8 應用範例:三大法人成交比重
-
-
Chapter 03 Investing 美元指數
-
3.1 實際操作網頁
-
3.2 簡易判斷資料所在位置
-
3.3 分析封包尋找資料來源
-
3.4 URL 與傳送參數驗證
-
3.5 網頁操作分析表
-
3.6 Excel VBA 抓資料
-
3.7 Python 抓資料
-
-
Chapter 04 Goodinfo 個股外資持股比例
-
4.1 實際操作網頁
-
4.2 簡易判斷資料所在位置
-
4.3 分析封包尋找資料來源
-
4.4 URL 與傳送參數驗證
-
4.5 網頁操作分析表
-
4.6 Excel VBA 抓資料
-
4.7 Python 抓資料
-
-
Chapter 05 公開資訊觀測站:重大訊息
-
5.1 實際操作網頁
-
5.2 簡易判斷資料所在位置
-
5.3 分析封包尋找資料來源
-
5.4 網頁防爬蟲機制
-
5.5 網頁操作分析表
-
5.6 Excel VBA 抓資料
-
5.7 Python 抓資料
-
-
Chapter 06 鉅亨網台股股價創新高
-
6.1 實際操作網頁
-
6.2 簡易判斷資料所在位置
-
6.3 分析封包尋找資料來源
-
6.4 URL 與傳送參數驗證
-
6.5 網頁操作分析表
-
6.6 Excel VBA 抓資料
-
6.7 Python 抓資料
-
-
Chapter 07 投信投顧公會基金投資明細 - 月前十大
-
7.1 實際操作網頁
-
7.2 簡易判斷資料所在位置
-
7.3 分析封包尋找資料來源
-
7.4 URL 與傳送參數驗證
-
7.5 網頁操作分析表
-
7.6 Excel VBA 抓資料
-
7.7 Python 抓資料
-
-
Chapter 08 PTT 八卦版標題與文章連結
-
8.1 實際操作網頁
-
8.2 分析封包尋找資料
-
8.4 URL 與傳送參數驗證
-
8.5 PTT 八卦版文章載入流程
-
8.6 網頁操作分析表
-
8.7 Excel VBA 抓資料
-
8.8 Python 抓資料
-
-
Chapter 09 MacroMicro 財經M平方
-
9.1 實際操作網頁
-
9.2 簡易判斷資料所在位置
-
9.3 分析封包尋找資料來源
-
9.4 URL 與傳送參數驗證
-
9.5 網頁防爬蟲機制
-
9.6 網頁操作分析表
-
9.7 Excel VBA 抓資料
-
9.8 Python 抓資料
-
-
Chapter 10 行政院主計處經濟成長率
-
10.1 實際操作網頁
-
10.2 簡易判斷資料所在位置
-
10.3 分析封包尋找資料來源
-
10.4 URL 與傳送參數驗證
-
10.5 網頁操作分析表
-
10.6 Excel VBA 抓資料
-
10.7 Python 抓資料
-
-
- 出版地 : 臺灣
- 語言 : 繁體中文
評分與評論
請登入後再留言與評分