
0人評分過此書
文科生也可以輕鬆學習網路爬蟲:Python+Web Scraper
★使用免寫程式的Web Scraper爬蟲工具和Python輕鬆學習網路爬蟲!
*本書使用Web Scraper瀏覽器擴充功能的爬蟲工具,讓你不用撰寫程式碼,就可以建立CSS選擇器的網站爬取地圖從網站擷取資料,不只能夠輕鬆爬取約7~8成網站,更透過Web Scraper工具讓你輕鬆一邊爬一邊學習HTML標籤+CSS選擇器,輕鬆了解Web網頁內容和各種網站巡覽結構。
*Python網路爬蟲程式不只能夠爬取Web Scraper工具爬取的網站內容,對於進階JavaScript動態和使用者互動網站,我們可以配合Python+Selenium爬取各種使用者互動網站,讓你在瀏覽器看得到的資料,就可以爬到資料;最後說明Python的Pandas資料清理和Plotly資料視覺化。
*本書使用Web Scraper瀏覽器擴充功能的爬蟲工具,讓你不用撰寫程式碼,就可以建立CSS選擇器的網站爬取地圖從網站擷取資料,不只能夠輕鬆爬取約7~8成網站,更透過Web Scraper工具讓你輕鬆一邊爬一邊學習HTML標籤+CSS選擇器,輕鬆了解Web網頁內容和各種網站巡覽結構。
*Python網路爬蟲程式不只能夠爬取Web Scraper工具爬取的網站內容,對於進階JavaScript動態和使用者互動網站,我們可以配合Python+Selenium爬取各種使用者互動網站,讓你在瀏覽器看得到的資料,就可以爬到資料;最後說明Python的Pandas資料清理和Plotly資料視覺化。
-
第一篇 Web Scraper網路爬蟲:免寫程式邊爬邊學HTML+CSS
-
CHAPTER 01 認識網路爬蟲、HTML和CSS
-
1-1 網路爬蟲的基礎
-
1-2 了解瀏覽器瀏覽網頁的步驟
-
1-3 認識HTTP通訊協定與URL網址
-
1-4 HTML5標示語言
-
1-5 CSS基礎與CSS選擇器
-
1-6 在瀏覽器安裝Web Scraper擴充功能
-
-
CHAPTER 02 爬取HTML標題、段落與文字格式標籤
-
2-1 爬取HTML標題文字標籤
-
2-2 爬取HTML段落文字標籤
-
2-3 爬取HTML文字格式標籤
-
2-4 CSS的型態和id屬性選擇器
-
2-5 編輯與管理Web Scraper網站地圖
-
-
CHAPTER 03 爬取清單項目和表格標籤
-
3-1 爬取HTML清單標籤
-
3-2 爬取HTML表格標籤
-
3-3 網路爬蟲實戰:PChome股票資訊
-
3-4 CSS樣式類別和群組選擇器
-
3-5 在網路地圖新增多個起始URL
-
3-6 使用Element節點爬取HTML標籤
-
-
CHAPTER 04 爬取圖片和超連結標籤
-
4-1 爬取HTML圖片標籤
-
4-2 爬取HTML超連結標籤
-
4-3 網路爬蟲實戰:Yahoo!電影本週新片清單
-
4-4 網路爬蟲實戰:Yahoo!電影本週新片詳細資訊
-
4-5 CSS選擇器的語法整理
-
-
CHAPTER 05 爬取HTML容器和版面配置標籤
-
5-1 爬取HTML容器標籤
-
5-2 網路爬蟲實戰:MoneyDJ新聞總表
-
5-3 爬取HTML版面配置標籤
-
5-4 使用正規表達式處理擷取的資料
-
-
CHAPTER 06 爬取階層選單和上/下頁巡覽網站
-
6-1 認識網站巡覽
-
6-2 爬取階層選單巡覽的網站
-
6-3 爬取上/下頁巡覽的網站
-
6-4 起始URL網址的範圍參數
-
-
CHAPTER 07 爬取頁碼、更多按鈕和無限捲動頁面巡覽的網站
-
7-1 認識Web Scraper的分頁處理
-
7-2 爬取頁碼分頁巡覽的網站
-
7-3 爬取AJAX分頁巡覽的網站
-
7-4 爬取更多按鈕巡覽的網站
-
7-5 爬取捲動頁面巡覽的網站
-
-
CHAPTER 08 Web Scraper爬蟲實戰:新聞、商務和金融數據爬取
-
8-1 網路爬蟲實戰:爬取新聞和BBS貼文
-
8-2 網路爬蟲實戰:爬取商務資料
-
8-3 網路爬蟲實戰:爬取金融數據
-
-
-
第二篇 Python網路爬蟲:網路資料擷取「全方位」實戰
-
CHAPTER 09 認識Python網路爬蟲
-
9-1 網頁設計技術與JavaScript
-
9-2 如何產生瀏覽器顯示的網頁內容
-
9-3 建立Python網路爬蟲
-
9-4 開發人員工具的使用
-
9-5 使用Python處理CSV資料
-
-
CHAPTER 10 使用requests和Selenium取得網路資料
-
10-1 使用requests取得網路資料
-
10-2 使用Selenium取得網路資料
-
10-3 取得HTML表單送回的網路資料
-
10-4 Python爬蟲實戰:取得無限捲動分頁的網路資料
-
10-5 Python爬蟲實戰:取得台鐵列車時刻/車次的查詢資料
-
-
CHAPTER 11 Beautiful Soup剖析與擷取網頁資料
-
11-1 用BeautifulSoup擷取網頁資料
-
11-2 使用正規表達式擷取網頁資料
-
11-3 Selenium+BeautifulSoup擷取網頁資料
-
11-4 Python爬蟲實戰:爬取HTML表單的互動網頁
-
-
CHAPTER 12 使用Python爬取AJAX、互動網頁與Web API
-
12-1 AJAX與JSON 的基礎
-
12-2 使用開發人員工具分析和測試AJAX請求
-
12-3 Python處理JSON資料
-
12-4 使用Web API取得網路資料
-
12-5 Python 爬蟲實戰:爬取景氣對策信號分數
-
-
CHAPTER 13 Python爬蟲實戰(一):爬取清單、表格與分頁資料
-
13-1 Python 爬蟲的常見問題
-
13-2 爬取臺北鐵路餐廳的便當菜單
-
13-3 爬取HouseFun的台北市租房資料
-
13-4 爬取台灣證交所的券商資料
-
13-5 爬取Momo購物網站NBA球衣的商品資料
-
-
CHAPTER 14 Python爬蟲實戰(二):Web API、AJAX與互動網頁資料爬取
-
14-1 OpenWeatherMap天氣資料的Web API
-
14-2 HTML表單送回的集保戶股權分散表
-
14-3 AJAX網頁的富時中國A50指數期貨
-
14-4 互動操作爬取NBA官網球員的下一頁資料
-
-
第三篇 Python大數據分析:資料清理與資料視覺化
-
CHAPTER 15 Pandas資料清理-pandas
-
15-1 Pandas基本使用
-
15-2 Pandas資料讀取與儲存
-
15-3 Pandas常用的資料處理
-
15-4 Pandas資料清理
-
15-5 資料清理實戰:清理欄位和重複標題列
-
-
CHAPTER 16 Python資料視覺化-plotly
-
16-1 認識資料視覺化
-
16-2 使用Matplotlib繪製圖表
-
16-3 使用Plotly套件繪製網頁互動圖表
-
16-4 資料視覺化實戰:使用Pandas繪製視覺化圖表
-
16-5 資料視覺化實戰:Plotly繪製股票的OHLC圖表和時序圖
-
-
- 附錄 A Python程式設計入門
- 附錄 B 離線安裝本書使用的瀏覽器擴充功能
- 附錄 C Web Scraper爬蟲網站地圖
- 出版地 : 臺灣
- 語言 : 繁體中文
評分與評論
請登入後再留言與評分