0人評分過此書

文科生也可以輕鬆學習網路爬蟲:Python+Web Scraper

出版日期
2021
閱讀格式
PDF
書籍分類
學科分類
ISBN
9789865029067

本館館藏

借閱規則
當前可使用人數 30
借閱天數 14
線上看 0
借閱中 0
選擇分享方式

推薦本館採購書籍

您可以將喜歡的電子書推薦給圖書館,圖書館會參考讀者意見進行採購

讀者資料
圖書館
* 姓名
* 身分
系所
* E-mail
※ 我們會寄送一份副本至您填寫的Email中
電話
※ 電話格式為 區碼+電話號碼(ex. 0229235151)/ 手機格式為 0900111111
* 請輸入驗證碼
★使用免寫程式的Web Scraper爬蟲工具和Python輕鬆學習網路爬蟲!

*本書使用Web Scraper瀏覽器擴充功能的爬蟲工具,讓你不用撰寫程式碼,就可以建立CSS選擇器的網站爬取地圖從網站擷取資料,不只能夠輕鬆爬取約7~8成網站,更透過Web Scraper工具讓你輕鬆一邊爬一邊學習HTML標籤+CSS選擇器,輕鬆了解Web網頁內容和各種網站巡覽結構。
*Python網路爬蟲程式不只能夠爬取Web Scraper工具爬取的網站內容,對於進階JavaScript動態和使用者互動網站,我們可以配合Python+Selenium爬取各種使用者互動網站,讓你在瀏覽器看得到的資料,就可以爬到資料;最後說明Python的Pandas資料清理和Plotly資料視覺化。
  • 第一篇 Web Scraper網路爬蟲:免寫程式邊爬邊學HTML+CSS
    • CHAPTER 01 認識網路爬蟲、HTML和CSS
      • 1-1 網路爬蟲的基礎
      • 1-2 了解瀏覽器瀏覽網頁的步驟
      • 1-3 認識HTTP通訊協定與URL網址
      • 1-4 HTML5標示語言
      • 1-5 CSS基礎與CSS選擇器
      • 1-6 在瀏覽器安裝Web Scraper擴充功能
    • CHAPTER 02 爬取HTML標題、段落與文字格式標籤
      • 2-1 爬取HTML標題文字標籤
      • 2-2 爬取HTML段落文字標籤
      • 2-3 爬取HTML文字格式標籤
      • 2-4 CSS的型態和id屬性選擇器
      • 2-5 編輯與管理Web Scraper網站地圖
    • CHAPTER 03 爬取清單項目和表格標籤
      • 3-1 爬取HTML清單標籤
      • 3-2 爬取HTML表格標籤
      • 3-3 網路爬蟲實戰:PChome股票資訊
      • 3-4 CSS樣式類別和群組選擇器
      • 3-5 在網路地圖新增多個起始URL
      • 3-6 使用Element節點爬取HTML標籤
    • CHAPTER 04 爬取圖片和超連結標籤
      • 4-1 爬取HTML圖片標籤
      • 4-2 爬取HTML超連結標籤
      • 4-3 網路爬蟲實戰:Yahoo!電影本週新片清單
      • 4-4 網路爬蟲實戰:Yahoo!電影本週新片詳細資訊
      • 4-5 CSS選擇器的語法整理
    • CHAPTER 05 爬取HTML容器和版面配置標籤
      • 5-1 爬取HTML容器標籤
      • 5-2 網路爬蟲實戰:MoneyDJ新聞總表
      • 5-3 爬取HTML版面配置標籤
      • 5-4 使用正規表達式處理擷取的資料
    • CHAPTER 06 爬取階層選單和上/下頁巡覽網站
      • 6-1 認識網站巡覽
      • 6-2 爬取階層選單巡覽的網站
      • 6-3 爬取上/下頁巡覽的網站
      • 6-4 起始URL網址的範圍參數
    • CHAPTER 07 爬取頁碼、更多按鈕和無限捲動頁面巡覽的網站
      • 7-1 認識Web Scraper的分頁處理
      • 7-2 爬取頁碼分頁巡覽的網站
      • 7-3 爬取AJAX分頁巡覽的網站
      • 7-4 爬取更多按鈕巡覽的網站
      • 7-5 爬取捲動頁面巡覽的網站
    • CHAPTER 08 Web Scraper爬蟲實戰:新聞、商務和金融數據爬取
      • 8-1 網路爬蟲實戰:爬取新聞和BBS貼文
      • 8-2 網路爬蟲實戰:爬取商務資料
      • 8-3 網路爬蟲實戰:爬取金融數據
  • 第二篇 Python網路爬蟲:網路資料擷取「全方位」實戰
    • CHAPTER 09 認識Python網路爬蟲
      • 9-1 網頁設計技術與JavaScript
      • 9-2 如何產生瀏覽器顯示的網頁內容
      • 9-3 建立Python網路爬蟲
      • 9-4 開發人員工具的使用
      • 9-5 使用Python處理CSV資料
    • CHAPTER 10 使用requests和Selenium取得網路資料
      • 10-1 使用requests取得網路資料
      • 10-2 使用Selenium取得網路資料
      • 10-3 取得HTML表單送回的網路資料
      • 10-4 Python爬蟲實戰:取得無限捲動分頁的網路資料
      • 10-5 Python爬蟲實戰:取得台鐵列車時刻/車次的查詢資料
    • CHAPTER 11 Beautiful Soup剖析與擷取網頁資料
      • 11-1 用BeautifulSoup擷取網頁資料
      • 11-2 使用正規表達式擷取網頁資料
      • 11-3 Selenium+BeautifulSoup擷取網頁資料
      • 11-4 Python爬蟲實戰:爬取HTML表單的互動網頁
    • CHAPTER 12 使用Python爬取AJAX、互動網頁與Web API
      • 12-1 AJAX與JSON 的基礎
      • 12-2 使用開發人員工具分析和測試AJAX請求
      • 12-3 Python處理JSON資料
      • 12-4 使用Web API取得網路資料
      • 12-5 Python 爬蟲實戰:爬取景氣對策信號分數
    • CHAPTER 13 Python爬蟲實戰(一):爬取清單、表格與分頁資料
      • 13-1 Python 爬蟲的常見問題
      • 13-2 爬取臺北鐵路餐廳的便當菜單
      • 13-3 爬取HouseFun的台北市租房資料
      • 13-4 爬取台灣證交所的券商資料
      • 13-5 爬取Momo購物網站NBA球衣的商品資料
    • CHAPTER 14 Python爬蟲實戰(二):Web API、AJAX與互動網頁資料爬取
    • 14-1 OpenWeatherMap天氣資料的Web API
    • 14-2 HTML表單送回的集保戶股權分散表
    • 14-3 AJAX網頁的富時中國A50指數期貨
    • 14-4 互動操作爬取NBA官網球員的下一頁資料
  • 第三篇 Python大數據分析:資料清理與資料視覺化
    • CHAPTER 15 Pandas資料清理-pandas
      • 15-1 Pandas基本使用
      • 15-2 Pandas資料讀取與儲存
      • 15-3 Pandas常用的資料處理
      • 15-4 Pandas資料清理
      • 15-5 資料清理實戰:清理欄位和重複標題列
    • CHAPTER 16 Python資料視覺化-plotly
      • 16-1 認識資料視覺化
      • 16-2 使用Matplotlib繪製圖表
      • 16-3 使用Plotly套件繪製網頁互動圖表
      • 16-4 資料視覺化實戰:使用Pandas繪製視覺化圖表
      • 16-5 資料視覺化實戰:Plotly繪製股票的OHLC圖表和時序圖
  • 附錄 A Python程式設計入門
  • 附錄 B 離線安裝本書使用的瀏覽器擴充功能
  • 附錄 C Web Scraper爬蟲網站地圖

評分與評論

請登入後再留言與評分
幫助
您好,請問需要甚麼幫助呢?
使用指南

客服專線:0800-000-747

服務時間:週一至週五 AM 09:00~PM 06:00

loading