★學會用「網路爬蟲」蒐集資料,告別苦力又傷眼的「複製、貼上」!★
在網路發達的時代,整個網路就像是一個大型資料庫,不論是想進行商品比價、想預測股價的漲跌趨勢、想知道競爭者的商品資訊、想了解社群網站的熱門議題,再搭配時事來規劃行銷活動、想透過匯率走勢預測何時可以低價買進美金或日幣、……等等,都可以從相關網站取得資料。
雖然取得資料不難,但是要如何將這些大量、雜亂的資料抓取下來並整理成有用的資訊,就是一門學問了。如果還不懂得運用「網路爬蟲」,就只能慢慢地複製、貼上資料了!
★徹底解析網頁結構,精確爬取目標資料不卡關★
為了幫助您學習網路爬蟲,本書使用 Chrome 瀏覽器的 Web Scraper 擴充功能,讓您不用撰寫任何程式碼,就能夠輕鬆爬取約七成以上的網站資料,而且透過 Web Scraper 工具,還可以幫您一邊爬取資料一邊學習 HTML 標籤+ CSS選擇器,精確爬取目標資料,並從實作中了解 Web 網站的各種巡覽結構。
★互動式網頁資料也能抓!★
雖然 Web Scraper 能夠爬取大多數的網站資料,但是對於 JavaScript、AJAX 技術等互動式的網頁資料,就不易直接爬取回來。我們將教您使用 Excel VBA+IE瀏覽器自動化來爬取互動網站,還可以建立 Excel VBA+Selenium 網路爬蟲程式,讓您在網頁上看得到資料,就能夠爬得到資料。
★找出有意義的指標,做出最佳決策!★
最後,我們還將介紹如何用Excel內建功能,進行「資料清理」及「資料視覺化」,讓您充份掌握資訊,迅速做出最佳的決策。
本書特色
►►► 以 Step by Step 的方式,解說 Web Scraper 爬取資料的過程,消除初學者對寫程式的恐懼!
►►► 以生活化的例子帶領初學者實際用 Web Scraper 爬取資料,例如:足球聯賽成績、本週電影資訊、全國電子門市資料、NBA 球員資料、各城市空氣品質與天氣資訊、股價資訊、匯率、……等,建立初學者的自信及成就感。
►►► 教您使用 Chrome 的擴充功能,快速判別網頁內容是 AJAX 技術還是 JavaScript 產生的動態網頁,以便精確爬取目標資料。
►►► 以豐富的實作案例,帶您建立 Excel VBA 程式爬取 JavaScript 產生的動態網頁及使用者互動的網站。 |