![圖片[1]-網站扒取工具_快速獲取需要的信息](http://www.oilmaxhydraulic.com.cn/wp-content/uploads/2023/09/20230929211939840-image.png)
請將要扒取的網站頁面的網址粘貼到這里 點擊下方的“開始抓取”按鈕 等待抓取完畢,會自動打開已下載的文件夾 例如,若要獲取 qiye1.wscso.com 網站中的首頁、關于我們、新聞列表三個頁面,可以按以下方式在扒網站工具中設置URL:
http://qiye1.wscso.com
http://qiye1.wscso.com/gongsijieshao.html
http://qiye1.wscso.com/xinwenzixun.html
設置好后,點擊左下角的“開始提取”按鈕,程序便開始自動扒這幾個設置好的網頁。
扒完后,會自動打開已下載好的文件夾。例如,上述拔取的結果
![圖片[2]-網站扒取工具_快速獲取需要的信息](http://www.oilmaxhydraulic.com.cn/wp-content/uploads/2023/09/20230929212235661-image.png)
可以發(fā)現,下載的網頁是一個非常標準的模板頁面,可以直接打開模板頁進行查看。
該軟件界面左下方有兩個按鈕:開始抓取和更多設置。
點擊更多設置按鈕,就可以打開Cookies設置界面。
Cookies設置界面如下圖所示:
![圖片[3]-網站扒取工具_快速獲取需要的信息](http://www.oilmaxhydraulic.com.cn/wp-content/uploads/2023/09/20230929212317263-image.png)
當您要抓取需要登錄才能訪問的網頁時,您可以使用瀏覽器登錄目標網頁,然后獲取該網站的Cookies,并將其填寫在此處即可。
如果Cookies有a、b、c三個參數,那么填入的格式為:
a=1;b=2;c=3
每個參數中間用 ; 分割。
獲取地址:
? 版權聲明
THE END
- 最新
- 最熱
只看作者