最新文章專題視頻專題問答1問答10問答100問答1000問答2000關鍵字專題1關鍵字專題50關鍵字專題500關鍵字專題1500TAG最新視頻文章視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關鍵字專題關鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
當前位置: 首頁 - 科技 - 知識百科 - 正文

python爬蟲之Scrapy使用代理配置

來源:懂視網 責編:小采 時間:2020-11-27 14:28:45
文檔

python爬蟲之Scrapy使用代理配置

python爬蟲之Scrapy使用代理配置:在爬取網站內容的時候,最常遇到的問題是:網站對IP有限制,會有防抓取功能,最好的辦法就是IP輪換抓?。哟恚┫旅鎭碚f一下Scrapy如何配置代理,進行抓取1.在Scrapy工程下新建middlewares.py# Importing base64 library because
推薦度:
導讀python爬蟲之Scrapy使用代理配置:在爬取網站內容的時候,最常遇到的問題是:網站對IP有限制,會有防抓取功能,最好的辦法就是IP輪換抓?。哟恚┫旅鎭碚f一下Scrapy如何配置代理,進行抓取1.在Scrapy工程下新建middlewares.py# Importing base64 library because

在爬取網站內容的時候,最常遇到的問題是:網站對IP有限制,會有防抓取功能,最好的辦法就是IP輪換抓?。哟恚?/p>

下面來說一下Scrapy如何配置代理,進行抓取

1.在Scrapy工程下新建“middlewares.py”

# Importing base64 library because we'll need it ONLY in case if the proxy we are going to use requires authentication
import base64 
# Start your middleware class
class ProxyMiddleware(object):
 # overwrite process request
 def process_request(self, request, spider):
 # Set the location of the proxy
 request.meta['proxy'] = "http://YOUR_PROXY_IP:PORT"
 
 # Use the following lines if your proxy requires authentication
 proxy_user_pass = "USERNAME:PASSWORD"
 # setup basic authentication for the proxy
 encoded_user_pass = base64.encodestring(proxy_user_pass)
 request.headers['Proxy-Authorization'] = 'Basic ' + encoded_user_pass

2.在項目配置文件里(./pythontab/settings.py)添加

DOWNLOADER_MIDDLEWARES = {
 'scrapy.contrib.downloadermiddleware.httpproxy.HttpProxyMiddleware': 110,
 'pythontab.middlewares.ProxyMiddleware': 100,
}

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

文檔

python爬蟲之Scrapy使用代理配置

python爬蟲之Scrapy使用代理配置:在爬取網站內容的時候,最常遇到的問題是:網站對IP有限制,會有防抓取功能,最好的辦法就是IP輪換抓?。哟恚┫旅鎭碚f一下Scrapy如何配置代理,進行抓取1.在Scrapy工程下新建middlewares.py# Importing base64 library because
推薦度:
標簽: 代理 配置 python
  • 熱門焦點

最新推薦

猜你喜歡

熱門推薦

專題
Top
国产精品久久久久精品…-国产精品可乐视频最新-亚洲欧美重口味在线-欧美va免费在线观看