-
import urllib2
url = "www.baidu.com"
response1 = urllib1.urlopen(url)
print response1.getcode()
print len(response1.read())
print "第二種方法"
request = urllib2.Request(url)
request.add_header("user-agent","Mozilla/5.0")
response2 = urllib2.urlopen(request)
print response1.getcode()
print len(response1.read())
查看全部 -
課程詳細,棒查看全部
-
URL管理器,網(wǎng)頁下載器,網(wǎng)頁解釋器,三者循環(huán)查看全部
-
自定義查看全部
-
set() set()查看全部
-
網(wǎng)頁下載器:將互聯(lián)網(wǎng)URL對應的網(wǎng)頁下載到本地的工具
查看全部 -
urllib2方法2
查看全部 -
urllib2網(wǎng)頁下載請
查看全部 -
if count? == 1000:
break
count = count + 1
查看全部 -
import?urllib2,?cookielib #創(chuàng)建cookie容器 cj?=?cookielib.CookieJar() #創(chuàng)建1個opener cj?=?urllib2.build_opener(urllib2.HTTPCookieProcessor(cj)) #給urllib2安裝opener urllib2.install_opener(opener) #使用帶有cookie的urllib2訪問網(wǎng)頁 response?=?urllib2.urlopen('http://www.baidu.com/')
有些網(wǎng)頁需要用戶登錄才能訪問:添加HTTPCookieProcessor
需要代理訪問:ProxyHandler
協(xié)議是HTTPS加密訪問:HTTPSHandler
URL相互自動跳轉(zhuǎn)關(guān)系:HTTPRedirectHandler
查看全部 -
import?urllib2 #創(chuàng)建request對象 request?=?urllib2.Request(url) #添加數(shù)據(jù) request.add_data('a','1') #添加http的header request.add_header('User-Agent',?'Mozilla/5.0') #發(fā)送請求獲取結(jié)果 response?=?urllib2.urlopen(request)
查看全部 -
#import?模塊 import?urllib2 #直接請求 response?=?urllib2.urlopen('http://www.baidu.com') ? #獲取狀態(tài)碼,如果是200表示獲取成功 print?response.getcode() #讀取內(nèi)容 cont?=?response.read()
查看全部 -
網(wǎng)頁提取器:從網(wǎng)頁中提取有價值的工具查看全部
-
網(wǎng)頁下載器分三種查看全部
-
下載器:將url網(wǎng)頁內(nèi)容下載到本地的工具查看全部
舉報