-
Python3字符串默認(rèn)使用Unicode編碼,所以Python3支持多語言。
以Unicode表示的str通過encode()方法可以編碼為指定的bytes。
如果bytes使用ASCII編碼,遇到ASCII碼表沒有的字符會(huì)以\x##表示,此時(shí)只用'\x##'.decode('utf-8')就可以了
查看全部 -
發(fā)送POST請求
查看全部 -
攜帶header
查看全部 -
mark查看全部
-
from?urllib?import?request resp?=?request.urlopen("http://www.baidu.com") print(resp.read().decode("utf-8"))
查看全部 -
urllib庫
查看全部 -
截圖啊啊啊
查看全部 -
輸出某個(gè)頁面的全部href
專業(yè)人士如何改代碼,代碼不是抄出來的,是改出來的
查看全部 -
課程 介紹
查看全部 -
beautiful soup
www.crummy.com/software/BeautifulSoup/#Download
查找修改樹形結(jié)構(gòu),提供一些工具,可以解析文檔
默認(rèn)Unicode,utf-8
支持lxml和html5lib解析器
查看全部 -
爬蟲注意事項(xiàng)查看全部
-
亂碼的原因
查看全部 -
查詢數(shù)據(jù)mysql
查看全部 -
https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/#id4
查看全部 -
#?爬出臺(tái)灣高鐵網(wǎng)站 from?urllib.request?import?urlopen from?urllib.request?import?Request from?urllib?import?parse req?=?Request('http://www.thsrc.com.tw/tw/TimeTable/SearchResult') postData?=?parse.urlencode([ ????('StartStation',?'2f940836-cedc-41ef-8e28-c2336ac8fe68'), ????('EndStation',?'977abb69-413a-4ccf-a109-0272c24fd490'), ????('SearchDate',?'2018/06/25'), ????('SearchTime',?'23:30'), ????('SearchWay',?'DepartureInMandarin') ]) req.add_header('Origin',?'http://www.thsrc.com.tw') req.add_header('User-Agent',?'Mozilla/5.0?(Windows?NT?6.1;?WOW64)?AppleWebKit/537.36?(KHTML,?like?Gecko)?Chrome/55.0.2883.87?Safari/537.36') response?=?urlopen(req,?data=postData.encode('utf-8')) print(response.read().decode('utf-8'))
查看全部
舉報(bào)