我在下面有這個代碼:def check_proxy(input_queue): while 1: prx = input_queue.get() try: proxy_handler = urllib2.ProxyHandler({'http': prx}) opener = urllib2.build_opener(proxy_handler) opener.addheaders = [('User-agent', 'Mozilla/5.0')] urllib2.install_opener(opener) req = urllib2.Request("http://www.google.com") sock = urllib2.urlopen(req, timeout=7) rs = sock.read(1000) if '<title>Google</title>' in rs: print '[OK]', prx input_queue.task_done()我已將檢查 Google.com 更改為 instagram.com我把標(biāo)題改成了 Instagram但由于某種原因它不起作用。我已經(jīng)檢查了 Instagram 的“打印 rs”。并得到了這個標(biāo)題: <title>Instagram</title>只是想知道如何檢查https://www.instagram.com而不是 google.com謝謝
1 回答

翻閱古今
TA貢獻(xiàn)1780條經(jīng)驗 獲得超5個贊
與 Instagram 的 HTML 中的標(biāo)題匹配的字符串應(yīng)該是'<title>\nInstagram\n<title>
. Google 的 HTML 中沒有換行符,但 Instagram 有。
添加回答
舉報
0/150
提交
取消