首頁猿問無法解碼或讀取網(wǎng)站URL來計(jì)數(shù)字符串

無法解碼或讀取網(wǎng)站URL來計(jì)數(shù)字符串

Python

梵蒂岡之花 2021-03-30 12:11:55

我正在嘗試使用以下代碼對網(wǎng)站中的數(shù)據(jù)進(jìn)行搜索和計(jì)數(shù)，您可以看到我在代碼中添加了一些額外的打印信息以進(jìn)行調(diào)試，目前結(jié)果始終為“ 0”，這對我來說是一個(gè)讀取某種文件時(shí)出錯(cuò)。如果我打印名為html的變量，則可以清楚地看到正在搜索的所有三個(gè)字符串都包含在html中，但是如前所述，我的所有打印內(nèi)容都不打印任何內(nèi)容，并且最終打印計(jì)數(shù)僅返回“ 0”。如您所見，我嘗試了三種不同的方法，每次都遇到相同的問題。import urllib2import urllibimport reimport jsonimport mechanizepost_url = "url_of_fishermans_finds"browser = mechanize.Browser()browser.set_handle_robots(False)browser.addheaders = [('User-agent', 'Firefox')]html = browser.open(post_url).read().decode('UTF-8')# Attempted method 1print html.count("SEA BASS")# Attempted method 2count = 0enabled = Falsefor line in html: if 'MAIN FISHERMAN' in line: print "found main fisherman" enabled = True elif 'SEA BASS' in line: print "found fish" count += 1 elif 'SECONDARY FISHERMAN' in line: print "found secondary fisherman" enabled = Falseprint count# Attempted method 3relevant = re.search(r"MAIN FISHERMAN(.*)SECONDARY FISHERMAN", html)[1]found = relevant.count("SEA BASS")print found這可能真的很簡單，任何評論或幫助將不勝感激。親切的問候AEA

查看完整描述