我在運(yùn)行此處列出的示例代碼時(shí)遇到問題:https : //dev.to/pranay749254/build-a-simple-python-web-crawler。這是我試圖運(yùn)行的代碼:import requestsfrom bs4 import BeautifulSoupdef web(page,WebUrl): if(page>0): url = WebUrl code = requests.get(url) plain = code.text s = BeautifulSoup(plain, "html.parser") for link in s.findAll('a', {'class':'s-access-detail-page'}): tet = link.get('title') print(tet) tet_2 = link.get('href') print(tet_2)web(1,'https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=Stomp+box&rh=i%3Aaps%2Ck%3AStomp+box')當(dāng)我通過終端 shell(我正在運(yùn)行 Ubuntu 16.04)運(yùn)行上述代碼時(shí),程序不返回任何輸出。我使用以下命令:$ python3 BasicCrawler.py我按回車鍵,終端上沒有打印任何文本,就好像我沒有運(yùn)行任何腳本一樣。我可以在程序中添加 print() 命令來驗(yàn)證它是否正在運(yùn)行,但它似乎沒有打印變量 tet 或 tet2。
3 回答

波斯汪
TA貢獻(xiàn)1811條經(jīng)驗(yàn) 獲得超4個(gè)贊
它沒有打印任何內(nèi)容,因?yàn)榱斜砜赡転榭?。這意味著類名“s-access-detail-page”的“a”標(biāo)簽在您解析的 html 文檔中不包含任何內(nèi)容。
打印 HTTP 響應(yīng)的輸出并嘗試找出要迭代和獲取數(shù)據(jù)的塊的確切類。
添加回答
舉報(bào)
0/150
提交
取消