最贊回答 / SeaRhyme
有可能是數(shù)據(jù)庫初始化函數(shù)里面的內(nèi)容沒有運(yùn)行到,__init__(self)這個(gè)名字init左右都是雙下劃線,pycharm寫對(duì)了會(huì)變色的
2018-09-11
這邊解析代碼中有一個(gè)小bug,解析內(nèi)容的時(shí)候如果按老師的寫法,只能獲得最后一行的內(nèi)容,可考慮做以下修改:
content_s = ""
for i_content in content:
content_s = content_s + "".join(i_content.split())
douban_item['introduce'] = content_s
content_s = ""
for i_content in content:
content_s = content_s + "".join(i_content.split())
douban_item['introduce'] = content_s
2018-09-06
說的很好,沒有框架基礎(chǔ)直接聽也不會(huì)覺得晦澀難懂,每個(gè)部分的作用說的很詳細(xì),但是我相信這只是冰山一角
2018-09-01
已采納回答 / qq_蔚藍(lán)色的天空_3
這個(gè)是scrapy中回調(diào)時(shí)被過濾了? 解決方法在?allowed_domains?中加入 url?在 scrapy.Request() 函數(shù)中將參數(shù)?dont_filter=True?設(shè)置為 True修改這一行代碼如下,我個(gè)人采取第二種方式dont_filter=Ture:
yield?scrapy.Request("https://movie.douban.com/top250"+next_link,?callback=self.parse,?dont_filter=True)
2018-08-31