課程
                    
                        /后端開發(fā)
                        
                            /Python
                        
                        /python遇見數(shù)據(jù)采集

幫忙找錯。謝謝了

# -*- coding: utf-8 -*-
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LAParams
from pdfminer.pdfparser import PDFParser,PDFDocument
from pdfminer.pdfinterp import PDFResourceManager,PDFPageInterpreter
from pdfminer.pdfdevice import PDFDevice
from urllib.request import urlopen

# fp = open("ReferenceCard.pdf","rb") # 獲取文檔對象，“rb”表示以二進(jìn)制讀的方式打開
fp = urlopen("http://www.tencent.com/zh-cn/articles/8003251479983154.pdf")
parser = PDFParser(fp) #創(chuàng)建一個與文檔關(guān)聯(lián)的解釋器

doc = PDFDocument() # PDF文檔的對象

parser.set_document(doc) # 鏈接文檔對象
doc.set_parser(parser) # 鏈接解釋器

doc.initialize("") # 初始化文檔，如果該文檔有加密，則密碼寫在“”里

resource = PDFResourceManager # 創(chuàng)建PDF資源管理器

laparam = LAParams() # 創(chuàng)建參數(shù)分析器

device = PDFPageAggregator(resource,laparams=laparam) # 創(chuàng)建一個聚合器,接收PDF資源管理器和參數(shù)解析器

interpreter = PDFPageInterpreter(resource,device) # 創(chuàng)建PDF頁面解釋器,需要PDF資源管理器和聚合器

for page in doc.get_pages(): # 使用文檔對象得到頁面的集合
? ?interpreter.process_page(page) # 使用頁面解釋器來讀取
? ?layout = device.get_result() # 使用聚合器來獲取內(nèi)容
? ?for out in layout:
? ? ? ?if hasattr(out,"get_text"):
? ? ? ? ? ?print(out.get_text())

以下是報錯：

（忽略下面這張圖）

05:57

qq_大屎_0

2017-09-17

源自：python遇見數(shù)據(jù)采集 5-5

關(guān)注問題我要回答

1722

操作

收起

2 回答

seac
2018-06-25

resource?=?PDFResourceManager()#?創(chuàng)建PDF資源管理器

缺括號

0 回復(fù) 有任何疑惑可以回復(fù)我~

收起回答

qq_大屎_0 提問者
2017-09-17

忽略最后一張圖

0 回復(fù) 有任何疑惑可以回復(fù)我~

收起回答

舉報

0/150

提交

取消

python遇見數(shù)據(jù)采集

參與學(xué)習(xí) 59664 人
解答問題 209 個

本教程讓你初步掌握Python進(jìn)行數(shù)據(jù)采集，創(chuàng)造屬于你的價值

進(jìn)入課程

本課相似問答

4 回答之前好好的，重新安裝了數(shù)據(jù)庫，然后就報錯了，望幫忙看看呢。謝謝

2 回答求問老師謝謝了

4 回答執(zhí)行代碼出錯，卿幫忙找一下原因

3 回答求幫忙解決

2 回答403是被發(fā)現(xiàn)是爬蟲拒絕訪問了嗎？不知道哪里出錯了有沒有朋友幫忙看下

搜索更多本課相關(guān)問答

幫忙找錯。謝謝了

我要回答關(guān)注問題

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

幫忙找錯。謝謝了

2 回答

本課相似問答

幫忙找錯。謝謝了

幫忙找錯。謝謝了

幫忙找錯。謝謝了