第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定

最新回答 / lgsp_lucifer1225
我覺得你是切割文件名和后綴的時候,splitext寫成split導致的。
抽取的pdf是單層pdf 還是雙層的?
講的有點啰嗦,文本提取可以使用 textract 可以提取多種格式 https://textract.readthedocs.io/en/stable/,
文件操作獲取文件名部分,可以用os.path.splitext拆分文件名稱與后綴,用in判斷后綴是否是要轉換的格式,然后文件名+'.txt'就可以了。
https://github.com/deanmalmgren/textract
抽取表格和ppt的是不是難,所以不寫

最新回答 / 慕沐9044854
我碰到的類似問題,是IF循環(huán)有問題,直接return了
#匹配文件名要求, 不區(qū)分大小寫
fnmatch.fnmatch(filename, pattern)
fnmathc.fnmatch('txt.py', '*.Py') # True

#匹配文件名是否符合要求,區(qū)分大小寫
fnmatch.fnmatchcase(filename, pattern)
fnmatch.fnmatchcase('txt.py', '*.py') # True

最新回答 / weibo_慕神0248999
<...圖片...><...圖片...>很簡單,文件->另存為->編碼->UTF-8 這樣能看明白么?
課程須知
1、適用于數(shù)據(jù)科學從業(yè)人員、AI技術開發(fā)人員和科研工作者及學生群體。 2、學習者應具備python和數(shù)據(jù)科學的基礎。
老師告訴你能學到什么?
1、制定不同場景數(shù)據(jù)采集策略 2、文本數(shù)據(jù)抽取與集成、使用Python科學計算工具

微信掃碼,參與3人拼團

微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網(wǎng)微信公眾號

友情提示:

您好,此課程屬于遷移課程,您已購買該課程,無需重復購買,感謝您對慕課網(wǎng)的支持!

本次提問將花費2個積分

你的積分不足,無法發(fā)表

為什么扣積分?

本次提問將花費2個積分

繼續(xù)發(fā)表請點擊 "確定"

為什么扣積分?

舉報

0/150
提交
取消