我有一個(gè)簡單的 python 程序,它接收 pdf(帶有表格)并使用 tabula 將數(shù)據(jù)保存到 csv 文件中:import tabulaif __name__ == '__main__':path = input('Filename: ')pathSegments = path.split('/')folder = ''i = 0while i < len(pathSegments)-1: folder += '/' + pathSegments[i] i += 1name = pathSegments[len(pathSegments)-1].split('.')[0]dest = folder + '/' + name + '.csv'print(dest)tabula.convert_into(path, dest, pages = "all", output_format = "csv")我嘗試了多種不同的 pdf,例如一張帶有下圖的 pdf:然而,結(jié)果始終是一個(gè)空的 csv 文件,tabula 似乎無法識(shí)別表格
1 回答

當(dāng)年話下
TA貢獻(xiàn)1890條經(jīng)驗(yàn) 獲得超9個(gè)贊
Tabula 在收拾桌子方面并不完美。我會(huì)考慮添加一個(gè)模板來為 tabula 提供更多指導(dǎo)。這些模板可以根據(jù)文檔的不同特征動(dòng)態(tài)生成。
添加回答
舉報(bào)
0/150
提交
取消