首頁猿問 python中怎么快速比較2個文件...

python中怎么快速比較2個文件中的內(nèi)容

Python

交互式愛情 2018-07-11 10:10:39

有2個文件，其中第2個文件是第一個文件中數(shù)據(jù)的增減量文件（第2個文件內(nèi)數(shù)據(jù)與第1個大致相同，有些新增的數(shù)據(jù)，有些刪減的數(shù)據(jù)，數(shù)據(jù)在文件內(nèi)已經(jīng)逐條換行），我要寫一個函數(shù)，提取出在一個文件但不在另一個文件中的數(shù)據(jù)，函數(shù)如下：def filefind(src,des):sf = open(src)df = open(des)sfline = sf.readlines()dfline = df.read()tmp = []for lines in sfline:if dfline.find(lines) == -1:tmp.append(lines)print tmpelse:print dfline.find(lines)sf.close()df.close()return tmpsrc,des是2個文件路徑，print語句用于測試，但運行時發(fā)現(xiàn)效率一般，因為文件內(nèi)數(shù)據(jù)很多（250w條），所以一次大概要很長時間才能完成，有沒有什么更高效率的方法？

查看完整描述

3 回答

喵喵時光機

TA貢獻1846條經(jīng)驗獲得超7個贊

可以用 difflib庫，下面給一個例子，具體需求自己研究

假如在同一個目錄下有a.txt, b.txt 兩個文本文件

a.txt 內(nèi)容是

aaa

bbb

b.txt內(nèi)容是

aaa

ccc

1234567 import difflib a = open('a.txt', 'U').readlines()b = open('b.txt', 'U').readlines()diff = difflib.ndiff(a, b) sys.stdout.writelines(diff)