第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會有你想問的

python中怎么快速比較2個(gè)文件中的內(nèi)容

python中怎么快速比較2個(gè)文件中的內(nèi)容

交互式愛情 2018-07-11 10:10:39
有2個(gè)文件,其中第2個(gè)文件是第一個(gè)文件中數(shù)據(jù)的增減量文件(第2個(gè)文件內(nèi)數(shù)據(jù)與第1個(gè)大致相同,有些新增的數(shù)據(jù),有些刪減的數(shù)據(jù),數(shù)據(jù)在文件內(nèi)已經(jīng)逐條換行),我要寫一個(gè)函數(shù),提取出在一個(gè)文件但不在另一個(gè)文件中的數(shù)據(jù),函數(shù)如下:def filefind(src,des):sf = open(src)df = open(des)sfline = sf.readlines()dfline = df.read()tmp = []for lines in sfline:if dfline.find(lines) == -1:tmp.append(lines)print tmpelse:print dfline.find(lines)sf.close()df.close()return tmpsrc,des是2個(gè)文件路徑,print語句用于測試,但運(yùn)行時(shí)發(fā)現(xiàn)效率一般,因?yàn)槲募?nèi)數(shù)據(jù)很多(250w條),所以一次大概要很長時(shí)間才能完成,有沒有什么更高效率的方法?
查看完整描述

3 回答

?
喵喵時(shí)光機(jī)

TA貢獻(xiàn)1846條經(jīng)驗(yàn) 獲得超7個(gè)贊

可以用 difflib庫,下面給一個(gè)例子,具體需求自己研究

假如在同一個(gè)目錄下有a.txt, b.txt 兩個(gè)文本文件

a.txt 內(nèi)容是

aaa

bbb


b.txt內(nèi)容是

aaa

ccc


1234567import difflib = open('a.txt''U').readlines()= open('b.txt''U').readlines()diff = difflib.ndiff(a, b) sys.stdout.writelines(diff)



結(jié)果是:

  aaa

- bbb+ ccc


查看完整回答
反對 回復(fù) 2018-07-26
?
守候你守候我

TA貢獻(xiàn)1802條經(jīng)驗(yàn) 獲得超10個(gè)贊

分成幾塊然后用好幾個(gè)thread來比較唄

查看完整回答
反對 回復(fù) 2018-07-26
?
江戶川亂折騰

TA貢獻(xiàn)1851條經(jīng)驗(yàn) 獲得超5個(gè)贊

def filefine(src, des):
retrun set(open(des).readlines()) - set(open(src).readlines())
x64的話,應(yīng)該沒問題

查看完整回答
反對 回復(fù) 2018-07-26
  • 3 回答
  • 0 關(guān)注
  • 1942 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號