第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

如何高效地做到大文本去除重復(fù)行

如何高效地做到大文本去除重復(fù)行

四季花海 2019-04-09 20:25:28
主要是對(duì)行去重如果先排序的話。。大約是這樣:sortbigtext.txt|uniq因?yàn)閡niq只能去相鄰行的重,但是對(duì)大文本進(jìn)行排序這個(gè)代價(jià)有點(diǎn)大?O(nlogn)對(duì)于n達(dá)到上億好像太慢了?其他的使用set更加。。。如果重復(fù)率小,吃內(nèi)存吃的不行。。。
查看完整描述

2 回答

?
ibeautiful

TA貢獻(xiàn)1993條經(jīng)驗(yàn) 獲得超6個(gè)贊

但是對(duì)大文本進(jìn)行排序這個(gè)代價(jià)有點(diǎn)大?O(nlogn)對(duì)于n達(dá)到上億好像太慢了?
代價(jià)不大。排序的話是省內(nèi)存的。(sort的算法實(shí)現(xiàn)應(yīng)該是比較高效的。)
要不就是對(duì)每行算SHA-1,這樣只要比較SHA-1就可以。
                            
查看完整回答
反對(duì) 回復(fù) 2019-04-09
  • 2 回答
  • 0 關(guān)注
  • 354 瀏覽
慕課專(zhuān)欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)