我想獲取兩個(gè)文本文件并將它們寫(xiě)入/附加到一個(gè)文件中。每個(gè)文件都有不同的分隔符。有沒(méi)有一種方法可以輕松檢測(cè)定界?或者處理這種情況的簡(jiǎn)單方法?如何處理未知文件分隔?
1 回答

尚方寶劍之說(shuō)
TA貢獻(xiàn)1788條經(jīng)驗(yàn) 獲得超4個(gè)贊
不,沒(méi)有簡(jiǎn)單的方法來(lái)確定未指定的分隔符。事實(shí)上,人們可以很容易地構(gòu)造出分隔符不明確的病理情況。
但是,您提供的示例帶來(lái)了希望??雌饋?lái)您的字段主要是字母數(shù)字?jǐn)?shù)據(jù)——有時(shí)包括連字符、引號(hào)等——由常見(jiàn)的標(biāo)點(diǎn)符號(hào)分隔。您可以閱讀文件的幾行并根據(jù)文本特征確定可能的分隔符。
識(shí)別字母數(shù)字字段并將其折疊為單個(gè)字符,例如A
. 從剩余的字符中,尋找與這些字段或多或少交替出現(xiàn)的字符。使用優(yōu)先考慮的列表,例如(制表符、逗號(hào)、空格等)并計(jì)算一些擬合優(yōu)度,直到得到一個(gè)看起來(lái)可能的數(shù)字。使用它作為分隔符來(lái)讀取文件。
一旦您正確攝取了每個(gè)文件的行,用csv
包編寫(xiě)文件就很簡(jiǎn)單(請(qǐng)參閱在線示例)。
添加回答
舉報(bào)
0/150
提交
取消