我有基于 unicode 的文本,我需要獲取前 N 個(gè)(假設(shè)為 500-1000-1500)個(gè)單詞的符號數(shù)我需要保留所有符號(所以如果字符串在哪里"a b"結(jié)果應(yīng)該是 5)我的想法是使用一些正則表達(dá)式匹配前 N 個(gè)單詞,然后獲取匹配結(jié)果的長度(符號數(shù))。也許像text.match(/([^\s]+\s+){500}/)但是當(dāng)涉及到標(biāo)點(diǎn)符號時(shí)它很糟糕事實(shí)上,我提出了這個(gè)想法。大家怎么看?text.match(/(\w+\s*[^\s\w]*\s+){5}/)
獲取前 N 個(gè)單詞的子串
慕碼人8056858
2021-08-20 16:59:07