首頁猿問 Golang 替換所有換行符

Golang 替換所有換行符

Go

阿波羅的戰(zhàn)車 2023-04-17 15:17:39

通常，當(dāng)我替換換行符時，我會跳轉(zhuǎn)到正則表達(dá)式，就像在這個 PHP 中一樣preg_replace('/\R/u', "\n", $String);因?yàn)槲抑肋@是替換任何類型的 Unicode 換行符（無論是 \n、\r、\r\n 等）的一種非常持久的方法我也在嘗試在 Go 中做這樣的事情，但我得到了解析正則表達(dá)式時出錯：轉(zhuǎn)義序列無效：\R在這條線上msg = regexp.MustCompilePOSIX("\\R").ReplaceAllString(html.EscapeString(msg), "<br>\n")我嘗試使用(?:(?>\r\n)|\v)https://stackoverflow.com/a/4389171/728236 ，但看起來 Go 的正則表達(dá)式實(shí)現(xiàn)也不支持它，恐慌invalid or unsupported Perl syntax: '(?>'什么是替換 Go 中的換行符的好、安全的方法，Regex 與否？我在這里看到這個答案Golang：Issues replacing newlines in a string from a text file saying to use \r?\n，但我猶豫是否相信它會得到所有Unicode 換行符，主要是因?yàn)檫@個問題的答案列出了比覆蓋的3個\r?\n，

查看完整描述

2 回答

大話西游666

TA貢獻(xiàn)1817條經(jīng)驗(yàn) 獲得超14個贊

雖然使用 regexp 通常會產(chǎn)生一個優(yōu)雅而緊湊的解決方案，但它通常不是最快的。

對于必須用其他子字符串替換某些子字符串的任務(wù)，標(biāo)準(zhǔn)庫以以下形式提供了一個非常有效的解決方案strings.Replacer：

Replacer 用替換項(xiàng)替換字符串列表。多個 goroutines 并發(fā)使用是安全的。

您可以使用創(chuàng)建可重復(fù)使用的替換器strings.NewReplacer()，其中列出包含可替換部件及其替換件的對。當(dāng)你想執(zhí)行替換時，你只需調(diào)用Replacer.Replace().

它看起來像這樣：

const replacement = "<br>\n"

var replacer = strings.NewReplacer(

? ? "\r\n", replacement,

? ? "\r", replacement,

? ? "\n", replacement,

? ? "\v", replacement,

? ? "\f", replacement,

? ? "\u0085", replacement,

? ? "\u2028", replacement,

? ? "\u2029", replacement,

)

func replaceReplacer(s string) string {

? ? return replacer.Replace(s)

}

以下是Wiktor 答案中的正則表達(dá)式解決方案：

var re = regexp.MustCompile(`\r\n|[\r\n\v\f\x{0085}\x{2028}\x{2029}]`)

func replaceRegexp(s string) string {

? ? return re.ReplaceAllString(s, "<br>\n")

}

實(shí)施實(shí)際上相當(dāng)快。這是一個簡單的基準(zhǔn)測試，將其與上述預(yù)編譯的正則表達(dá)式解決方案進(jìn)行比較：

const input = "1st\nsecond\r\nthird\r4th\u0085fifth\u2028sixth"

func BenchmarkReplacer(b *testing.B) {

? ? for i := 0; i < b.N; i++ {

? ? ? ? replaceReplacer(input)

? ? }

}

func BenchmarkRegexp(b *testing.B) {

? ? for i := 0; i < b.N; i++ {

? ? ? ? replaceRegexp(input)

? ? }

}

基準(zhǔn)測試結(jié)果：

BenchmarkReplacer-4? ? ? 3000000? ? ? ? ? ? ? ?495 ns/op

BenchmarkRegexp-4? ? ? ? ?500000? ? ? ? ? ? ? 2787 ns/op

對于我們的測試輸入，速度提高了5 倍strings.Replacer以上。

還有另一個優(yōu)點(diǎn)。在上面的示例中，我們將結(jié)果作為新string值獲?。ㄔ趦煞N解決方案中）。這需要一個新的string分配。如果我們需要將結(jié)果寫入一個io.Writer（例如，我們正在創(chuàng)建一個 HTTP 響應(yīng)或?qū)⒔Y(jié)果寫入一個文件），我們可以避免必須創(chuàng)建新的，string因?yàn)?code>strings.Replacer它有一個方便的Replacer.WriteString()方法，它接受一個io.Writer并寫入result into 它而不分配并將其作為 a 返回string。與正則表達(dá)式解決方案相比，這進(jìn)一步顯著提高了性能增益。

反對回復(fù) 2023-04-17

心有法竹

TA貢獻(xiàn)1866條經(jīng)驗(yàn) 獲得超5個贊

您可以將模式“解碼”\R為

U+000DU+000A|[U+000AU+000BU+000CU+000DU+0085U+2028U+2029]

請參閱解釋速記的Java 正則表達(dá)式文檔\R：

Linebreak matcher

\R Any Unicode linebreak sequence, is equivalent to \u000D\u000A|[\u000A\u000B\u000C\u000D\u0085\u2028\u2029]

在 Go 中，您可以使用以下內(nèi)容：

func removeLBR(text string) string {

re := regexp.MustCompile(`\x{000D}\x{000A}|[\x{000A}\x{000B}\x{000C}\x{000D}\x{0085}\x{2028}\x{2029}]`)

return re.ReplaceAllString(text, ``)

}

這是一個Go 演示。

一些 Unicode 代碼可以用Go regexp支持的正則表達(dá)式轉(zhuǎn)義序列替換：

re := regexp.MustCompile(`\r\n|[\r\n\v\f\x{0085}\x{2028}\x{2029}]`)

反對回復(fù) 2023-04-17

2 回答
0 關(guān)注
414 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

Golang 替換所有換行符

Golang 替換所有換行符

2 回答

添加回答