第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

strings.index unicode behavior

strings.index unicode behavior

Go
倚天杖 2022-08-09 20:34:39
package mainimport (    "fmt"    "strings")func main() {    fmt.Println(strings.Index("ééé hannah","han"))    fmt.Println(strings.Index("eee hannah", "han"))}預(yù)期輸出:44實(shí)際輸出:74我懷疑這種行為與非ASCII字符的事實(shí)有關(guān)。您知道如何實(shí)現(xiàn)預(yù)期輸出嗎?é
查看完整描述

2 回答

?
ITMISS

TA貢獻(xiàn)1871條經(jīng)驗(yàn) 獲得超8個(gè)贊

它的字節(jié)索引在7和4,請(qǐng)參閱注釋,請(qǐng)嘗試一下:


    s1 := "ééé hannah"

    s2 := "eee hannah"

    s3 := "han"

    fmt.Println([]rune(s3))

    // [104 97 110]


    fmt.Println([]rune(s1))

    // [233 233 233 32 104 97 110 110 97 104]

    fmt.Println([]byte(s1))

    // [195 169 195 169 195 169 32 104 97 110 110 97 104]

    fmt.Println(strings.Index(s1, s3))


    fmt.Println([]rune(s2))

    // [101 101 101 32 104 97 110 110 97 104]

    fmt.Println([]byte(s2))

    // [101 101 101 32 104 97 110 110 97 104]

    fmt.Println(strings.Index(s2, s3))

請(qǐng)參閱:,它使用:Go/src/strings/strings.goIndexByte 


// IndexByte returns the index of the first instance of c in s, or -1 if c is not present in s.

func IndexByte(s string, c byte) int {

    return bytealg.IndexByteString(s, c)

}


查看完整回答
反對(duì) 回復(fù) 2022-08-09
?
斯蒂芬大帝

TA貢獻(xiàn)1827條經(jīng)驗(yàn) 獲得超8個(gè)贊

因此,as wasmup 在他們的答案中已經(jīng)說過:返回字節(jié)索引。您期望的是 Unicode 索引。Unicode字符實(shí)際上是多字節(jié)編碼的東西,這就是為什么輸入字符串中的3似乎被計(jì)數(shù)兩次(產(chǎn)生索引7而不是預(yù)期的4)。strings.Indexéé


一些背景

golang中的字符串基本上是一段字節(jié)。這就是返回它所執(zhí)行的值的原因:以字節(jié)為單位找到匹配項(xiàng)的偏移量。但是,Unicode 處理碼位以允許使用多字節(jié)字符。golang 沒有一個(gè)相當(dāng)抽象的名稱類型,而是將這種類型稱為 a 。關(guān)于這個(gè)問題還有很多話要說,但你可以在這里閱讀更多。strings.Indexcodepointrune


但是,考慮到這一點(diǎn),我們可以創(chuàng)建自己的函數(shù),為您提供rune索引,而不是字節(jié)索引。我們調(diào)用函數(shù) 。此類函數(shù)的現(xiàn)成實(shí)現(xiàn)可能如下所示:IndexRuneIndex


func RuneIndex(str, sub string) int {

    // ensure valid input

    if len(str) == 0 || len(sub) == 0 {

        return -1

    }

    // convert to rune slices

    rin, rmatch := []rune(str), []rune(sub)

    // iterate over input until end of string - length of match we're trying to find

    for i := 0; i < len(rin) - len(rmatch); i++ {

        // slight optimisation: if the first runes don't match, don't bother comparing full substrings

        if rin[i] != rmatch[0] {

            continue

        }

        // compare substrings directly, if they match, we're done

        if string(rin[i:i+len(rmatch)]) == sub {

            return i

        }

    }

    return -1

}

它基本上只是將子字符串與我們嘗試搜索的字符串的子切片進(jìn)行比較。通過將符文子片轉(zhuǎn)換為字符串,我們可以只使用運(yùn)算符,如果找到匹配項(xiàng),則返回 ,即符文索引(而不是字節(jié)索引)。我添加了一些檢查來確保參數(shù)不為空,如果未找到索引,該函數(shù)將返回-1,類似于標(biāo)準(zhǔn)庫函數(shù)。==i


實(shí)現(xiàn)非常簡(jiǎn)單,并且沒有高度優(yōu)化,但是考慮到我認(rèn)為這是一個(gè)想要做的利基事情,因此優(yōu)化這種類型的功能無論如何都會(huì)歸類為微優(yōu)化。


查看完整回答
反對(duì) 回復(fù) 2022-08-09
  • 2 回答
  • 0 關(guān)注
  • 160 瀏覽

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)