第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

如何驗(yàn)證無效的 unicode 代碼點(diǎn)值?

如何驗(yàn)證無效的 unicode 代碼點(diǎn)值?

Go
森林海 2022-07-11 15:50:04
在下面的代碼中:package mainimport "fmt"func main() {    s := []rune{'\u0041', '\u0042', '\u0043', '\u20AC', -1}    fmt.Println(s)    fmt.Println(string(s)) // ABC€?    fmt.Println(s[3] == '€')    fmt.Println(s[4] == '?')    fmt.Println(s[4] == '\uFFFD')}輸入流具有無效的 unicode 代碼點(diǎn) -1,存儲(chǔ)為\uFFFD.但下面的行給出的輸出為false:    fmt.Println(s[4] == '?')    fmt.Println(s[4] == '\uFFFD')如何驗(yàn)證有效 unicode 代碼點(diǎn)范圍之外的 unicode 代碼點(diǎn)值?
查看完整描述

1 回答

?
紅糖糍粑

TA貢獻(xiàn)1815條經(jīng)驗(yàn) 獲得超6個(gè)贊

嘗試這個(gè):


slice1 := []rune{'\u0041', '\u0042', '\u0043', '\u20AC', -1}

st := string(slice1)

slice2 := []rune(st)

fmt.Println(slice2[4] == '\uFFFD') // true

由于s[4]是-1結(jié)果s[4] == '\uFFFD'是錯(cuò)誤的。

'\uFFFD'是ReplacementChar代表無效代碼點(diǎn)的 。

并且是無效代碼點(diǎn)的替換,例如-1,使用string([]rune{'A', -1})替換-1為'\uFFFD',試試這個(gè):


package main


import (

    "fmt"

    "unicode"

    "unicode/utf8"

)


func main() {

    fmt.Println(unicode.ReplacementChar)

    fmt.Println(utf8.ValidRune(unicode.ReplacementChar))


    rs := []rune{'A', -1}

    s := string(rs)

    fmt.Println(s)

    fmt.Println([]rune(s)) //[65 65533]

}

有效符文


func ValidRune(r rune) bool

ValidRune 報(bào)告 r 是否可以合法地編碼為 UTF-8。超出范圍或代理一半的代碼點(diǎn)是非法的。


const (

    surrogateMin = 0xD800

    surrogateMax = 0xDFFF

    MaxRune   = '\U0010FFFF' // Maximum valid Unicode code point.

)

// ValidRune reports whether r can be legally encoded as UTF-8.

// Code points that are out of range or a surrogate half are illegal.

func ValidRune(r rune) bool {

    switch {

    case 0 <= r && r < surrogateMin:

        return true

    case surrogateMax < r && r <= MaxRune:

        return true

    }

    return false

}

例子:


package main


import (

    "fmt"

    "unicode/utf8"

)


func main() {

    slice := []rune{'\u0041', '\u0042', '\u0043', '\u20AC', '\uFFFD', 0xfffffff, -1}

    for i, v := range slice {

        fmt.Printf("%d %q %v\n", i, v, utf8.ValidRune(v))

    }

}


輸出:


0 'A' true

1 'B' true

2 'C' true

3 '€' true

4 '?' true

5 %!q(int32=268435455) false

6 %!q(int32=-1) false


查看完整回答
反對(duì) 回復(fù) 2022-07-11
  • 1 回答
  • 0 關(guān)注
  • 189 瀏覽

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)