第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何在 Python 中迭代 UTF-8?

如何在 Python 中迭代 UTF-8?

素胚勾勒不出你 2023-01-04 13:34:28
我如何遍歷 utf 8?import stringfor character in string.printable[1:]:    print (character)想必 UTF-8 也有類似的方法嗎?
查看完整描述

1 回答

?
紅糖糍粑

TA貢獻1815條經(jīng)驗 獲得超6個贊

想必 UTF-8 也有類似的方法嗎?


你想知道哪些代碼點在 ascii 范圍之外是可打印的嗎?或者你想要可打印字符的 utf8 編碼?


要獲取所有 unicode 的所有可打印代碼點:

unicode_max = 0x10ffff

printable_glyphs = [ chr(x) for x in range(0, unicode_max+1) if chr(x).isprintable() ]

上面說了,utf8是一種編碼。那時文本被映射到特定的字節(jié),以便其他程序可以共享數(shù)據(jù)。


內(nèi)存中的文本不是 utf8。每個字符/字形都有一個代碼點。


轉換為 utf-8

import unicodedata

monkey = unicodedata.lookup('monkey')


print(f"""

    glyph: {monkey}

    codepoint: Dec: {ord(monkey)}

    codepoint: Hex:  {hex(ord(monkey))}


    utf8: { monkey.encode('utf8', errors='strict') }

    utf16: { monkey.encode('utf16', errors='strict') }

    utf32: { monkey.encode('utf32', errors='strict') }

""")

輸出:


glyph: ??

codepoint: Dec: 128018

codepoint: Hex:  0x1f412


 utf8: b'\xf0\x9f\x90\x92'

utf16: b'\xff\xfe=\xd8\x12\xdc'

utf32: b'\xff\xfe\x00\x00\x12\xf4\x01\x00'


查看完整回答
反對 回復 2023-01-04
  • 1 回答
  • 0 關注
  • 101 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網(wǎng)微信公眾號