第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

如何使用python拆分字符串中的中文單詞和英文單詞?

如何使用python拆分字符串中的中文單詞和英文單詞?

達(dá)令說(shuō) 2023-02-15 16:33:25
例如,我有一些字符串如下所示:'人均收入 Per capital Income','總產(chǎn)值 Gross Output Value'.我想把它們分成'人均收入' 'Per capital Income''總產(chǎn)值' 'Gross Output Value'漢字總是在英文單詞之前。
查看完整描述

3 回答

?
牛魔王的故事

TA貢獻(xiàn)1830條經(jīng)驗(yàn) 獲得超3個(gè)贊

如果始終只有一個(gè)中文文本跨度,您可以只在第一個(gè)空格處拆分:


s.split(' ', 1)

如果中文文本中可能有空格,您可以查找第一個(gè)不是空格的 ASCII 字符:


for ii, ch in enumerate(s): 

    if not ch.isspace() and ch.isascii():

        break

當(dāng)該循環(huán)完成時(shí),它會(huì)將iiset 保留為第一個(gè)非空格的 ASCII 字符的索引。你可以把它變成一個(gè)像這樣的函數(shù)并像這樣進(jìn)行拆分:


def split_ascii(s): 

    for ii, ch in enumerate(s): 

        if not ch.isspace() and ch.isascii(): 

            break 

    return s[:ii].rstrip(), s[ii:]


查看完整回答
反對(duì) 回復(fù) 2023-02-15
?
MM們

TA貢獻(xiàn)1886條經(jīng)驗(yàn) 獲得超2個(gè)贊

您也可以嘗試正則表達(dá)式:


import re


s = '人均收入 Per capital Income'

result = re.match(r"([\u4e00-\u9fa5]*)([A-Za-z\s]*)", s)

print(result.group(1)) # 人均收入

print(result.group(2)) #  Per capital Income 


查看完整回答
反對(duì) 回復(fù) 2023-02-15
?
暮色呼如

TA貢獻(xiàn)1853條經(jīng)驗(yàn) 獲得超9個(gè)贊

對(duì)我來(lái)說(shuō)很難使用正則表達(dá)式。我更喜歡做這個(gè)選項(xiàng):


import string

i = 0

CHINESE = ''

ENGLISH = ''

while i < len('人均收入 Per capital Income'):

  if '人均收入 Per capital Income'[i] in string.ascii_letters:

    break

  i += 1

CHINESE = '人均收入 Per capital Income'[:i-1]

ENGLISH = '人均收入 Per capital Income'[i:]


查看完整回答
反對(duì) 回復(fù) 2023-02-15
  • 3 回答
  • 0 關(guān)注
  • 225 瀏覽
慕課專(zhuān)欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)