我有一個(gè)看起來像這樣的數(shù)據(jù)集:Column1-------abcd - efghi 1234aasdas - asdas 54321asda-asd 2344aasdas(asd) 5234我希望能夠?qū)⑴懦龜?shù)字的所有內(nèi)容拉出,因此它看起來像這樣:Column2-------abcd - efghiaasdas - asdasasda-asdaasdas(asd)這是我當(dāng)前的正則表達(dá)式:df['Column2'] = df['Column1'].str.extract('([A-Z]\w{0,})', expand=True)但它只提取排除括號(hào)和連字符的第一個(gè)單詞。任何幫助將不勝感激...謝謝!
2 回答

寶慕林4294392
TA貢獻(xiàn)2021條經(jīng)驗(yàn) 獲得超8個(gè)贊
喜歡使用 replace
df.Column1.str.replace('\d+','')
Out[775]:
0 abcd-efghi
1 aasdas-asdas
2 asda-asd
3 aasdas(asd)
Name: Column1, dtype: object
#df.Column1=df.Column1.str.replace('\d+','')

瀟瀟雨雨
TA貢獻(xiàn)1833條經(jīng)驗(yàn) 獲得超4個(gè)贊
只是刪除數(shù)字會(huì)給您留下不需要的空格字符。
這個(gè)列表推導(dǎo)式刪除了所有數(shù)字并保留了空格字符,但在外面刪除了它們。
df['Column2'] = df['Column1'].apply(
lambda x: ''.join([i for i in x if not i.isdigit()]).strip())
添加回答
舉報(bào)
0/150
提交
取消