第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

如何獲得每組連續(xù)X次以上相同單詞的平均值?

如何獲得每組連續(xù)X次以上相同單詞的平均值?

喵喵時(shí)光機(jī) 2023-07-18 15:28:42
如何獲得每組 X 次以上相同單詞的平均值?但在這里,我想連續(xù)獲得每組(group =?name)相同單詞超過 4 次的平均值。例子:id | name | sentences---------------------1? |? aa? | david hi david david david2? |? aa? | david david is at home3? |? bb? | I'm king4? |? cc? | where r u going5? |? dd? | lol lol lol lol lol lol6? |? ee? | abc abc cc abc abc abc abc cc7? |? ee? | dd dd dd ee dd dd dd我想得到以下結(jié)果:name | avg----------aa? ?|? 0.0? ?(0 sentence contain the words 'david' continuously 4 times in ). total instances of 'aa' group is 2bb? ?|? 0.0? ?(0 sentence contains same word continuously 4 times)?cc? ?|? 0.0? ?(0 sentence contains same word continuously 4 times)dd? ?|? 1.0? ?(1 sentence contains same word 'lol' continuously 4 times). total instances of 'dd' group is 1ee? ?|? 0.5? ?(1 sentence contains same word 'abc' continuously 4 times). total instances of 'dd' group is 2I'm using python 3.6.8
查看完整描述

1 回答

?
汪汪一只貓

TA貢獻(xiàn)1898條經(jīng)驗(yàn) 獲得超8個(gè)贊

您可以4使用以下方法對(duì)連續(xù)出現(xiàn)的單詞或連續(xù)多次進(jìn)行計(jì)數(shù)Series.str.count,然后使用Series.groupby對(duì)系列cnt進(jìn)行分組name并使用聚合mean來獲得分組平均值。

cnt = df['sentences'].str.count(r'(\w+)(\s\1){3,}')

avg = cnt.groupby(df['name']).mean().reset_index(name='avg')

細(xì)節(jié):


print(cnt)

0? ? 0

1? ? 0

2? ? 0

3? ? 0

4? ? 1

5? ? 1

6? ? 0

Name: sentences, dtype: int64


print(avg)

? name? avg

0? ?aa? 0.0

1? ?bb? 0.0

2? ?cc? 0.0

3? ?dd? 1.0

4? ?ee? 0.5


查看完整回答
反對(duì) 回復(fù) 2023-07-18
  • 1 回答
  • 0 關(guān)注
  • 107 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)