第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

詞干:使用 Python 中的正則表達式模塊刪除/更改 URL

詞干:使用 Python 中的正則表達式模塊刪除/更改 URL

慕哥6287543 2021-09-01 14:47:31
您好,我正在嘗試使用 Python 進行詞干分析,我想使用 Regex 模塊刪除或更改 URL (https/http)。我已經寫了一些代碼行,但它似乎只適用于標點符號而不適用于表情符號和 URL,有人請幫助我嗎?這是我的代碼 def tokenWordbase(verse):    return verse.split(' ')#URLsdef url(link):    link = re.sub(r'^https?:\/\/.*[\r\n]*', '', link, flags=re.MULTILINE)#punctuationdef punctuation(tokens):    tokens = re.sub(r'[>)}:{",?+ !.(<;1234567890]','',str(tokens))    tokens = re.sub('\n','',str(tokens))    return tokens#emotdef emoticons(emot):    emot = re.sub( ':-)', ':)', '(:', '(-:', ':-D', ':D', 'X-D', 'XD', 'xD', ';-)', ';)', ';-D', ';D', '(;', '(-;', ':-(', ':(', '(:', '(-:', ':,(', ':\'(', ':"(', ':((', str(tokens))    return emotdef main():    currentString = []    panjangTang = []    with open('Book2.csv') as f:        reader = csv.reader(f, delimiter=',')        for row in reader:            if row[0] == '' or row[0] == '-':                continue            else:                tokennya = tokenWordbase(row[0])                panjangTangSementara = []                for j in range(len(tokennya)):                    # print(childToken)                    puntu = punctuation(tokennya[j])                    stopnya = stopword.remove(puntu)                    if stopnya == '':                        continue                    else:                        stemmnya = stemmer.stem(stopnya)                        currentString.append(stemmnya)                        panjangTangSementara.append(stemmnya)                panjangTang.append(panjangTangSementara)    daftarDokumen = Counter(currentString)    daftarString = []
查看完整描述

2 回答

?
慕斯王

TA貢獻1864條經驗 獲得超2個贊

domain_registers = [".com",".net",".info",".biz","mobi",".xxx",".asia",".eu",".name",".us ",".co",".org",".me",".mx",".in",".ac",".asp",".php",".html"]

def url(link): if ('.' in link and '/' in link) or 'www.' in link 或 'http' in link 或 any([word in link for word in domain_registers]):返回“”


查看完整回答
反對 回復 2021-09-01
?
慕妹3146593

TA貢獻1820條經驗 獲得超9個贊

url函數沒有返回修改后的字符串,嘗試添加return link到它的末尾。


查看完整回答
反對 回復 2021-09-01
  • 2 回答
  • 0 關注
  • 309 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號