第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

如何添加已知單詞標(biāo)記器 keras python?

如何添加已知單詞標(biāo)記器 keras python?

翻閱古今 2021-09-14 20:41:20
我想使用帶有印度尼西亞語(yǔ)的 keras 將文本轉(zhuǎn)換為序列。但 keras 標(biāo)記器只檢測(cè)已知單詞。如何在keras中添加已知單詞?或者我有什么解決方案可以將文本轉(zhuǎn)換為序列?from keras.preprocessing.text import Tokenizertokenizer = Tokenizer(num_words=n_most_common_words, filters='!"#$%&()*+,-./:;<=>?@[\]^_`{|}~', lower=True)tokenizer.fit_on_texts(concated['TITLE'].values)txt = ["bisnis di indonesia sangat maju"]seq = list(tokenizer.texts_to_sequences_generator(txt))如果我使用印度尼西亞語(yǔ),“seq”變量會(huì)產(chǎn)生空數(shù)組,如果我使用英文單詞,它會(huì)完美地工作。如何將 keras 用于不同的語(yǔ)言?或者無(wú)論如何要向keras添加一些已知詞?
查看完整描述

1 回答

?
手掌心

TA貢獻(xiàn)1942條經(jīng)驗(yàn) 獲得超3個(gè)贊

Keras不知道任何語(yǔ)言或文字。可以使用fit_on_textsorfit_on_sequences方法創(chuàng)建詞匯表。

我猜您是fit在某些英文文本(即concated['TITLE'].values)上使用分詞器。結(jié)果,內(nèi)部詞匯只包含英語(yǔ)單詞(沒(méi)有印尼語(yǔ)單詞)。這解釋了為什么seq如果txt只包含非英語(yǔ)單詞會(huì)是空的。

此外,您可以查看源代碼Tokenizer


查看完整回答
反對(duì) 回復(fù) 2021-09-14
  • 1 回答
  • 0 關(guān)注
  • 191 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)