第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

如何解決 tf-idf 詞匯錯(cuò)誤?

如何解決 tf-idf 詞匯錯(cuò)誤?

瀟瀟雨雨 2023-10-25 10:21:50
我在訓(xùn)練數(shù)據(jù)上從 sklearn 訓(xùn)練了一個(gè) TFIDF,當(dāng)我將詞匯應(yīng)用到新數(shù)據(jù)上時(shí),它給了我一個(gè)關(guān)鍵錯(cuò)誤,因?yàn)樗鼪]有從中學(xué)習(xí)。我該如何解決它?這是我的代碼。   def feature_engineering(self, inputs):        x = [self.analyser(seq) for seq in inputs]        return x    def fit(self, inputs):        if self.vocabulary and self.analyser:            pass        else:            vectorizer = TfidfVectorizer(                ngram_range=(self.config_dict["min_n_gram"], self.config_dict["max_n_gram"]), lowercase=False,                stop_words=None,min_df=2)            vectorizer.fit(inputs)            self.analyser = vectorizer.build_analyzer()            self.vocabulary = vectorizer.vocabulary_            save_object(os.path.join(self.feature_extraction_folder, "analyzer.pickle"), self.analyser)            save_object(os.path.join(self.feature_extraction_folder, "vocabulary.pickle"), self.vocabulary)    def transform(self, inputs):        vocab_size = len(self.vocabulary)        inputs = self.feature_engineering(inputs)        inputs = [[self.vocabulary[x] for x in l] for l in inputs]##This line generate an error        return np.array(inputs)
查看完整描述

1 回答

?
慕少森

TA貢獻(xiàn)2019條經(jīng)驗(yàn) 獲得超9個(gè)贊

使用 if 語(yǔ)句解決我的問題

inputs = [[self.vocabulary[x] for x in l if x in self.vocabulary.keys()] for l in inputs]```


查看完整回答
反對(duì) 回復(fù) 2023-10-25
  • 1 回答
  • 0 關(guān)注
  • 135 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)