第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

我想從python中的兩個嵌入文檔中獲取語義相似的單詞列表

我想從python中的兩個嵌入文檔中獲取語義相似的單詞列表

阿波羅的戰(zhàn)車 2022-10-05 17:00:46
我正在研究在 python 中嵌入文本。我發(fā)現(xiàn)兩個文檔與 Doc2vec 模型的相似之處。代碼如下:for doc_id in range(len(train_corpus)):    inferred_vector = model.infer_vector(train_corpus[doc_id].words) # it takes each document words as a input and produce vector of each document    sims = model.docvecs.most_similar([inferred_vector], topn=len(model.docvecs)) # it takes list of all document's vector as a input and compare those with the trained vectors and gives the most similarity of 1st document to other and then second to other and so on .    print('Document ({}): ?{}?\n'.format(doc_id, ' '.join(train_corpus[doc_id].words)))    print(u'SIMILAR/DISSIMILAR DOCS PER MODEL %s:\n' % model)    for label, index in [('MOST', 0), ('SECOND-MOST', 1), ('MEDIAN', len(sims)//2), ('LEAST', len(sims) - 1)]:        print(u'%s %s: ?%s?\n' % (label, sims[index], ' '.join(train_corpus[sims[index][0]].words)))現(xiàn)在,從這兩個嵌入的文檔中,我如何才能從這些特定文檔中提取一組語義相似的單詞。請幫幫我。
查看完整描述

1 回答

?
www說

TA貢獻1775條經(jīng)驗 獲得超8個贊

只有某些Doc2Vec模式也訓練詞向量:(dm=1默認)或(DBOW doc-vectors,但添加了 skip-gram 詞向量。如果您使用過這種模式,那么您的屬性dm=0, dbow_words=1中將會有詞向量。model.wv

調(diào)用model.wv.similarity(word1, word2)方法將為您提供任何 2 個單詞的成對相似性。

因此,您可以遍歷 中的所有單詞doc1,然后收集與 中的每個單詞的相似度doc2,并報告每個單詞的最高相似度。


查看完整回答
反對 回復(fù) 2022-10-05
  • 1 回答
  • 0 關(guān)注
  • 80 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學習伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號