第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

如何在gensim的word2vec模型中嵌入用戶名

如何在gensim的word2vec模型中嵌入用戶名

牧羊人nacy 2022-10-18 16:56:32
我有一些志愿論文寫作,格式如下:volunteer_names, essay["emi", "jenne", "john"], [["lets", "protect", "nature"], ["what", "is", "nature"], ["nature", "humans", "earth"]]["jenne", "li"], [["lets", "manage", "waste"]]["emi", "li", "jim"], [["python", "is", "cool"]].........我想根據(jù)他們的論文寫作來識(shí)別相似的用戶。我覺得 word2vec 更適合這樣的問題。但是,由于我也想在模型中嵌入用戶名,我不知道該怎么做。我在互聯(lián)網(wǎng)上找到的示例僅使用單詞(參見示例代碼)。import gensim sentences = [['first', 'sentence'], ['second', 'sentence']]# train word2vec on the two sentencesmodel = gensim.models.Word2Vec(sentences, min_count=1)在這種情況下,我想知道在 word2vec 中是否有特殊的方法可以做到這一點(diǎn),或者我可以簡單地將用戶名視為輸入模型的單詞。請(qǐng)讓我知道您對(duì)此的看法。如果需要,我很樂意提供更多詳細(xì)信息。
查看完整描述

1 回答

?
素胚勾勒不出你

TA貢獻(xiàn)1827條經(jīng)驗(yàn) 獲得超9個(gè)贊

Word2vec 從周圍的詞中推斷詞的表示:相似的詞經(jīng)常出現(xiàn)在相似的公司中,最終得到相似的向量。通常,考慮 5 個(gè)單詞的窗口。因此,如果您想破解 Word2vec,您需要確保學(xué)生姓名出現(xiàn)的頻率足夠高(可能出現(xiàn)在句子的開頭和結(jié)尾或類似的地方)。

或者,您可以查看 Doc2vec。在訓(xùn)練期間,每個(gè)文檔都獲得一個(gè) ID 并學(xué)習(xí)該 ID 的嵌入,它們?cè)诓檎冶碇校秃孟袼鼈兪窃~嵌入一樣。如果您使用學(xué)生姓名作為文檔 ID,您將獲得學(xué)生嵌入。如果您有來自一個(gè)學(xué)生的多篇論文,我想您需要稍微破解 Gensim 才能使每篇論文都沒有唯一的 ID。


查看完整回答
反對(duì) 回復(fù) 2022-10-18
  • 1 回答
  • 0 關(guān)注
  • 107 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)