2 回答

TA貢獻(xiàn)1911條經(jīng)驗(yàn) 獲得超7個(gè)贊
在accuracy()
一個(gè)方法gensim
字向量模型(現(xiàn)在的冷遇相比evaluate_word_analogies()
)不會(huì)把你的文本輸入-它需要的字,類推挑戰(zhàn)專門格式的文件。這個(gè)文件通常被命名為questions-words.txt
.
這是一種測(cè)試通用詞向量的流行方法,可以追溯到 Google 的原始 Word2Vec 論文和代碼發(fā)布。
但是,此評(píng)估不一定表明哪些詞向量最適合您的需求。(例如,一組詞向量可能在這些類比上得分更高,但對(duì)于特定分類或信息檢索目標(biāo)則更糟。)
為了您自己的目的的良好向量,您應(yīng)該設(shè)計(jì)一些特定于任務(wù)的評(píng)估,它給出與您的最終目標(biāo)的成功相關(guān)的分?jǐn)?shù)。
另請(qǐng)注意,作為無監(jiān)督算法,詞向量不一定需要保留測(cè)試集才能進(jìn)行評(píng)估。您通常希望使用盡可能多的數(shù)據(jù)來訓(xùn)練詞向量——確保最大的詞匯覆蓋率,每個(gè)詞的示例最多。然后,您可能會(huì)根據(jù)某個(gè)外部標(biāo)準(zhǔn)測(cè)試詞向量——比如類比問題,它們根本不是訓(xùn)練集的一部分。
或者,您只需將詞向量用作您正在測(cè)試的某些下游任務(wù)的附加輸入,并且在該下游任務(wù)中,您將保留用于訓(xùn)練某些監(jiān)督算法的測(cè)試集。這確保您的監(jiān)督方法不僅僅是記住/過度擬合標(biāo)記的輸入,并且為您提供關(guān)于該詞向量集是否有助于下游任務(wù)的間接質(zhì)量信號(hào)。(而且,該詞向量集可以根據(jù)它們對(duì)其他監(jiān)督任務(wù)的幫助程度與其他詞向量集進(jìn)行比較,而不是與它們自己相同的無監(jiān)督訓(xùn)練步驟進(jìn)行比較。)

TA貢獻(xiàn)1884條經(jīng)驗(yàn) 獲得超4個(gè)贊
Gensim 具有用于測(cè)試數(shù)據(jù)的各種其他指標(biāo),使用它們,您可能可以在幾行代碼中定義自己的函數(shù)。例如,除了models.wv.analogy()
和evaluate_word_analogies
,也有類似的功能evaluate_word_pairs
,closer_than()
,distance()
,most_similar()
等(請(qǐng)參閱該文檔的models.keyedvector
更多細(xì)節(jié)。)這些功能,也許單獨(dú)或作為更大的功能部分用來評(píng)估你的話的嵌入。希望這可以幫助!
添加回答
舉報(bào)