已采納回答 / David
您好,取了top幾個(gè)物品是由于有時(shí)效性,推薦過(guò)程中,我們不可能把用戶(hù)去年操作過(guò)的物品也拿過(guò)來(lái)做itemcf。因?yàn)殡S著時(shí)間推移??赡茉缫呀?jīng)不喜歡之前的物品了。所以召回過(guò)程中考慮到這一點(diǎn)。謝謝。
2018-12-11
最贊回答 / qq_兜兜風(fēng)_1
應(yīng)該是ml-latest-small.zip,只有1M的這個(gè)文件,rating.csv里面的數(shù)據(jù)會(huì)有不同,應(yīng)該是更新過(guò),movies.csv文件的數(shù)據(jù)是一樣的
2018-12-09
已采納回答 / David
您好,我理解您所說(shuō)的物品間相關(guān)性是穩(wěn)定的是指的物品的屬性計(jì)算,比如我們兩個(gè)都是講宮斗的電視劇,兩個(gè)不同品牌但都是薯片的零食等等。我們這里cf得到的item sim矩陣是基于用戶(hù)的行為來(lái)體現(xiàn)的。用戶(hù)的興趣會(huì)隨時(shí)間變化。比如我一年之前喜歡籃球,我愛(ài)看科比。現(xiàn)在我喜歡綜藝,我愛(ài)看爸爸去哪兒。這兩個(gè)物品都被我行為過(guò),如果不加時(shí)間衰減,那么我就給這倆物品的相似度計(jì)算過(guò)程中分子貢獻(xiàn)1,如果算了時(shí)間衰減,也許我的貢獻(xiàn)就是0.01.如果用戶(hù)中存在很多這樣的‘我’,不衰減豈不是 爸爸去哪兒 和科比成了很相似的。您理解一下看...
2018-10-28
已采納回答 / David
長(zhǎng)尾這個(gè)說(shuō)法是一個(gè)普遍說(shuō)法,指的大量的物品被大部分所行為,而少量的物品從來(lái)就很少被行為。你可以百度一下這個(gè)概念。
已采納回答 / David
所有的item 的embeding。對(duì)是k近鄰。
已采納回答 / David
用了itemcf,是選擇用戶(hù)行為過(guò)的物品,每個(gè)物品對(duì)應(yīng)選擇topk個(gè)相似給出推薦。就是上面這個(gè)公式。
2018-10-14
已采納回答 / David
請(qǐng)問(wèn)您說(shuō)的哪一節(jié)?文字沒(méi)有。
講師回答 / David
您好,是在recom_result 裝載之前需要判斷一下itemid_j 是否是tmp_dict的key。謝謝您的問(wèn)題。原視頻代碼中好像這個(gè)地方有點(diǎn)問(wèn)題。
2018-09-29