在usercf中并不是兩個用戶共同看的電影越多,兩個用戶相似度就越高?
如下圖所示:userid3和userid94共同看的電影最多,但是userid3與userid94的相似度卻不是最高的,我想這是因?yàn)閮烧呖偣部吹碾娪安煌?,計算相似度的時候因?yàn)閡serid94看的電影數(shù)太多而導(dǎo)致相似度下降
如下圖所示:userid3和userid94共同看的電影最多,但是userid3與userid94的相似度卻不是最高的,我想這是因?yàn)閮烧呖偣部吹碾娪安煌?,計算相似度的時候因?yàn)閡serid94看的電影數(shù)太多而導(dǎo)致相似度下降
2018-08-12
舉報
2018-08-13
對的,是的我們在計算相似度的時候是考慮個性化因素,舉例來說,如果A用戶和B用戶,A用戶與C用戶都是共同點(diǎn)擊了3個物品。那么很明顯,B和C誰點(diǎn)擊過的物品越少越能體現(xiàn)出與A用戶的相似。因?yàn)槿绻粋€用戶點(diǎn)擊的物品太多,其實(shí)顯示的并不是個性化需求,而是范需求。
2018-08-12
輸出相應(yīng)的total_movies可以看出相應(yīng)的原因:
用戶userid94共看過148部電影,因此導(dǎo)致與userid3的相似度下降