在usercf中并不是兩個(gè)用戶共同看的電影越多,兩個(gè)用戶相似度就越高?
如下圖所示:userid3和userid94共同看的電影最多,但是userid3與userid94的相似度卻不是最高的,我想這是因?yàn)閮烧呖偣部吹碾娪安煌?jì)算相似度的時(shí)候因?yàn)閡serid94看的電影數(shù)太多而導(dǎo)致相似度下降
如下圖所示:userid3和userid94共同看的電影最多,但是userid3與userid94的相似度卻不是最高的,我想這是因?yàn)閮烧呖偣部吹碾娪安煌?jì)算相似度的時(shí)候因?yàn)閡serid94看的電影數(shù)太多而導(dǎo)致相似度下降
2018-08-12
舉報(bào)
2018-08-13
對的,是的我們在計(jì)算相似度的時(shí)候是考慮個(gè)性化因素,舉例來說,如果A用戶和B用戶,A用戶與C用戶都是共同點(diǎn)擊了3個(gè)物品。那么很明顯,B和C誰點(diǎn)擊過的物品越少越能體現(xiàn)出與A用戶的相似。因?yàn)槿绻粋€(gè)用戶點(diǎn)擊的物品太多,其實(shí)顯示的并不是個(gè)性化需求,而是范需求。
2018-08-12
輸出相應(yīng)的total_movies可以看出相應(yīng)的原因:
用戶userid94共看過148部電影,因此導(dǎo)致與userid3的相似度下降