現(xiàn)在要做的項(xiàng)目里也會有問答模塊,所以參考了一下百度知道,發(fā)現(xiàn)它有個“其他類似問題”,不明白百度是通過什么算法來找出類似問題的,求思路……
2 回答

慕虎7371278
TA貢獻(xiàn)1802條經(jīng)驗(yàn) 獲得超4個贊
說下我的思路吧
1 提問通常都是會分類,所以第一次就可以大致確定,所提出的問題屬于哪一類,
2 提取問題關(guān)鍵字 比如 "C#如何使用反射" 通過算法去除不相關(guān)字段“如何” "使用",最后只留下 "C# 反射" 再根據(jù)這個關(guān)鍵詞去已有題庫中去匹配這樣得到的結(jié)果都是與提出的問題相關(guān)的貼子了。 這里有難度的就是提取關(guān)鍵字的算法了。
添加回答
舉報
0/150
提交
取消