背景描述:系統(tǒng)內(nèi)部有醫(yī)院,案例,醫(yī)生,特賣產(chǎn)品的實體,需要給這些實體打標(biāo)簽,即在數(shù)據(jù)庫中存一個標(biāo)簽字段,比如為一些醫(yī)院,案例打上雙眼皮的標(biāo)簽。打上的標(biāo)簽是供APP搜索使用的。目前的做法是讓運營人員通過CMS系統(tǒng)手動給這些實體添加標(biāo)簽。但效率低下。怎樣能夠自動給這些實體打上標(biāo)簽,運營人員只需要配置標(biāo)簽即可。打標(biāo)簽的規(guī)則可以是匹配如醫(yī)院介紹的文字,醫(yī)院名稱等字符串匹配。但存在比如需要給雙眼皮的案例打上如楊慶峰(一個做雙眼皮非常厲害的醫(yī)生)的標(biāo)簽,這就麻煩了。目前這幾種實體的數(shù)據(jù)記錄總數(shù)在8000左右,為了讓搜索時候各種記錄有大致相同的被搜索到的機(jī)會,僅靠運營人員給部分記錄手動打標(biāo)簽就不太合適了,會導(dǎo)致大部分記錄無法被搜索出來。技術(shù)咨詢:使用怎樣的思想處理這樣的問題,使用怎樣的技術(shù)進(jìn)行實際操作?
4 回答

有只小跳蛙
TA貢獻(xiàn)1824條經(jīng)驗 獲得超8個贊

尚方寶劍之說
TA貢獻(xiàn)1788條經(jīng)驗 獲得超4個贊
說下自己的一些看法,并不懂JAVA
你需要的是分詞,根據(jù)你能夠拿到的有用信息來進(jìn)行分詞。之前粗略的了解過 python 的自然語言處理相關(guān)的庫,應(yīng)該能夠解決樓主的問題。
不太清楚你提到的這個麻煩事什么問題,是拿不到這個案例對應(yīng)的醫(yī)生信息, 還是說你們的數(shù)據(jù)結(jié)構(gòu)有問題?
但存在比如需要給雙眼皮的案例打上如楊慶峰(一個做雙眼皮非常厲害的醫(yī)生)的標(biāo)簽,這就麻煩了。
最后說下這里的詞庫的來源,除了上面提到的根據(jù)已有的信息來進(jìn)行分詞,還可以是搜索引擎里面行業(yè)相關(guān)的搜索詞,站內(nèi)搜索詞,從競爭對手獲得的相關(guān)搜索詞;其實只要解決80%的詞(搜索量大的詞)用戶體驗就會上升一個等級
添加回答
舉報
0/150
提交
取消