分析網(wǎng)站的access_log總是有很多噪音日志,有搜索引擎的蜘蛛,也有訂閱源什么的,非常麻煩我現(xiàn)在的做法是用UA的一些關(guān)鍵字做過濾,維護一個過濾列表,每分析一條就去過濾一次。我想問問,還有沒有其他更好的方案,因為過濾UA的方法,當列表很大的時候,效率非常差,而且這個列表也不一定全,需要定時去觀察數(shù)據(jù),更新列表。
當列表很大的時候,效率非常差,還有沒有其他更好的方案?
qq_遁去的一_1
2023-04-15 17:13:41