由于想比較同一個網(wǎng)頁中某個標簽下的子節(jié)點的的相似度。操作對象只是html標簽,所以想先刪除html中標簽之外的文字,以排除干擾。請問,有什么比較高效快捷的解決方法嗎?注:目前只想到使用正則來解決
python中,如何刪除html頁面中的文字,只留下html標簽?
瀟瀟雨雨
2019-04-16 16:57:55