由于想比較同一個(gè)網(wǎng)頁中某個(gè)標(biāo)簽下的子節(jié)點(diǎn)的的相似度。操作對象只是html標(biāo)簽,所以想先刪除html中標(biāo)簽之外的文字,以排除干擾。請問,有什么比較高效快捷的解決方法嗎?注:目前只想到使用正則來解決
python中,如何刪除html頁面中的文字,只留下html標(biāo)簽?
ibeautiful
2019-04-07 11:18:15