匹配以下代碼中<FONT id=Zoom>........</FONT>之間的內(nèi)容,因為中間有多個font標(biāo)簽,所以需要成對匹配,其實<FONT id=Zoom>........</FONT>之間的內(nèi)容就是新聞內(nèi)容,所以存在不確定的HTML標(biāo)簽個數(shù)。謝各位高人幫忙!謝謝......<TR> <td width="5%"></td> <td style="......" vAlign=top width="90%"> <FONT id=Zoom> ........ <p><span><FONT style="FONT-SIZE: 10.5pt">這里是文字內(nèi)容1。。。。。</FONT></SPAN></p> <p><Font styel=".....">這里是文字內(nèi)容2。。。。</Font></p> <div style="....."><font sytle=".....">這里是文字3。。。。</font></div> ........ </FONT> </td></TR>......
2 回答
慕沐林林
TA貢獻(xiàn)2016條經(jīng)驗 獲得超9個贊
<(?<HtmlTag>[\w]+)[^>]*\sid=(?<Quote>["']?)Zoom(?(Quote)\k<Quote>)["']?[^>]*> (((?<Nested><\k<HtmlTag>[^>]*>)|</\k<HtmlTag>>(?<-Nested>)|.*?)*)</\k<HtmlTag>>
這個絕對可以,我的爬蟲就是用這個。
添加回答
舉報
0/150
提交
取消
