下面的html是我在登陸之后得到的body部分,可以看到主要有兩部分,一個(gè)是導(dǎo)航欄(index_nav,其實(shí)現(xiàn)也是利用JS,具體代碼在head中),另一部分是內(nèi)容(content),在使用selenium和phantomjs輸入完用戶名和密碼點(diǎn)擊登陸后確實(shí)可以得到導(dǎo)航欄的詳細(xì)源代碼,但是由于內(nèi)容部分的src在iframe中,我發(fā)現(xiàn)phantomjs是無法得到其源代碼的,因此我該怎么辦?還有內(nèi)容部分的src在每次登陸后我發(fā)現(xiàn)其值是變化的,尤其是最后的ticket參數(shù),當(dāng)然這個(gè)利用正則表達(dá)式我能得到。
借助selenium和phantomjs如何抓取iframe中用JS得到的網(wǎng)頁呢?
動(dòng)漫人物
2018-09-19 10:09:07