2 回答

TA貢獻1828條經(jīng)驗 獲得超3個贊
我懷疑某些 HTML 可能是使用 Javascript 生成的——在這種情況下,當(dāng)頁面首次加載時它不存在,因此使用像 cURL 這樣的非瀏覽器客戶端的簡單請求將永遠看不到它,或者可能會被下載通過額外的 AJAX 請求 - 在這種情況下,您可以通過直接向 AJAX 使用的 URL 發(fā)出請求來檢索它。甚至是兩者的某種結(jié)合。使用瀏覽器的開發(fā)人員工具更仔細地檢查頁面可能有助于您了解內(nèi)容的實際創(chuàng)建方式。
如今,頁面包含稍后加載和/或由腳本生成的內(nèi)容是很常見的。因此,原始 HTML 的基本下載無法捕獲額外的內(nèi)容(因為沒有 Javascript 環(huán)境可以運行代碼并下載/創(chuàng)建額外的 HTML)。你需要一個無頭瀏覽器,或者一個像谷歌爬蟲一樣復(fù)雜的網(wǎng)絡(luò)客戶端才能完全加載這樣的頁面

TA貢獻1780條經(jīng)驗 獲得超1個贊
嘗試使用 preg_match 來處理html
$html = "...<frame>...</frame>";
preg_match("~<frame[^>]*>(.*?)</frame>~",$html,$output);
echo $output;
演示: https: //3v4l.org/CNJWQ
- 2 回答
- 0 關(guān)注
- 232 瀏覽
添加回答
舉報