料青山看我應(yīng)如是
2019-03-05 21:17:41
背景:后臺抓取其他網(wǎng)站的詳情頁,要放到我們手機app中,還要保持風(fēng)格統(tǒng)一,就不能使用iframe了,但是這個詳情頁的復(fù)雜程度我們不確定,有可能有table,圖片,也可能是抓取的web端頁面,web端頁面的table定寬了怎么辦?有沒有做過類似需求的?問題:現(xiàn)在應(yīng)該從哪里下手,是先要確定輸入嗎?如果是的話后臺返給前端帶內(nèi)聯(lián)樣式的html文本,還是返給前端純文本,但是有table或者有img的地方需要連帶標簽返回?還是有其他更好的方法或者腳本??
2 回答

至尊寶的傳說
TA貢獻1789條經(jīng)驗 獲得超10個贊
有兩種想法
后臺抓取之后,解析html把 數(shù)據(jù) 圖片 表格 分類 , 只把數(shù)據(jù)返回給前端,前端再用統(tǒng)一的布局,決定各個的位置.
抓取之后 把html中的樣式去掉,把html傳給前端 , 前端用css給表格 文字 寫一個同一的樣式
都能達到統(tǒng)一風(fēng)格的目的

桃花長相依
TA貢獻1860條經(jīng)驗 獲得超8個贊
通常我的做法是,由于目標網(wǎng)站的頁面結(jié)構(gòu)都是不一樣的,所以采集之后還是需要數(shù)據(jù)清洗的,把數(shù)據(jù)整理成結(jié)構(gòu)化的,這樣給前端就是固定的格式,前端方便處理,用戶使用的話也是看的一樣的格式。
然后麻煩的地方在于目標站點的頁面結(jié)構(gòu)不一樣的,每個都需要單獨的采集程序和分析程序,如果站點數(shù)目不多其實沒關(guān)系,但是站點多了之后,就需要把采集和分析的程序開發(fā)成可配置化的,這樣開發(fā)難度可能會大一點。
添加回答
舉報
0/150
提交
取消