首頁猿問使用jsoup從body標(biāo)簽中提取...

使用jsoup從body標(biāo)簽中提取innerHtml

Java

拉風(fēng)的咖菲貓 2019-04-26 17:15:38

我正在使用jsoup解析html并想要在body標(biāo)簽內(nèi)提取innerHtml到目前為止，我嘗試并使用document.body.childern（）。outerHtml; 但它只提供html元素并在正文內(nèi)部跳過浮動文本（不包含在任何html標(biāo)記內(nèi)）private String getBodyTag(final Document document) { return document.body().children().outerHtml();}輸入：<!DOCTYPE html><html lang="de"> <head> <META http-equiv="Content-Type" content="text/html; charset=UTF-8"> <link rel="stylesheet" type="text/css" href="assets/style.css"> </head> <body> <div>questions to improve formatting and clarity.</div> <h3>Guided Mode</h3> some sample raw/floating text </body></html>預(yù)期：<div>questions to improve formatting and clarity.</div><h3>Guided Mode</h3> some sample raw/floating text實際：<div>questions to improve formatting and clarity.</div><h3>Guided Mode</h3>

查看完整描述

2 回答

小唯快跑啊

TA貢獻(xiàn)1863條經(jīng)驗獲得超2個贊

請使用這個：

private String getBodyTag(final Document document) {
    return document.body().html();}

反對回復(fù) 2019-05-15

慕后森

TA貢獻(xiàn)1802條經(jīng)驗獲得超5個贊

您可以嘗試返回document.body.innerHtml;，因此它會返回body標(biāo)記內(nèi)的所有內(nèi)容，包括任何標(biāo)記之外的文本。

據(jù)我所知，你試圖完成它的方式不起作用，因為“原始文本”不被視為孩子。

反對回復(fù) 2019-05-15

2 回答
0 關(guān)注
1244 瀏覽

關(guān)注

添加回答

舉報

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

使用jsoup從body標(biāo)簽中提取innerHtml

使用jsoup從body標(biāo)簽中提取innerHtml

2 回答

添加回答