首頁猿問 java 、jsoup正則表達式

java 、jsoup正則表達式

Java

翻翻過去那場雪 2019-03-20 15:11:32

如何通過正則表達式或者jsoup將19040172b-1、 SQL Server開發(fā) 、鄭尚、3-5,7-14(周) 、東區(qū)綜合樓D-101 提取出來？， <div id="AE9D7F630640426F8457A661607D2B8E-5-2" style="display: none;" class="kbcontent"> 19040172b-1 SQL Server開發(fā) 鄭尚 3-5,7-14(周) 東區(qū)綜合樓D-101 </div>已嘗試下列辦法均失敗1. Pattern pattern = Pattern.compile(">(.*?) ");2. Elements msg = doc.select(":matchesOwn([>.*? ])");

查看完整描述

3 回答

侃侃無極

TA貢獻2051條經(jīng)驗獲得超10個贊

Document document = Jsoup.parse("<div id=\"AE9D7F630640426F8457A661607D2B8E-5-2\" style=\"display: none;\" class=\"kbcontent\"> 19040172b-1 SQL Server開發(fā) 鄭尚 3-5,7-14(周) 東區(qū)綜合樓D-101 </div>");

System.out.println(document.text());

Output：19040172b-1 SQL Server開發(fā) 鄭尚 3-5,7-14(周) 東區(qū)綜合樓D-101

不知道是否滿足樓主的需求？

Document document = Jsoup.parse("<div id=\"AE9D7F630640426F8457A661607D2B8E-5-2\" style=\"display: none;\" class=\"kbcontent\"> 19040172b-1 SQL Server開發(fā) 鄭尚 3-5,7-14(周) 東區(qū)綜合樓D-101 </div>");

Element div = document.getElementById("AE9D7F630640426F8457A661607D2B8E-5-2");

TextNode n1 = (TextNode) div.childNode(0);

System.out.println(n1.text()); // 19040172b-1

TextNode n2 = (TextNode) div.childNode(2);

System.out.println(n2.text()); // SQL Server開發(fā)

// ...

如果樓主的格式是固定的直接像上面這樣解析HTML會比較好一些，不需要REGEX。

反對回復(fù) 2019-04-24

動漫人物

TA貢獻1815條經(jīng)驗獲得超10個贊

String html = "<div id=\"AE9D7F630640426F8457A661607D2B8E-5-2\" style=\"display: none;\" class=\"kbcontent\"> 19040172b-1 SQL Server Develop zheng 3-5,7-14 D-101 </div> ";

html = html.replaceAll(" ", "#~#");

Document doc = Jsoup.parse(html.toString());

String newHtml = doc.text();

String[] ary = newHtml.split("#~#");

for (int i = 0;i < ary.length;i++){

System.out.println(ary[i]);

}