第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

您能否舉例說(shuō)明為什么難以用正則表達(dá)式解析XML和HTML?

您能否舉例說(shuō)明為什么難以用正則表達(dá)式解析XML和HTML?

您能否舉例說(shuō)明為什么難以用正則表達(dá)式解析XML和HTML?一個(gè)錯(cuò)誤我看到人們做了,并再次試圖解析XML或HTML用正則表達(dá)式。以下是解析XML和HTML很難的幾個(gè)原因:人們希望將文件視為一系列行,但這是有效的:<tagattr="5"/>人們希望將<或<tag視為標(biāo)記的開(kāi)頭,但是這樣的東西存在于野外:<img src="imgtag.gif" alt="<img>" />人們通常希望將起始標(biāo)記與結(jié)束標(biāo)記匹配,但XML和HTML允許標(biāo)記包含自身(傳統(tǒng)的正則表達(dá)式根本無(wú)法處理):<span id="outer"><span id="inner">foo</span></span>人們通常希望匹配文檔的內(nèi)容(例如著名的“查找給定頁(yè)面上的所有電話號(hào)碼”問(wèn)題),但數(shù)據(jù)可能會(huì)被標(biāo)記(即使在查看時(shí)看起來(lái)是正常的):<span class="phonenum">(<span class="area code">703</span>)<span class="prefix">348</span>-<span class="linenum">3020</span></span>評(píng)論可能包含格式不正確或不完整的標(biāo)記:<a href="foo">foo</a><!-- FIXME:     <a href=" --><a href="bar">bar</a>你還知道其他什么問(wèn)題?
查看完整描述

3 回答

?
呼啦一陣風(fēng)

TA貢獻(xiàn)1802條經(jīng)驗(yàn) 獲得超6個(gè)贊

我寫(xiě)了一篇關(guān)于這個(gè)主題的完整博客文章:正則表達(dá)式限制

問(wèn)題的關(guān)鍵在于HTML和XML是遞歸結(jié)構(gòu),需要計(jì)數(shù)機(jī)制才能正確解析。真正的正則表達(dá)式無(wú)法計(jì)數(shù)。您必須具有無(wú)上下文語(yǔ)法才能計(jì)算。

前一段有一點(diǎn)需要注意。某些正則表達(dá)式實(shí)現(xiàn)現(xiàn)在支持遞歸的想法。但是,一旦開(kāi)始將recursion添加到正則表達(dá)式中,您實(shí)際上是在擴(kuò)展邊界并且應(yīng)該考慮使用解析器。


查看完整回答
反對(duì) 回復(fù) 2019-05-23
  • 3 回答
  • 0 關(guān)注
  • 900 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)