第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

除了XHTML自包含標(biāo)記之外,RegEx匹配開放標(biāo)記

除了XHTML自包含標(biāo)記之外,RegEx匹配開放標(biāo)記

我需要匹配所有這些開始標(biāo)記:<p><a href="foo">但不是這些:<br /><hr class="foo" />我想出了這個(gè),并希望確保我做對(duì)了。我只抓住了a-z。<([a-z]+) *[^/]*?>我相信它說:找一個(gè)小于,然后然后,查找(并捕獲)az一次或多次然后找到零個(gè)或多個(gè)空格找到任何字符零次或多次,貪婪/,然后找到一個(gè)大于我有這個(gè)權(quán)利嗎?更重要的是,你怎么看?
查看完整描述

10 回答

?
寶慕林4294392

TA貢獻(xiàn)2021條經(jīng)驗(yàn) 獲得超8個(gè)贊

雖然確實(shí)要求正則表達(dá)式解析任意 HTML就像要求初學(xué)者編寫操作系統(tǒng)一樣,但有時(shí)候解析一組有限的已知 HTML 也是合適的。

如果您有一小組HTML頁面要從中抓取數(shù)據(jù)然后填充到數(shù)據(jù)庫中,則正則表達(dá)式可能正常工作。例如,我最近想獲得澳大利亞聯(lián)邦代表的名稱,政黨和地區(qū),我從議會(huì)的網(wǎng)站上獲取了這些名稱,政黨和地區(qū)。這是一項(xiàng)有限的一次性工作。

正則表達(dá)式對(duì)我來說效果很好,設(shè)置速度非常快。


查看完整回答
反對(duì) 回復(fù) 2019-05-20
?
搖曳的薔薇

TA貢獻(xiàn)1793條經(jīng)驗(yàn) 獲得超6個(gè)贊

我認(rèn)為這里的缺陷是HTML是Chomsky Type 2語法(無上下文語法),RegEx是Chomsky Type 3語法(常規(guī)語法)。由于Type 2語法從根本上比Type 3語法更復(fù)雜(參見Chomsky層次結(jié)構(gòu)),因此在數(shù)學(xué)上不可能使用RegEx解析XML。

但許多人會(huì)嘗試,有些人甚至?xí)暦Q成功 - 但直到其他人發(fā)現(xiàn)錯(cuò)誤并完全搞砸了你。


查看完整回答
反對(duì) 回復(fù) 2019-05-20
?
守候你守候我

TA貢獻(xiàn)1802條經(jīng)驗(yàn) 獲得超10個(gè)贊

不要聽這些家伙。如果你將任務(wù)分解成更小的部分,你完全可以使用正則表達(dá)式解析無上下文的語法。您可以使用腳本生成正確的模式,該腳本按順序執(zhí)行以下每個(gè)操作:

  1. 解決停機(jī)問題。

  2. 方圓。

  3. 計(jì)算O(log n)或更少的旅行商問題。如果它不止于此,你將耗盡RAM并且引擎將掛起。

  4. 模式將非常大,因此請(qǐng)確保您有一個(gè)無損壓縮隨機(jī)數(shù)據(jù)的算法。

  5. 幾乎就在那里 - 將整個(gè)事物除以零。十分簡單。

我自己還沒完成最后一部分,但我知道我已經(jīng)接近了。CthulhuRlyehWgahnaglFhtagnException由于某種原因,它一直在拋出s,所以我要將它移植到VB 6并使用On Error Resume Next。一旦我調(diào)查剛剛在墻上打開的這扇奇怪的門,我就會(huì)用代碼更新。嗯。

PS Pierre de Fermat也想出了如何做到這一點(diǎn),但他寫的邊距不足以代碼。


查看完整回答
反對(duì) 回復(fù) 2019-05-20
?
米脂

TA貢獻(xiàn)1836條經(jīng)驗(yàn) 獲得超3個(gè)贊

這是我使用(?。┢ヅ銱TML標(biāo)記的正則表達(dá)式:

<(?:"[^"]*"['"]*|'[^']*'['"]*|[^'">])+>

它可能不完美,但我通過大量 HTML 運(yùn)行此代碼。請(qǐng)注意,它甚至?xí)东@<a name="badgenerator"">出現(xiàn)在網(wǎng)絡(luò)上的奇怪內(nèi)容。

我想讓它與自包含的標(biāo)簽不匹配,你要么想要使用Kobi的負(fù)面后衛(wèi):

<(?:"[^"]*"['"]*|'[^']*'['"]*|[^'">])+(?<!/\s*)>

或者只是組合,如果沒有。

對(duì)于downvoters:這是來自實(shí)際產(chǎn)品的工作代碼。我懷疑讀這個(gè)頁面的人會(huì)得到這樣的印象:在HTML上使用正則表達(dá)式是社會(huì)可接受的。

警告:我應(yīng)該注意,在CDATA塊,注釋,腳本和樣式元素存在的情況下,這個(gè)正則表達(dá)式仍然存在故障。好消息是,你可以擺脫使用正則表達(dá)式的人...


查看完整回答
反對(duì) 回復(fù) 2019-05-20
?
牧羊人nacy

TA貢獻(xiàn)1862條經(jīng)驗(yàn) 獲得超7個(gè)贊

我建議使用QueryPath在PHP中解析XML和HTML。它與jQuery的語法基本相同,只是在服務(wù)器端。


查看完整回答
反對(duì) 回復(fù) 2019-05-20
  • 10 回答
  • 0 關(guān)注
  • 885 瀏覽

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)