首頁猿問帶組的正則表達(dá)式管道分隔符

帶組的正則表達(dá)式管道分隔符

Python

炎炎設(shè)計(jì) 2023-07-05 11:10:45

我的 URL 中有一個(gè)未編碼的 URL?？雌饋硐襁@樣https://myhost.mydomain.com/pnLVyL7HjrxMlxjBQkhcOMr2WUs=/400x400/https://myhost.mydomain.com/images/98f9a734-52e2-4616-adf7-bf0165bbf738.png我的域名可以是mydomain.com或mydomain.io. 此外，該/400x400/部件實(shí)際上可能會(huì)有所不同并且相似，/blahblah/XxY/blahblah或者可能完全缺失。圖像可以是jpg, jpeg, png我想提取最后的 URL 的第二部分https://myhost.mydomain.com/images/98f9a734-52e2-4616-adf7-bf0165bbf738.png我有這樣的正則表達(dá)式https://myhost.mydomain.com/[a-zA-Z0-9=]*/.+[\/a-zA-Z0-9]?(/https://[a-zA-Z0-9=-]*.mydomain.(com|io)/images/[a-zA-Z0-9-]*.(png|jpg|jpeg))這將其標(biāo)識(shí)為 4 組但是，我想將第二個(gè) URL 作為一個(gè)組提取 - 所以整個(gè)https://myhost.mydomain.com/images/98f9a734-52e2-4616-adf7-bf0165bbf738.png你能幫我修復(fù)我的正則表達(dá)式嗎？謝謝！

查看完整描述

3 回答

慕少森

TA貢獻(xiàn)2019條經(jīng)驗(yàn) 獲得超9個(gè)贊

嘗試使用

import re

s = "https://myhost.mydomain.com/pnLVyL7HjrxMlxjBQkhcOMr2WUs=/400x400/https://myhost.mydomain.com/images/98f9a734-52e2-4616-adf7-bf0165bbf738.png"

m = re.search(r"https://.+(https.+)$", s)

if m:

print(m.group(1))

輸出：

https://myhost.mydomain.com/images/98f9a734-52e2-4616-adf7-bf0165bbf738.png

反對(duì) 回復(fù) 2023-07-05

隔江千里

TA貢獻(xiàn)1906條經(jīng)驗(yàn) 獲得超10個(gè)贊

我建議采用這種方法：

https?(?!.*https?):\/\/.*\bmydomain\.(?:com|io).*

此正則表達(dá)式使用負(fù)向前查找來確保我們匹配的 URL 是輸入字符串中的最后一個(gè)。示例腳本：

inp = "https://myhost.mydomain.com/pnLVyL7HjrxMlxjBQkhcOMr2WUs=/400x400/https://myhost.mydomain.com/images/98f9a734-52e2-4616-adf7-bf0165bbf738.png"

url = re.findall(r'https?(?!.*https?):\/\/.*\bmydomain\.(?:com|io).*', inp)[0]

print(url)

這打?。?/p>

https://myhost.mydomain.com/images/98f9a734-52e2-4616-adf7-bf0165bbf738.png

反對(duì) 回復(fù) 2023-07-05

海綿寶寶撒

TA貢獻(xiàn)1809條經(jīng)驗(yàn) 獲得超8個(gè)贊

由于有 2 個(gè)鏈接，您可以匹配第一個(gè)鏈接并捕獲組 1 中的第二個(gè)鏈接。

https?://myhost\.mydomain\.(?:com|io)/\S*?(https?://myhost\.mydomain\.(?:com|io)/\S*\.(?:jpe?g|png))

https?://myhost\.mydomain\.(?:com|io)/匹配第一個(gè)鏈接的開頭
\S*?匹配 0+ 次非空白字符非貪婪
(捕獲組 1

https?://myhost\.mydomain\.(?:com|io)/匹配第二個(gè)鏈接的開頭
\S*匹配 0+ 次非空白字符
\.(?:jpe?g|png)匹配 .jpg 或 .jpeg 或 .png

)關(guān)閉組 1

正則表達(dá)式演示| Python演示

例如

import re

regex = r"https?://myhost\.mydomain\.(?:com|io)/\S*?(https?://myhost\.mydomain\.(?:com|io)/\S*\.(?:jpe?g|png))"

test_str = ("https://myhost.mydomain.com/pnLVyL7HjrxMlxjBQkhcOMr2WUs=/400x400/https://myhost.mydomain.com/images/98f9a734-52e2-4616-adf7-bf0165bbf738.png")

matches = re.search(regex, test_str)

if matches:

print(matches.group(1))

輸出

https://myhost.mydomain.com/images/98f9a734-52e2-4616-adf7-bf0165bbf738.png

反對(duì) 回復(fù) 2023-07-05

3 回答
0 關(guān)注
144 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

帶組的正則表達(dá)式管道分隔符

帶組的正則表達(dá)式管道分隔符

3 回答

添加回答