首頁猿問在js中用標(biāo)記分割字符串

在js中用標(biāo)記分割字符串

JavaScript

達(dá)令說 2023-08-05 19:30:45

我有一個帶有一些標(biāo)記的字符串：'This is {startMarker} the string {endMarker} for {startMarker} example. {endMarker}'我需要將其解析為一個數(shù)組，例如：[ {marker: false, value: 'This is'}, {marker: true, value: 'the string'}, {marker: false, value: 'for'}, {marker: true, value: 'example.'}]因此保持句子順序但添加標(biāo)記信息。知道我怎樣才能實現(xiàn)這一目標(biāo)嗎？謝謝

查看完整描述

3 回答

互換的青春

TA貢獻1797條經(jīng)驗獲得超6個贊

這應(yīng)該可以解決問題

const my_str = 'This is {startMarker} the string {endMarker} for {startMarker} example.{endMarker}';

const my_arr = my_str.split('{endMarker}').reduce((acc, s) =>

s.split('{startMarker}').map((a,i) =>

a && acc.push({

marker: i ? true : false,

value: a.trim()}))

&& acc,[]);

console.log(my_arr)

反對回復(fù) 2023-08-05

繁花不似錦

TA貢獻1851條經(jīng)驗獲得超4個贊

只是因為您是新貢獻者......

interface MarkedString {

marker: boolean

value: string

}

function markString(text: string): MarkedString[] {

let match: RegExpExecArray | null

const firstMatch = text.slice(0, text.indexOf('{') - 1)

const array: MarkedString[] = firstMatch.length > 0 ? [

{ marker: false, value: firstMatch }

] : []

while ((match = /\{(.+?)\}/g.exec(text)) !== null) {

if (!match) break

const marker = match[0].slice(1, match[0].slice(1).indexOf('}') + 1)

const markerEnd = match.index + match[0].length

const value = text.slice(markerEnd ,markerEnd + text.slice(markerEnd).indexOf('{')).trim()

if (value === '') break

if (marker === 'startMarker') {

array.push({ marker: true, value })

} else if (marker === 'endMarker') {

array.push({ marker: false, value })

}

text = text.slice(markerEnd + value.length + 1)

}

return array

}

反對回復(fù) 2023-08-05

阿波羅的戰(zhàn)車

TA貢獻1862條經(jīng)驗獲得超6個贊

const escapeRegex = s => s.replace(/[.*+\-?^${}()|[\]\\]/g, "\\$&");

const extract = (start, end, str) => Array.from(

? str.matchAll(`(.+?)(${escapeRegex(start)}|${escapeRegex(end)}|$)`),

? ([, text, mark]) => ({

? ? marker: mark === end,

? ? value: text.trim()

? })

);

console.log(extract(

? "{startMarker}",

? "{endMarker}",

? "This is {startMarker} the string {endMarker} for {startMarker} example. {endMarker}"

));

解釋

正則表達(dá)式

我們發(fā)送以兩個標(biāo)記之一結(jié)尾的文本段。我們可以提取包括標(biāo)記在內(nèi)的每個部分。

This is {startMarker} the string {endMarker}?

^______^^___________^^__________^^_________^

| text? ? ? ?mark? ?||? ?text? ? ? ? mark? |

^___________________^^_____________________^

? ? ? ?section? ? ? ? ? ? ? ?section

文本將成為value結(jié)果對象的文本，可以檢查標(biāo)記段是否是{endMarker}為了生成true或false用于結(jié)果對象。

因此，如果我們能夠正確提取段和節(jié)，結(jié)果是：

result = {

? marker: marker === "{endMarker}",

? value: text.trim()

}

可以為我們執(zhí)行此操作的正則表達(dá)式是：

/(.+?)(\{startMarker\}|\{endMarker\}|$)/g

請參閱 Regex101

(.+?)將匹配并捕獲文本段
(\{startMarker\}|\{endMarker\}|$)將匹配并提取文本段末尾的標(biāo)記。它還匹配行尾，以防最后一個標(biāo)記后有更多文本，就像您有for {startMarker} example. {endMarker} more text here

一代

更一般地說，我們可以采用任何字符串作為開始和結(jié)束標(biāo)記，然后對它們進行轉(zhuǎn)義以確保它們字面匹配，即使其中存在像.或之類的元字符*。

const?escapeRegex?=?s?=>?s.replace(/[.*+\-?^${}()|[\]\\]/g,?"\\$&");

這樣我們就可以將startand作為字符串并使用構(gòu)造函數(shù)生成end正則表達(dá)式：RegExp

const escapeRegex = s => s.replace(/[.*+\-?^${}()|[\]\\]/g, "\\$&");

const start = "{startMarker}";

const end = "{endMarker}";

const regex = new RegExp(`(.+?)(${escapeRegex(start)}|${escapeRegex(end)}|$)`, "g");

console.log(regex.toString());

匹配

該String#matchAll方法將生成一個迭代器，其中包含應(yīng)用于字符串的正則表達(dá)式的所有匹配項。

const escapeRegex = s => s.replace(/[.*+\-?^${}()|[\]\\]/g, "\\$&");

const extract = (start, end, str) => {

? const sequence = str.matchAll(`(.+?)(${escapeRegex(start)}|${escapeRegex(end)}|$)`);

??

? for(const result of sequence) {

? ? console.log(result);

? }

};

extract(

? "{startMarker}",

? "{endMarker}",

? "This is {startMarker} the string {endMarker} for {startMarker} example. {endMarker}"

);

該.matchAll()方法接受字符串作為參數(shù)，并使用RegExp構(gòu)造函數(shù)自動將其轉(zhuǎn)換為正則表達(dá)式，并進一步自動添加全局標(biāo)志。然而，TypeScript 目前似乎不允許這樣做 - 該方法的類型只允許一個RegExp對象，因此僅對于 TypeScript（直到類型修復(fù)）你必須調(diào)用

str.matchAll(new?RegExp(`(.+?)(${escapeRegex(start)}|${escapeRegex(end)}|$)`,?"g"))

轉(zhuǎn)換為數(shù)組

將可迭代對象轉(zhuǎn)換為數(shù)組的最簡單方法是使用Array.from.?它采用的第一個參數(shù)可以是可迭代的，并且會自動轉(zhuǎn)換為數(shù)組。第二個參數(shù)是在將每個元素放入數(shù)組之前應(yīng)用的映射函數(shù)。

由于我們收到正則表達(dá)式匹配結(jié)果，我們可以使用此函數(shù)將它們直接轉(zhuǎn)換為所需的項目：

result => {

? const match = result[1];

? const marker = result[2];

? return {

? ? marker: marker === end,

? ? value: match.trim()

? };

}

這給了我們更詳細(xì)的版本：

const escapeRegex = s => s.replace(/[.*+\-?^${}()|[\]\\]/g, "\\$&");

const extract = (start, end, str) => {

? return Array.from(

? ? str.matchAll(`(.+?)(${escapeRegex(start)}|${escapeRegex(end)}|$)`),

? ? result => {

? ? ? const match = result[1];

? ? ? const marker = result[2];

? ? ? return {

? ? ? ? marker: marker === end,

? ? ? ? value: match.trim()

? ? ? };

? ? }

? );

}

console.log(extract(

? "{startMarker}",

? "{endMarker}",

? "This is {startMarker} the string {endMarker} for {startMarker} example. {endMarker}"

));

游樂場鏈接

然而，我們可以通過解構(gòu)來減少所需的代碼，它就變成了。

([, text, mark]) => ({

? marker: mark === end,

? value: text.trim()

})

這最終為我們提供了頂部的初始代碼（再次包含在內(nèi)，以避免向上滾動）：

const escapeRegex = s => s.replace(/[.*+\-?^${}()|[\]\\]/g, "\\$&");

const extract = (start, end, str) => Array.from(

? str.matchAll(`(.+?)(${escapeRegex(start)}|${escapeRegex(end)}|$)`),

? ([, text, mark]) => ({

? ? marker: mark === end,

? ? value: text.trim()

? })

);

console.log(extract(

? "{startMarker}",

? "{endMarker}",

? "This is {startMarker} the string {endMarker} for {startMarker} example. {endMarker}"

));

關(guān)于 ES2020 兼容性的最后說明

String#matchAll來自 ES2020 規(guī)范。如果您當(dāng)前沒有瞄準(zhǔn)該目標(biāo)并且不想這樣做，您可以使用工作方式非常相似的生成器函數(shù)輕松推出自己的版本：

function* matchAll(pattern, text) {

? const regex = typeof pattern === "string"

? ? ? new RegExp(pattern, "g")? //convert to global regex

? ? : new RegExp(pattern);? ? ? //or make a copy of the regex object to avoid mutating the input

? ??

? let result;

? while(result = regex.exec(text)) //apply `regex.exec` repeatedly

? ? yield result;? ? ? ? ? ? ? ? ? //and produce each result from the iterator

}

這里唯一值得注意的遺漏是，String#matchAll如果傳入非全局正則表達(dá)式對象，則會拋出錯誤。它仍然可以實現(xiàn)，但我使用了一個稍短的實現(xiàn)來進行說明。

使用自定義，matchAll您可以定位 ES2020 之前的版本，而無需填充

const escapeRegex = s => s.replace(/[.*+\-?^${}()|[\]\\]/g, "\\$&");

function* matchAll(pattern, text) {

? const regex = typeof pattern === "string"

? ? ? new RegExp(pattern, "g")

? ? : new RegExp(pattern);

? ??

? let result;

? while(result = regex.exec(text))

? ? yield result;

}

const extract = (start, end, str) => Array.from(

? matchAll(`(.+?)(${escapeRegex(start)}|${escapeRegex(end)}|$)`, str),

? ([, text, mark]) => ({

? ? marker: mark === end,

? ? value: text.trim()

? })

);

console.log(extract(

? "{startMarker}",

? "{endMarker}",

? "This is {startMarker} the string {endMarker} for {startMarker} example. {endMarker}"

));

反對回復(fù) 2023-08-05

3 回答
0 關(guān)注
206 瀏覽

關(guān)注

添加回答

舉報

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

在js中用標(biāo)記分割字符串

在js中用標(biāo)記分割字符串

3 回答

一代

匹配

轉(zhuǎn)換為數(shù)組

添加回答