我使用browserless.js(無頭 Chrome)來獲取網站的 html 代碼,然后使用正則表達式來查找某些圖像 URL。一個例子如下:https://vignette.wikia.nocookie.net/moviepedia/images/8/88/Adrien_Brody.jpg/revision/latest/top-crop/width/360/height/450?cb\u003d20141113231800\u0026path-prefix\u003dde存在諸如 之類的 unicode 字符\u003d,應將其解碼(在本例中為=)。原因是我想將這些圖像包含在一個站點中,并且如果不解碼,其中一些圖像將無法顯示(就像上面的圖像一樣,只需粘貼 URL;它就會給出broken-image.webp)。我嘗試了很多事情,但沒有任何效果。JSON.parse(JSON.stringify(...))String.prototype.normalize()decodeURIComponent奇怪的是,“\u003d”的正則表達式(即js中的“\\u003d”)與上面的字符串不匹配,但“u003d”卻匹配。這一切都非常奇怪,我目前的猜測是無瀏覽器在幕后造成了一些奇怪的格式。也就是說,當我控制臺記錄 URL 并將其復制粘貼到其他地方時,上述每種方法都適用于解碼。我希望有人能在這方面幫助我。
Unicode 字符無法解碼
嗶嗶one
2023-09-14 20:40:32