我一直在使用調(diào)試器工具 Inspect element 在 Firefox 上手動(dòng)收集來(lái)自谷歌圖書(shū)和亞馬遜的圖書(shū)預(yù)覽,在帶有圖像過(guò)濾器的網(wǎng)絡(luò)選項(xiàng)卡下。這很乏味,所以如果可以的話,我想自動(dòng)化。我找到了一個(gè)用 C 語(yǔ)言編寫的便捷工具 (getxbook),它具有三個(gè)實(shí)用程序:一個(gè)用于 google,另一個(gè)用于 amazon,第三個(gè)用于 barnes and noble。只有 google 實(shí)用程序似乎有效。我試圖了解亞馬遜圖片的請(qǐng)求 URL,以便我可以在 Node.js 中實(shí)現(xiàn)自動(dòng)化。這是高分辨率書(shū)籍圖片的 URL:https://d1b14unh5d6w7g.cloudfront.net/1405193557.01.S00R.JUMBOXXX.jpg?Expires=1596719655&Signature=N69M9pndwI5lhb35vd2XNBC/DAxYpGKIqG+gvhHrY7icH3DxB+DZ8oOZT/pqLJbRiJeHVkBiOTWOqA7wpNctg4fa/MwnvLiZ8jBIOKEJsJ1jhT9Lma4KGCaUapyji3oqz0p/qf42OuGISoKeXjoCX9d9ghbKU1QiIPq6evaLypc=&Key-Pair-Id=APKAIUO27P366FGALUMQ從該頁(yè)面可以清楚地看出,亞馬遜正在使用 CloudFront 簽名 URL 來(lái)保護(hù)交易。首先是我理解的部分:1405193557 是 ISBN10S00R 是頁(yè)碼(在本例中為第 14 頁(yè)),接下來(lái)是 S00S(第 15 頁(yè))等。JUMBOXXX 提供高分辨率 (800x1205) [XXXXXXXX 提供低分辨率 (600x903)]Key-Pair-Id:所有頁(yè)面都一樣過(guò)期時(shí)間:以秒為單位的時(shí)間增量簽名:172個(gè)字符,總是以'='結(jié)尾,好像是base64編碼我需要了解的部分仍然是:簽名:在加載的某個(gè)時(shí)刻,庫(kù) (sitb-library-js.js) 從服務(wù)器獲取所有圖像 url,并預(yù)先生成簽名我想要的是一種插入代碼的方法,該代碼在填充后打印 jumboImageUrls[] 列表。我不知道如何推進(jìn)這個(gè) - greasemonkey?任何想法或經(jīng)驗(yàn)表示贊賞。
如何從亞馬遜“Look Inside the Book”功能中提取高分辨率 png 圖像?
HUH函數(shù)
2022-12-22 09:33:33