首頁猿問阻止循環(huán)腳本返回重復的條目

阻止循環(huán)腳本返回重復的條目

Python

翻翻過去那場雪 2021-03-26 16:15:43

我有一段代碼，當前隨著越來越多的用戶在一整天與之交互，從XML文件（從網(wǎng)站獲得）中為每個用戶打印出數(shù)據(jù)。目前，我的代碼循環(huán)每5分鐘下載一次此數(shù)據(jù)。每次運行代碼時，它都會生成一個用戶及其統(tǒng)計信息列表，前5分鐘將打印用戶：a，b，c后5分鐘它將打印用戶：a，b，c，d，e第三5分鐘它會打印用戶：a，b，c，d，e，f，g我需要什么代碼才能執(zhí)行以打印前5分鐘：a，b，c第二個5分鐘：d，e第三個5分鐘：f，g一些如何識別某些用戶已經(jīng)被使用的方法。每個用戶確實都有一個唯一的用戶ID，我想可以將其匹配嗎？附上我的代碼示例，以防萬一。import mechanizeimport urllibimport jsonimport reimport randomimport datetimefrom sched import schedulerfrom time import time, sleep######Code to loop the script and set up scheduling times = scheduler(time, sleep)random.seed()def run_periodically(start, end, interval, func): event_time = start while event_time < end: s.enterabs(event_time, 0, func, ()) event_time += interval + random.randrange(-5, 45) s.run()###### Code to get the data required from the URL desireddef getData(): post_url = "URL OF INTEREST" browser = mechanize.Browser() browser.set_handle_robots(False) browser.addheaders = [('User-agent', 'Firefox')]######These are the parameters you've got from checking with the aforementioned tools parameters = {'page' : '1', 'rp' : '250', 'sortname' : 'roi', 'sortorder' : 'desc' }#####Encode the parameters data = urllib.urlencode(parameters) trans_array = browser.open(post_url,data).read().decode('UTF-8') xmlload1 = json.loads(trans_array) pattern1 = re.compile('>  (.*)<') pattern2 = re.compile('/control/profile/view/(.*)\' title=') pattern3 = re.compile('<span style=\'font-size:12px;\'>(.*)<\/span>')請發(fā)表評論，我已經(jīng)編碼了11天，所以請諒解我正在使用的代碼中的任何主要錯誤，盡管到目前為止，它仍然可以正常工作。

查看完整描述