我有一段代碼,當前隨著越來越多的用戶在一整天與之交互,從XML文件(從網(wǎng)站獲得)中為每個用戶打印出數(shù)據(jù)。目前,我的代碼循環(huán)每5分鐘下載一次此數(shù)據(jù)。每次運行代碼時,它都會生成一個用戶及其統(tǒng)計信息列表,前5分鐘將打印用戶:a,b,c后5分鐘它將打印用戶:a,b,c,d,e第三5分鐘它會打印用戶:a,b,c,d,e,f,g我需要什么代碼才能執(zhí)行以打印前5分鐘:a,b,c第二個5分鐘:d,e第三個5分鐘:f,g一些如何識別某些用戶已經(jīng)被使用的方法。每個用戶確實都有一個唯一的用戶ID,我想可以將其匹配嗎?附上我的代碼示例,以防萬一。import mechanizeimport urllibimport jsonimport reimport randomimport datetimefrom sched import schedulerfrom time import time, sleep######Code to loop the script and set up scheduling times = scheduler(time, sleep)random.seed()def run_periodically(start, end, interval, func): event_time = start while event_time < end: s.enterabs(event_time, 0, func, ()) event_time += interval + random.randrange(-5, 45) s.run()###### Code to get the data required from the URL desireddef getData(): post_url = "URL OF INTEREST" browser = mechanize.Browser() browser.set_handle_robots(False) browser.addheaders = [('User-agent', 'Firefox')]######These are the parameters you've got from checking with the aforementioned tools parameters = {'page' : '1', 'rp' : '250', 'sortname' : 'roi', 'sortorder' : 'desc' }#####Encode the parameters data = urllib.urlencode(parameters) trans_array = browser.open(post_url,data).read().decode('UTF-8') xmlload1 = json.loads(trans_array) pattern1 = re.compile('> (.*)<') pattern2 = re.compile('/control/profile/view/(.*)\' title=') pattern3 = re.compile('<span style=\'font-size:12px;\'>(.*)<\/span>')請發(fā)表評論,我已經(jīng)編碼了11天,所以請諒解我正在使用的代碼中的任何主要錯誤,盡管到目前為止,它仍然可以正常工作。
添加回答
舉報
0/150
提交
取消