我正在抓取 HTML 頁(yè)面中呈現(xiàn)的文本。我使用列表理解來處理來自 HTML 頁(yè)面的文本數(shù)據(jù)。我正在從網(wǎng)頁(yè)中抓取兩個(gè)不同的對(duì)象 (data,data2),我想將這兩個(gè)對(duì)象都寫入它們自己的列表中。data= driver.find_elements_by_xpath('//*[@id="root"]/div/div[2]/div[1]/div/div/div[2]/div/div/div[1]/div/div[5]/div/div[5]')data2=driver.find_elements_by_xpath('//*[@id="root"]/div/div[2]/div[1]/div/div/div[2]/div/div/div[1]/div/div[5]/div/div[6]')我正在使用 selenium webdriver,所以當(dāng)對(duì)象返回時(shí),我需要遍歷對(duì)象并獲取所有文本(這是在第一輪列表理解中發(fā)生的事情,我將列表分配給變量 text 和 text2)。text = [i.text for i in data]text2 = [i. text for i in data2]在第一個(gè)列表理解之后,列表返回如下['Running\nRunning Normally\nShavings\n47.6%\n739\n739\n3:38:53\n1:31:51\n0:00:00']我想將該字符串的內(nèi)容拆分為一個(gè)列表,這就是我跟進(jìn)第二個(gè)列表理解的原因。text=[i.split("\n")[:] for i in text]text2=[i.split("\n")[:] for i in text2]當(dāng)我打印列表時(shí)它返回[['Running Slow', 'Slow and/or Small Stops', 'Shavings', '48.7%', '800', '800', '3:56:43', '1:31:51', '0:00:00']]關(guān)于如何清理它或使其更好地工作的任何建議?代碼:data= driver.find_elements_by_xpath('//*[@id="root"]/div/div[2]/div[1]/div/div/div[2]/div/div/div[1]/div/div[5]/div/div[5]')data2=driver.find_elements_by_xpath('//*[@id="root"]/div/div[2]/div[1]/div/div/div[2]/div/div/div[1]/div/div[5]/div/div[6]')text = [i.text for i in data]text2 = [i. text for i in data2]text=[i.split("\n")[:] for i in text]text2=[i.split("\n")[:] for i in text2]print(text)print(text2)
1 回答

臨摹微笑
TA貢獻(xiàn)1982條經(jīng)驗(yàn) 獲得超2個(gè)贊
我認(rèn)為這段代碼應(yīng)該可以工作,但我無法嘗試,因?yàn)槲覜]有數(shù)據(jù):
text=[j for i in data for j in i.text.split("\n")]
text2=[j for i in data2 for j in i.text.split("\n")]
添加回答
舉報(bào)
0/150
提交
取消