第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

將 pandas 輸出格式化為 csv

將 pandas 輸出格式化為 csv

開滿天機(jī) 2022-06-28 16:55:05
我是 python 和 pandas 的新手,并創(chuàng)建了一個(gè)帶有 html 代碼的測(cè)試網(wǎng)頁,用于幫助學(xué)習(xí)如何提取數(shù)據(jù),然后格式化為 CSV 以在 excel 中使用。下面是我想出的代碼,它把它變成了一個(gè)很好的格式,但我被困在如何將它格式化成一個(gè) CSV 文件來導(dǎo)入。代碼:# Importing pandas import pandas as pd # The webpage URL whose table we want to extract url = "/home/dvm01/e007"# Assign the table data to a Pandas dataframe table = pd.read_html(url,**index_col=0**)[0]#table2 = pd.read_html(url)[0],pd.read_html(url)[1],pd.read_html(url)[6]# Print the dataframe print(table)#print(table2)# Store the dataframe in Excel file #table.to_excel("data.xlsx") 輸出:            Account                                          Account.1ID:                                         e007Description:  ABST: 198, SUR: J DOUTHITGeo ID:                            014.0198.0000我想弄清楚的是如何刪除行的索引并使第一個(gè)之前的文本:成為列標(biāo)題。在第 1 行中,我有兩個(gè):但第一個(gè)之后的所有內(nèi)容:應(yīng)該是列標(biāo)題的數(shù)據(jù)。我想采用上述當(dāng)前輸出,并將 ID、描述和地理 ID 作為列標(biāo)題,將“:”之后的文本作為每個(gè)標(biāo)題的數(shù)據(jù)。我不需要 'Account' 和 'Account.1' 我相信這些被識(shí)別為列標(biāo)題。下面是我希望輸出在 Excel 中的樣子,但我不知道如何正確格式化它以導(dǎo)出到可以導(dǎo)入的 CSV。也許我什至不需要導(dǎo)入或格式化為 CSV,'table.to_excel' 函數(shù)似乎不需要這一步。+------+---------------------------+---------------+| ID   | Description               | Geo ID        |+------+---------------------------+---------------+| e007 | ABST: 198, SUR: J Douthit | 014.0198.0000 |+------+---------------------------+---------------+通過使用上面定義 dfs 變量的 index_col=0 ,我能夠刪除索引號(hào)。不確定這是最好的方法,但它確實(shí)做了我試圖為那部分完成的事情。由于我是 python 新手,我很難將我的問題格式化為 Google 或 StackOverflow 以獲得我正在尋找的答案。如果有人能指出我正在尋找的正確方向,那會(huì)奏效,但例子也會(huì)很好。
查看完整描述

1 回答

?
江戶川亂折騰

TA貢獻(xiàn)1851條經(jīng)驗(yàn) 獲得超5個(gè)贊

因此,要格式化您的問題,您可以向我們展示您想要的示例。嘗試這樣的事情:


|id|name|data1|data2|date3|-url-|

|--|----|-----|-----|-----|-----|

|1 |xyz |datax|datay|dataz|x:url|

|2 |xyz |datax|datay|dataz|x:url|

|3 |xyz |datax|datay|dataz|x:url|

...

然后您可以詢問有關(guān)如何創(chuàng)建適合您所需設(shè)計(jì)的正確 Dataframe 輸出的問題:)


您也可以在線使用此生成器:https ://www.tablesgenerator.com/text_tables


+----+------+-------+-------+-------+------+

| Id | Name | Data1 | Data2 | Data3 | Url  |

+----+------+-------+-------+-------+------+

| 1  | xyz  | datax | datay | dataz | xurl | 

+----+------+-------+-------+-------+------+

| 2  | xyz  | datax | datay | dataz | xurl |

+----+------+-------+-------+-------+------+

| 3  | xyz  | datax | datay | dataz | xurl |

+----+------+-------+-------+-------+------+

好的,現(xiàn)在您已經(jīng)完成了數(shù)據(jù)表設(shè)計(jì)。接下來我會(huì)請(qǐng)您嘗試使用 Jupyter Notebook。這將讓您逐行測(cè)試數(shù)據(jù)框。每個(gè)測(cè)試都應(yīng)該是數(shù)據(jù)集的新遷移。


我如何看待工作流將滿足您的需求: 1. 查看測(cè)試并查看您當(dāng)前的 DF 列是什么:


print(df.columns)

2. 使用此命令編輯您的列:


df.rename(columns={'old column 1':'ID',

                          'old column 2':'Description',

                          'old column 3':'Geo ID'}, 

                 inplace=True)

使用此命令更改索引數(shù)據(jù)


df.rename(index={0:'zero',1:'one'}, inplace=True)


使用此命令更改行


df.loc['--insert_Column_here--', '--insert_row_here--'] = new_value


查看完整回答
反對(duì) 回復(fù) 2022-06-28
  • 1 回答
  • 0 關(guān)注
  • 187 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)