第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

使用特定模式從txt文件創(chuàng)建Pandas DataFrame

使用特定模式從txt文件創(chuàng)建Pandas DataFrame

慕斯王 2019-07-09 15:37:40
使用特定模式從txt文件創(chuàng)建Pandas DataFrame我需要基于以下結(jié)構(gòu)的文本文件創(chuàng)建一個(gè)PandasDataFrame:Alabama[edit]Auburn (Auburn University)[1]Florence (University of North Alabama)Jacksonville (Jacksonville State University)[2]Livingston (University of West Alabama)[2]Montevallo (University of Montevallo)[2]Troy (Troy University)[2]Tuscaloosa (University of Alabama, Stillman College, Shelton State)[3][4]Tuskegee (Tuskegee University)[5]Alaska[edit]Fairbanks (University of Alaska Fairbanks)[2]Arizona[edit]Flagstaff (Northern Arizona University)[6]Tempe (Arizona State University)Tucson (University of Arizona)Arkansas[edit]帶有“[編輯]”的行是國(guó)家,行[數(shù)字]是區(qū)域。我需要將以下內(nèi)容分開(kāi),然后對(duì)每個(gè)區(qū)域名稱重復(fù)國(guó)家名稱。Index          State          Region Name0              Alabama        Aurburn...1              Alabama        Florence...2              Alabama        Jacksonville......9              Alaska         Fairbanks...10             Alaska         Arizona...11             Alaska         Flagstaff...熊貓數(shù)據(jù)幀我不知道如何將基于“[編輯]”和“[數(shù)字]”或“(字符)”的文本文件拆分到相應(yīng)的列中,并對(duì)每個(gè)區(qū)域名稱重復(fù)國(guó)家名稱。請(qǐng)任何人給我一個(gè)起點(diǎn)開(kāi)始完成以下工作。
查看完整描述

3 回答

?
千萬(wàn)里不及你

TA貢獻(xiàn)1784條經(jīng)驗(yàn) 獲得超9個(gè)贊

您可以首先將文件解析為元組:

import pandas as pdfrom collections import namedtupleItem = namedtuple('Item', 'state area')items = []with open('unis.txt') as f: 
    for line in f:
        l = line.rstrip('\n') 
        if l.endswith('[edit]'):
            state = l.rstrip('[edit]')
        else:            
            i = l.index(' (')
            area = l[:i]
            items.append(Item(state, area))df = pd.DataFrame.from_records(items, columns=['State', 'Area'])print df

產(chǎn)出:

      State          Area

0   Alabama        Auburn

1   Alabama      Florence

2   Alabama  Jacksonville

3   Alabama    Livingston

4   Alabama    Montevallo

5   Alabama          Troy

6   Alabama    Tuscaloosa

7   Alabama      Tuskegee

8    Alaska     Fairbanks

9   Arizona     Flagstaff

10  Arizona         Tempe

11  Arizona        Tucson


查看完整回答
反對(duì) 回復(fù) 2019-07-09
?
汪汪一只貓

TA貢獻(xiàn)1898條經(jīng)驗(yàn) 獲得超8個(gè)贊

假設(shè)您有以下DF:


In [73]: df

Out[73]:

                                                 text

0                                       Alabama[edit]

1                       Auburn (Auburn University)[1]

2              Florence (University of North Alabama)

3     Jacksonville (Jacksonville State University)[2]

4          Livingston (University of West Alabama)[2]

5            Montevallo (University of Montevallo)[2]

6                           Troy (Troy University)[2]

7   Tuscaloosa (University of Alabama, Stillman Co...

8                   Tuskegee (Tuskegee University)[5]

9                                        Alaska[edit]

10      Fairbanks (University of Alaska Fairbanks)[2]

11                                      Arizona[edit]

12         Flagstaff (Northern Arizona University)[6]

13                   Tempe (Arizona State University)

14                     Tucson (University of Arizona)

15                                     Arkansas[edit]

你可以用Series.str.export()方法:


In [117]: df['State'] = df.loc[df.text.str.contains('[edit]', regex=False), 'text'].str.extract(r'(.*?)\[edit\]', expand=False)


In [118]: df['Region Name'] = df.loc[df.State.isnull(), 'text'].str.extract(r'(.*?)\s*[\(\[]+.*[\n]*', expand=False)


In [120]: df.State = df.State.ffill()


In [121]: df

Out[121]:

                                                 text     State   Region Name

0                                       Alabama[edit]   Alabama           NaN

1                       Auburn (Auburn University)[1]   Alabama        Auburn

2              Florence (University of North Alabama)   Alabama      Florence

3     Jacksonville (Jacksonville State University)[2]   Alabama  Jacksonville

4          Livingston (University of West Alabama)[2]   Alabama    Livingston

5            Montevallo (University of Montevallo)[2]   Alabama    Montevallo

6                           Troy (Troy University)[2]   Alabama          Troy

7   Tuscaloosa (University of Alabama, Stillman Co...   Alabama    Tuscaloosa

8                   Tuskegee (Tuskegee University)[5]   Alabama      Tuskegee

9                                        Alaska[edit]    Alaska           NaN

10      Fairbanks (University of Alaska Fairbanks)[2]    Alaska     Fairbanks

11                                      Arizona[edit]   Arizona           NaN

12         Flagstaff (Northern Arizona University)[6]   Arizona     Flagstaff

13                   Tempe (Arizona State University)   Arizona         Tempe

14                     Tucson (University of Arizona)   Arizona        Tucson

15                                     Arkansas[edit]  Arkansas           NaN


In [122]: df = df.dropna()


In [123]: df

Out[123]:

                                                 text    State   Region Name

1                       Auburn (Auburn University)[1]  Alabama        Auburn

2              Florence (University of North Alabama)  Alabama      Florence

3     Jacksonville (Jacksonville State University)[2]  Alabama  Jacksonville

4          Livingston (University of West Alabama)[2]  Alabama    Livingston

5            Montevallo (University of Montevallo)[2]  Alabama    Montevallo

6                           Troy (Troy University)[2]  Alabama          Troy

7   Tuscaloosa (University of Alabama, Stillman Co...  Alabama    Tuscaloosa

8                   Tuskegee (Tuskegee University)[5]  Alabama      Tuskegee

10      Fairbanks (University of Alaska Fairbanks)[2]   Alaska     Fairbanks

12         Flagstaff (Northern Arizona University)[6]  Arizona     Flagstaff

13                   Tempe (Arizona State University)  Arizona         Tempe

14                     Tucson (University of Arizona)  Arizona        Tucson


查看完整回答
反對(duì) 回復(fù) 2019-07-09
  • 3 回答
  • 0 關(guān)注
  • 1586 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)