我想運行一個包(RAKE)從評論中提取關(guān)鍵短語(df['CUSTOMER_RECOMMENDATIONS_TRANS])并創(chuàng)建一個新列(df['keyphrase_RAKE'])來存儲它們對應于每個評論。我收到一條錯誤消息,提示“ValueError:值的長度與索引的長度不匹配”。我知道錯誤背后的原因,但不知道如何解決。可以做什么?關(guān)鍵字返回關(guān)鍵短語列表。這是代碼:import RAKEimport operator# Reka setup with stopword directorystop_dir = "SmartStoplist.txt"rake_object = RAKE.Rake(stop_dir)# Sample text to test RAKEdf = pd.read_excel('my.xlsx')for i in df['CUSTOMER_RECOMMENDATIONS_TRANS']: keywords = rake_object.run(i) df['keyphrase_RAKE'] = keywords
1 回答
慕虎7371278
TA貢獻1802條經(jīng)驗 獲得超4個贊
您可以使用pandas.DataFrame.apply并避免 for 循環(huán)
df['keyphrase_RAKE'] = df['CUSTOMER_RECOMMENDATIONS_TRANS'].apply(rake_object.run)
添加回答
舉報
0/150
提交
取消
