我有一個很長的文本,如下所示。我需要根據(jù)一些單詞進(jìn)行拆分(“In”,“On”,“這些”)以下是示例數(shù)據(jù):另一方面,我們義憤填膺地譴責(zé)和不喜歡那些被當(dāng)下快樂的魅力所迷惑和沮喪的人,他們被欲望蒙蔽了雙眼,以至于他們無法預(yù)見必然隨之而來的痛苦和麻煩;同樣的責(zé)任屬于那些因意志薄弱而未能履行職責(zé)的人,這與通過因辛勞和痛苦而退縮而說的相同。這些案例非常簡單,易于區(qū)分。在一個空閑的小時,當(dāng)我們的選擇權(quán)不受約束,當(dāng)沒有什么能阻止我們做我們最喜歡的事情時,每一種快樂都是受到歡迎的,每一種痛苦都是要避免的。但是,在某些情況下,由于責(zé)任要求或商業(yè)義務(wù),經(jīng)常會發(fā)生必須否定快樂并接受煩惱的情況。因此,智者在這些事情上總是堅持這個選擇原則:他拒絕快樂以獲得其他更大的快樂,或者他忍受痛苦以避免更痛苦的痛苦。這個問題可以用代碼解決嗎,因為我在csv文件中有1000行。
3 回答
婷婷同學(xué)_
TA貢獻(xiàn)1844條經(jīng)驗 獲得超8個贊
根據(jù)我的評論,我認(rèn)為一個不錯的選擇是將正則表達(dá)式與模式一起使用:
re.split(r'(?<!^)\b(?=(?:On|In|These)\b)', YourStringVariable)
揚(yáng)帆大魚
TA貢獻(xiàn)1799條經(jīng)驗 獲得超9個贊
是的,這可以在蟒蛇中完成。您可以將文本加載到變量中,并將內(nèi)置的 Split 函數(shù)用于字符串。例如:
with open(filename, 'r') as file:
lines = file.read()
lines = lines.split('These')
# lines is now a list of strings split whenever 'These' string was encountered
泛舟湖上清波郎朗
TA貢獻(xiàn)1818條經(jīng)驗 獲得超3個贊
要查找不屬于較大單詞的整個單詞,我喜歡使用正則表達(dá)式:[^\w]word[^\w]
示例 python 代碼,假設(shè)文本位于名為 的變量中:text
import re
exp = re.compile(r'[^\w]in[^\w]', flags=re.IGNORECASE)
all_occurrences = list(exp.finditer(text))
添加回答
舉報
0/150
提交
取消
