首頁猿問寫入文件直到達到一定大小，然后開始新文件

寫入文件直到達到一定大小，然后開始新文件

Python

江戶川亂折騰 2023-10-05 16:53:23

我正在使用命令行工具twarc將 Twitter 數(shù)據(jù)下載為 csv。我已經(jīng)設(shè)置了 twarc 命令，它們在命令行上成功執(zhí)行，沒有問題。命令示例：twarc dosomething > outputfile.jsonl雖然我想在較長時間內(nèi)執(zhí)行收集過程，但運行一天多后輸出文件變得有點太大（10+GB）。我想運行一個執(zhí)行 twarc 命令的 bash 腳本，運行直到輸出文件達到一定限制，然后啟動一個新文件。這些問題是相關(guān)的...當文件達到一定大小時將數(shù)據(jù)添加到新文件寫入文件直到達到一定大小...盡管我的翻譯運氣不佳。任何人都可以提供一些有關(guān)設(shè)置基本 bash 腳本來執(zhí)行命令、等待文件增長到 X 大小，然后重新開始處理新文件的見解嗎？可以從那里拿走...

查看完整描述

2 回答

撒科打諢

TA貢獻1934條經(jīng)驗獲得超2個贊

您正在尋找的工具的名稱很恰當split：

twarc dosomething | split -b 10G

如果您想避免在文件之間分割行，您也可以通過行計數(shù)來執(zhí)行此操作，但您無法指定大小：

twarc dosomething | split -l 10000000

反對回復(fù) 2023-10-05

慕容森

TA貢獻1853條經(jīng)驗獲得超18個贊

另一個工具是logrotate.

它通常按計劃運行，cron并在其配置文件中指定要拆分的日志文件、如何、何時、存檔、郵件以及要保留多少歷史記錄。

這樣做的好處logrotate是您的應(yīng)用程序根本不需要實現(xiàn)任何日志輪換策略。他們只需要將日志寫入文件或stdout重定向到文件中。

反對回復(fù) 2023-10-05

2 回答
0 關(guān)注
134 瀏覽

關(guān)注

添加回答

舉報

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

寫入文件直到達到一定大小，然后開始新文件

寫入文件直到達到一定大小，然后開始新文件

2 回答

添加回答

寫入文件直到達到一定大小，然后開始新文件

寫入文件直到達到一定大小，然后開始新文件