第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

寫入文件直到達到一定大小,然后開始新文件

寫入文件直到達到一定大小,然后開始新文件

江戶川亂折騰 2023-10-05 16:53:23
我正在使用命令行工具twarc將 Twitter 數(shù)據(jù)下載為 csv。我已經(jīng)設(shè)置了 twarc 命令,它們在命令行上成功執(zhí)行,沒有問題。命令示例:twarc dosomething > outputfile.jsonl雖然我想在較長時間內(nèi)執(zhí)行收集過程,但運行一天多后輸出文件變得有點太大(10+GB)。我想運行一個執(zhí)行 twarc 命令的 bash 腳本,運行直到輸出文件達到一定限制,然后啟動一個新文件。這些問題是相關(guān)的...當文件達到一定大小時將數(shù)據(jù)添加到新文件寫入文件直到達到一定大小...盡管我的翻譯運氣不佳。任何人都可以提供一些有關(guān)設(shè)置基本 bash 腳本來執(zhí)行命令、等待文件增長到 X 大小,然后重新開始處理新文件的見解嗎?可以從那里拿走...
查看完整描述

2 回答

?
撒科打諢

TA貢獻1934條經(jīng)驗 獲得超2個贊

您正在尋找的工具的名稱很恰當split

twarc dosomething | split -b 10G

如果您想避免在文件之間分割行,您也可以通過行計數(shù)來執(zhí)行此操作,但您無法指定大小:

twarc dosomething | split -l 10000000


查看完整回答
反對 回復(fù) 2023-10-05
?
慕容森

TA貢獻1853條經(jīng)驗 獲得超18個贊

另一個工具是logrotate.

它通常按計劃運行,cron并在其配置文件中指定要拆分的日志文件、如何、何時、存檔、郵件以及要保留多少歷史記錄。

這樣做的好處logrotate是您的應(yīng)用程序根本不需要實現(xiàn)任何日志輪換策略。他們只需要將日志寫入文件或stdout重定向到文件中。


查看完整回答
反對 回復(fù) 2023-10-05
  • 2 回答
  • 0 關(guān)注
  • 134 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號