首頁猿問如何基于靜音分割音頻文件并在pyt...

如何基于靜音分割音頻文件并在python中重疊最后說2秒

Python

慕無忌1623718 2021-07-14 17:14:07

目前我正在使用此代碼將音頻文件切成小塊：sound = AudioSegment.from_mp3("1.WAV")f=open("decoded.txt", "a+")chunks = split_on_silence(sound,min_silence_len=280,silence_thresh=-33,keep_silence=150)for i, chunk in enumerate(chunks): print(i) print("\n") chunk.export(folder+"/chunk{0}.wav".format(i), format="wav") AUDIO_FILE = path.join(path.dirname(path.realpath(__file__)), folder+"/chunk{0}.wav".format(i)) r = sr.Recognizer() with sr.AudioFile(AUDIO_FILE) as source: print("Listening...") audio = r.record(source) # read the entire audio file f.write((r.recognize_google(audio) +" "))f.close();這會創(chuàng)建根據(jù)靜音分割的文件塊......但我想要的是，每當(dāng)音頻被分割時(shí)，下一個切片從 2 秒開始，以便任何可能被剪切的單詞都可能出現(xiàn)。就像如果沉默是在 10,13,18,22 時(shí)間那么我的切片應(yīng)該是 0-10,8-13,11-18,16-22。我正在使用 pydub 根據(jù)沉默進(jìn)行拆分。我可以在 pydub 中更改某些內(nèi)容，還是有其他一些可以執(zhí)行此操作的軟件包？

查看完整描述

1 回答

弒天下

TA貢獻(xiàn)1818條經(jīng)驗(yàn) 獲得超8個贊

由于每個塊在靜音時(shí)被分割，因此它不會有前 2 秒的數(shù)據(jù)。
但是，您可以做的是，復(fù)制前一個塊 (n-1) 的最后 2 秒并與下一個塊 (nth) 合并，跳過第一個塊。

偽代碼如下，

n1 + n2 + n3 + ...n #audio chunks that are split on silence
n1 + (<last 2 seconds of n1> + n2) + (<last 2 seconds of n2> + n3) + ...

您還可以使用keep_silence來查看哪些值對您的要求有意義。

另一個想法是使用 pydub.silence.detect_nonsilent()來查找靜音范圍并自行決定在何處切割原始音頻。

我將把它留給你作為編碼練習(xí)。

反對回復(fù) 2021-07-27

1 回答
0 關(guān)注
467 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

如何基于靜音分割音頻文件并在python中重疊最后說2秒

如何基于靜音分割音頻文件并在python中重疊最后說2秒

1 回答

添加回答