我正在嘗試使用 NAudio 接收實時語音并將它們以字節(jié)數(shù)組的形式發(fā)送到 bing 語音 API。我使用事件處理程序接收音頻并發(fā)送到 Bing Speech API。下面是我試過的代碼。private void Source_DataAvailable(object sender, WaveInEventArgs e) { //convert the sound into a byte array writer.Write(e.Buffer, 0, e.BytesRecorded); memoryStream = new MemoryStream(e.Buffer); CallSpeechAPI(memoryStream); }當我嘗試執(zhí)行時,我們最終得到了以下響應(yīng)。響應(yīng):OK {"RecognitionStatus":"InitialSilenceTimeout","Offset":5000000,"Duration":0} End Rec當我嘗試將現(xiàn)有的 .wav 文件轉(zhuǎn)換為字節(jié)數(shù)組并將它們發(fā)送到工作正常的 API 時。但是對于實時音頻,我們正面臨這個問題。有人可以請幫助是什么問題以及如何解決它。另外,如果有任何選項可以將實時音頻作為字節(jié)數(shù)組接收,請告訴我?如果有任何示例代碼,請與我們分享。
2 回答

慕容森
TA貢獻1853條經(jīng)驗 獲得超18個贊
新的語音 SDK v0.4.0 中現(xiàn)在提供對音頻輸入流的支持:。您可以在此處找到示例。你只需要根據(jù)這里描述的接口實現(xiàn)你自己的 AudioInputStream::Read() 和 ::GetFormat() 。
- 2 回答
- 0 關(guān)注
- 189 瀏覽
添加回答
舉報
0/150
提交
取消