網(wǎng)上搜的看完有點亂。什么分詞,語料,向量,seq2seq,word2dev什么的還有一堆公式??赐陼灹恕?梢詭臀抑v講嗎?這要哪幾個步驟。比如我下了一些.txt文檔,怎么把做成語料,怎么分詞之類,怎么變成向量等(幫我講下步驟)然后怎么在tensorflow上訓(xùn)練。讓它實現(xiàn)可以和人自動聊天可以幫我講講嗎,謝謝
1 回答

慕虎7371278
TA貢獻1802條經(jīng)驗 獲得超4個贊
之前思考過這個問題,把我的思路告訴你 一般來說,如果直接想要語音轉(zhuǎn)語音幾乎是很難實現(xiàn)的,現(xiàn)在的神經(jīng)網(wǎng)絡(luò)也沒有那么智能,或者說現(xiàn)在硬件的速度內(nèi)存都有一定的限制。
把問題的語音內(nèi)容轉(zhuǎn)文字;
把通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練,實現(xiàn)問題-答案,網(wǎng)絡(luò)的實現(xiàn);
再把文字轉(zhuǎn)換為語音;
我認為語音準文字,或者文字轉(zhuǎn)語音的技術(shù),可能會比較復(fù)雜,如果自己做,可能會成為這個問題的核心難點。但是這個問題的核心卻是第2步。所以建議調(diào)用第三方模塊來實現(xiàn)文字語音互相轉(zhuǎn)換;
回到第2步。做文字轉(zhuǎn)文字的訓(xùn)練,目前有很多類似電影臺詞的內(nèi)容都可以作為訓(xùn)練數(shù)據(jù)集。然后再尋找一個比較合適的神經(jīng)網(wǎng)絡(luò)即可快速完成訓(xùn)練;
以上就是我此前思考的思路。
- 1 回答
- 0 關(guān)注
- 1135 瀏覽
添加回答
舉報
0/150
提交
取消