我需要找到一種相當(dāng)有效的方法來(lái)檢測(cè)單詞中的音節(jié)。例如,看不見(jiàn)-> in-vi-sib-le有一些音節(jié)化規(guī)則可以使用:V CV VC CVC CCV CCCV CVCC*其中V是元音,C是輔音。例如,發(fā)音(5個(gè)專業(yè)名詞; CV-CVC-CV-V-CVC)我嘗試了幾種方法,其中包括使用正則表達(dá)式(僅在您要計(jì)算音節(jié)時(shí)才有用)或硬編碼規(guī)則定義(被證明是效率很低的蠻力方法),最后使用了有限狀態(tài)自動(dòng)機(jī)(沒(méi)有任何有用的結(jié)果)。我的應(yīng)用程序的目的是創(chuàng)建給定語(yǔ)言的所有音節(jié)的字典。該詞典稍后將用于拼寫(xiě)檢查應(yīng)用程序(使用貝葉斯分類器)和文本到語(yǔ)音合成。如果能在我以前的方法之外給我提示另一種解決此問(wèn)題的方法,我將不勝感激。我使用Java,但是使用C / C ++,C#,Python,Perl的任何技巧都可以為我工作。
檢測(cè)單詞中的音節(jié)
達(dá)令說(shuō)
2019-12-06 14:06:13