久久国产乱子伦精品免费观看_亚洲欧美日韩综合在线丁香_欧 美 成 人 网站在线观看_最新欧美电影免费在线_国产精品操干在线观看_最近中文字幕在线视频1_69天堂人成无码_国产影视一区二区三区_中文亚洲精油按摩色偷偷av_99自拍偷拍视频

您當前的位置:首頁 > 新聞中心 > 行業(yè)新聞
在線體驗 | 中英文語音的音段自動切分與標注 2021年12月06日

體驗頁面地址(僅適用于電腦端操作,建議采用 chrome 瀏覽器):https://keyan.chnling.cn/index.php/segment/

圖1:操作頁面


操作簡要說明:

1. 先在頂部“語言”下拉選項中選定要操作的語言類型,目前僅支持漢語普通話和英語。默認為漢語普通話,若要處理英文語料,請在下拉列表中選擇,這一步應在打開聲音文件之前完成。不支持中英文混合文本。

2. 然后點擊頂部的“打開”按鈕,讀取電腦中的一個聲音文件,聲音數(shù)據(jù)將被上傳至服務器端進行處理。聲音文件要求如下:單通道,16000Hz的采樣率,wav格式;聲音文件名可支持漢字,但不可含有空格、括號等特殊字符;一個聲音文件通常為一句話的內(nèi)容,所包含的內(nèi)容不能太長,建議少于30個漢字。

3. 接下來在“語句文字內(nèi)容”輸入框中錄入相應的發(fā)音文字內(nèi)容,目前可支持中文和英文,按照普通文稿的方式錄入相應的文字內(nèi)容即可,可包含標點符號,英文應少于255個字符,中文應少于128個漢字。

4. 在輸入發(fā)音文字內(nèi)容之后,點擊“分詞及標點符號處理”按鈕,即可得到相應的分詞結果(調(diào)用的是百度自然語言處理API)。英文文本也需點擊此操作。如果對分詞結果不滿意,可以手工加入或刪除空格把詞語分隔開來。

5. 在整理好分詞文本之后,點擊“拼音轉寫”按鈕,即可得到相應的拼音轉寫結果。如果對拼音結果不滿意,可以手工錄入或修改。

6. 在修改好拼音內(nèi)容之后,點擊“生成發(fā)音詞典”按鈕,即可得到發(fā)音文本中所包含的發(fā)音詞典內(nèi)容。發(fā)音詞典內(nèi)容通常無須修改。

7. 在得到發(fā)音詞典內(nèi)容之后,點擊“生成音素列表”按鈕,即可得到發(fā)音文本中所包含的音素列表。音素列表通常也無須修改。

8. 完成上述操作之后,點擊“上傳分詞及拼音數(shù)據(jù)”按鈕,可將當前語句的相應數(shù)據(jù)(分詞、拼音、發(fā)音詞典、音素列表)上傳至服務器端保存,后面再處理相同的語句時可直接調(diào)用。

9. 最后,點擊“提交切分”按鈕,即可得到相應的數(shù)據(jù)結果。提交切分之前請再次檢查一下語言類型是否與當前發(fā)音內(nèi)容一致

10.完成自動切分與標注之后,系統(tǒng)會顯示相應的下載操作按鈕,如有需要,可點擊“下載切分結果文件”按鈕,下載相應的 TextGrid 標注文件,其格式和數(shù)據(jù)示例如下所示。

圖2:音段自動切分與標注的結果數(shù)據(jù)


注意:自動切分與標注的音段數(shù)據(jù),仍然需要進一步手工檢校修改!此系統(tǒng)僅用于體驗操作,不保證操作的流暢性和切分質(zhì)量,也不保證一直開放。用戶上傳的聲音數(shù)據(jù)將被不定期清理,但發(fā)音文本、分詞、發(fā)音詞典等文本數(shù)據(jù)將被匿名保存,系統(tǒng)中的其他用戶可調(diào)用。


轉載自語音學堂


分享到:

最熱資訊

熱門標簽