體驗(yàn)頁(yè)面地址(僅適用于電腦端操作,建議采用 chrome 瀏覽器):https://keyan.chnling.cn/index.php/segment/
圖1:操作頁(yè)面
操作簡(jiǎn)要說(shuō)明:
1. 先在頂部“語(yǔ)言”下拉選項(xiàng)中選定要操作的語(yǔ)言類(lèi)型,目前僅支持漢語(yǔ)普通話和英語(yǔ)。默認(rèn)為漢語(yǔ)普通話,若要處理英文語(yǔ)料,請(qǐng)?jiān)谙吕斜碇羞x擇,這一步應(yīng)在打開(kāi)聲音文件之前完成。不支持中英文混合文本。
2. 然后點(diǎn)擊頂部的“打開(kāi)”按鈕,讀取電腦中的一個(gè)聲音文件,聲音數(shù)據(jù)將被上傳至服務(wù)器端進(jìn)行處理。聲音文件要求如下:單通道,16000Hz的采樣率,wav格式;聲音文件名可支持漢字,但不可含有空格、括號(hào)等特殊字符;一個(gè)聲音文件通常為一句話的內(nèi)容,所包含的內(nèi)容不能太長(zhǎng),建議少于30個(gè)漢字。
3. 接下來(lái)在“語(yǔ)句文字內(nèi)容”輸入框中錄入相應(yīng)的發(fā)音文字內(nèi)容,目前可支持中文和英文,按照普通文稿的方式錄入相應(yīng)的文字內(nèi)容即可,可包含標(biāo)點(diǎn)符號(hào),英文應(yīng)少于255個(gè)字符,中文應(yīng)少于128個(gè)漢字。
4. 在輸入發(fā)音文字內(nèi)容之后,點(diǎn)擊“分詞及標(biāo)點(diǎn)符號(hào)處理”按鈕,即可得到相應(yīng)的分詞結(jié)果(調(diào)用的是百度自然語(yǔ)言處理API)。英文文本也需點(diǎn)擊此操作。如果對(duì)分詞結(jié)果不滿意,可以手工加入或刪除空格把詞語(yǔ)分隔開(kāi)來(lái)。
5. 在整理好分詞文本之后,點(diǎn)擊“拼音轉(zhuǎn)寫(xiě)”按鈕,即可得到相應(yīng)的拼音轉(zhuǎn)寫(xiě)結(jié)果。如果對(duì)拼音結(jié)果不滿意,可以手工錄入或修改。
6. 在修改好拼音內(nèi)容之后,點(diǎn)擊“生成發(fā)音詞典”按鈕,即可得到發(fā)音文本中所包含的發(fā)音詞典內(nèi)容。發(fā)音詞典內(nèi)容通常無(wú)須修改。
7. 在得到發(fā)音詞典內(nèi)容之后,點(diǎn)擊“生成音素列表”按鈕,即可得到發(fā)音文本中所包含的音素列表。音素列表通常也無(wú)須修改。
8. 完成上述操作之后,點(diǎn)擊“上傳分詞及拼音數(shù)據(jù)”按鈕,可將當(dāng)前語(yǔ)句的相應(yīng)數(shù)據(jù)(分詞、拼音、發(fā)音詞典、音素列表)上傳至服務(wù)器端保存,后面再處理相同的語(yǔ)句時(shí)可直接調(diào)用。
9. 最后,點(diǎn)擊“提交切分”按鈕,即可得到相應(yīng)的數(shù)據(jù)結(jié)果。提交切分之前請(qǐng)?jiān)俅螜z查一下語(yǔ)言類(lèi)型是否與當(dāng)前發(fā)音內(nèi)容一致。
10.完成自動(dòng)切分與標(biāo)注之后,系統(tǒng)會(huì)顯示相應(yīng)的下載操作按鈕,如有需要,可點(diǎn)擊“下載切分結(jié)果文件”按鈕,下載相應(yīng)的 TextGrid 標(biāo)注文件,其格式和數(shù)據(jù)示例如下所示。
圖2:音段自動(dòng)切分與標(biāo)注的結(jié)果數(shù)據(jù)
注意:自動(dòng)切分與標(biāo)注的音段數(shù)據(jù),仍然需要進(jìn)一步手工檢校修改!此系統(tǒng)僅用于體驗(yàn)操作,不保證操作的流暢性和切分質(zhì)量,也不保證一直開(kāi)放。用戶上傳的聲音數(shù)據(jù)將被不定期清理,但發(fā)音文本、分詞、發(fā)音詞典等文本數(shù)據(jù)將被匿名保存,系統(tǒng)中的其他用戶可調(diào)用。
轉(zhuǎn)載自語(yǔ)音學(xué)堂
咨詢(xún)熱線
18611170056官方微信
返回頂部