21. 東工大 多言語音声コーパス (TITML)

21-a. インドネシア語 (TITML-IDN)

提供機関, プロジェクト

東京工業大学 篠田浩一 准教授,古井貞熙 特任教授

コーパスの内容

音声認識用の学習データとして収集した,音素バランス文の読み上げ音声データベース.

音素バランス文は,新聞記事や雑誌を基にしたテキストコーパスから選択した文章に,音素バランスを考慮して数十文を追加して作成した343文からなり,全話者が同一のリストを読み上げている.

話者数, 発声回数

インドネシア語ネイティブ話者 20名(男性11名・女性9名), 各話者1セット(343文)

音声ファイルフォーマット

WAV形式(16kHz・16bit・Mono)

配布媒体

DVD 1枚

利用範囲

研究目的に限る

配布価格

無償

サンプル音声

新聞記事等によるテキストコーパスより作成した音素バランス文

maaf saya terlambat datang ke kantor.

pemerintah menggunakan beberapa referensi diantaranya dampak ekonomi setelah serangan teroris di luxor mesir pada bulan november.

コーパスリストへ