21. 東工大 多言語音声コーパス (TITML)
21-a. インドネシア語 (TITML-IDN)
データDOI
https://doi.org/10.32130/src.TITML-IDN
提供機関, プロジェクト
東京工業大学 篠田浩一 教授,古井貞熙 名誉教授
コーパスの内容
音声認識用の学習データとして収集した,音素バランス文の読み上げ音声データベース.
音素バランス文は,新聞記事や雑誌を基にしたテキストコーパスから選択した文章に,音素バランスを考慮して数十文を追加して作成した343文からなり,全話者が同一のリストを読み上げている.
話者数, 発声回数
インドネシア語ネイティブ話者 20名(男性11名・女性9名), 各話者1セット(343文)
音声ファイルフォーマット
WAV形式(16kHz・16bit・Mono)
配布媒体
DVD 1枚 もしくは オンライン配布 (※NII-IDRのサイトに飛びます)
利用範囲
研究目的に限る
配布価格
無償
入手方法
CD/DVD版の郵送をご希望の場合:「入手方法」ページ の案内に従いメールでお申し込みください.
オンライン配布をご希望の場合:NII-IDRのサイト のフォームよりお申し込みください.
サンプル音声
新聞記事等によるテキストコーパスより作成した音素バランス文
maaf saya terlambat datang ke kantor.
pemerintah menggunakan beberapa referensi diantaranya dampak ekonomi setelah serangan teroris di luxor mesir pada bulan november.
更新履歴
2011/11/28 提供開始
2019/03/18 オンライン配布開始