21. 東工大 多言語音声コーパス (TITML)

21-a. インドネシア語 (TITML-IDN)

提供機関, プロジェクト

東京工業大学 篠田浩一 教授,古井貞熙 名誉教授

コーパスの内容

音声認識用の学習データとして収集した,音素バランス文の読み上げ音声データベース.

音素バランス文は,新聞記事や雑誌を基にしたテキストコーパスから選択した文章に,音素バランスを考慮して数十文を追加して作成した343文からなり,全話者が同一のリストを読み上げている.

話者数, 発声回数

インドネシア語ネイティブ話者 20名(男性11名・女性9名), 各話者1セット(343文)

音声ファイルフォーマット

WAV形式(16kHz・16bit・Mono)

配布媒体

DVD 1枚 もしくは オンライン配布 (※NII-IDRのサイトに飛びます)

利用範囲

研究目的に限る

配布価格

無償

入手方法

CD/DVD版の郵送をご希望の場合:「入手方法」ページ の案内に従いメールでお申し込みください.

オンライン配布をご希望の場合:NII-IDRのサイト のフォームよりお申し込みください.

サンプル音声

新聞記事等によるテキストコーパスより作成した音素バランス文

maaf saya terlambat datang ke kantor.

pemerintah menggunakan beberapa referensi diantaranya dampak ekonomi setelah serangan teroris di luxor mesir pada bulan november.

更新履歴

2011/11/28 提供開始

2019/03/18 オンライン配布開始

コーパスリストへ