17. 特定領域研究「韻律と音声処理」日本語MULTEXT韻律コーパス (MULTEXT-J)
データDOI
https://doi.org/10.32130/src.MULTEXT-J
提供機関, プロジェクト
平成12−16年度 文部科学省 科研費 特定領域研究「韻律に着目した音声言語情報処理の高度化」
領域代表者 : 広瀬啓吉(東京大学),コーパス班代表 : 北澤茂良(静岡大学)
コーパスの内容
ヨーロッパで作成されたMultilingual Text Tools and Corpora(MULTEXT)の日本語版.
- 1つが5~6文で構成される40の原稿を,次の2つの発声スタイルにて収録.
- 朗読音声
- 原稿の設定状況に従い,感情を込めたように演技した音声(模擬自発発話)
話者数, 発声回数
6名(男女各3名), 2つの発声スタイルで各1回発声
収録環境
無響室
音声ファイルフォーマット
WAV形式(16kHz・16bit・Mono)
配布媒体
DVD 1枚 もしくは オンライン配布 (※NII-IDRのサイトに飛びます)
利用範囲
研究目的に限る
配布価格
無償
付随情報
- 音素ラベル
- 韻律句ラベル
- アクセント型,アクセント核ラベル
- J-ToBI韻律ラベル
- 基本周波数データ
- スプライン曲線近似した基本周波数データ
- EGGデータ
- EGG分析済みデータ
入手方法
CD/DVD版の郵送をご希望の場合:「入手方法」ページ の案内に従いメールでお申し込みください.
オンライン配布をご希望の場合:NII-IDRのサイト のフォームよりお申し込みください.
サンプル音声
MULTEXTヨーロッパ言語版より翻訳した読み上げテキスト
「今ロンドンに着いたところですが、私の荷物はローマに行ってしまいました。私は糖尿病なので、明日にはどうしてもその荷物が必要です。早速に、荷物の所在を調べてもらえるよう、責任者の方に頼んで下さい。その間、当座の薬が必要です。どこか病院に連絡を取ってもらえませんか。」
更新履歴
2010/07/01 提供開始
2019/03/18 オンライン配布開始