34. 日本語声質表現文音声ペアコーパス (Coco-Nut)

データDOI

https://doi.org/10.32130/src.Coco-Nut

提供機関, プロジェクト

東京大学 渡邊亞椰,高道慎之介先生

コーパスの内容

音声合成時の自由記述文による声質制御に向けて,7,330の日本語発話(延べ約8時間)に対し,それらの声質を自由記述によりアノテーションしたもの.

音声データは,YouTubeより24kHzのmp3ファイルとして収集したものの中から,音質等を考慮して1コンテンツあたり1~数発話(1発話は10秒以内)を抽出し,44.1kHzのwavファイルに加工している.声質表現文は複数のクラウドワーカが音声を聴取して作文しており,学習セットでは1発話あたり1件以上,検証および評価セットでは1発話あたり5件付与されている.

なお声質表現文は作成者のGitHubサイトより公開されており,NII-SRCからは音声データとその書き起こし文を提供する.

話者数

延べ7,330名

音声ファイルフォーマット

WAV形式(44.1kHz・16bit・Stereo)

配布形態

DVD(DL) 1枚 もしくは オンライン配布 (※NII-IDRのサイトに飛びます)

利用範囲

研究目的に限る

配布価格

無償

入手方法

CD/DVD版の郵送をご希望の場合:「入手方法」ページ の案内に従いメールでお申し込みください.

オンライン配布をご希望の場合:NII-IDRのサイト のフォームよりお申し込みください.

詳細情報

https://sites.google.com/site/shinnosuketakamichi/research-topics/coconut_corpus

サンプル音声

更新履歴

2023/10/31 提供開始

コーパスリストへ