34. 日本語声質表現文音声ペアコーパス (Coco-Nut)
データDOI
https://doi.org/10.32130/src.Coco-Nut
提供機関, プロジェクト
東京大学 渡邊亞椰,高道慎之介先生
コーパスの内容
音声合成時の自由記述文による声質制御に向けて,7,330の日本語発話(延べ約8時間)に対し,それらの声質を自由記述によりアノテーションしたもの.
音声データは,YouTubeより24kHzのmp3ファイルとして収集したものの中から,音質等を考慮して1コンテンツあたり1~数発話(1発話は10秒以内)を抽出し,44.1kHzのwavファイルに加工している.声質表現文は複数のクラウドワーカが音声を聴取して作文しており,学習セットでは1発話あたり1件以上,検証および評価セットでは1発話あたり5件付与されている.
なお声質表現文は作成者のGitHubサイトより公開されており,NII-SRCからは音声データとその書き起こし文を提供する.
話者数
延べ7,330名
音声ファイルフォーマット
WAV形式(44.1kHz・16bit・Stereo)
配布形態
DVD(DL) 1枚 もしくは オンライン配布 (※NII-IDRのサイトに飛びます)
利用範囲
研究目的に限る
配布価格
無償
入手方法
CD/DVD版の郵送をご希望の場合:「入手方法」ページ の案内に従いメールでお申し込みください.
オンライン配布をご希望の場合:NII-IDRのサイト のフォームよりお申し込みください.
詳細情報
https://sites.google.com/site/shinnosuketakamichi/research-topics/coconut_corpus
サンプル音声
「幸せの定義とは一体なんだ?」
声質表現文:30代くらいの男性の声。ゆっくりと穏やかな話し方でした。苦悩に満ちた、けだるそうな声でした。
「で、お散歩しまーす。食べたらもう散歩しないとわたしたちはもう」
声質表現文:明るい中年の女性がはきはきとした声で楽しそうに喋っている。
「小さな、白い雲が、浮かんでいます」
声質表現文:穏やかそうな若い男性が、とてもゆっくりとした優しい声で静かに語りかけている。
更新履歴
2023/10/31 提供開始