30. 日本語共感的音声対話コーパス (STUDIES)

データDOI

https://doi.org/10.32130/src.STUDIES

提供機関, プロジェクト

東京大学 齋藤佑樹 先生

コーパスの内容

「対話相手に寄り添って発話可能なAIエージェント」の実現を目指し,クラウドソーシングにより収集した台本に基づき,指定された感情で対話相手に共感するように発話された模擬対話のコーパス.

  1. 講師と生徒との雑談

    AIチュータの音声合成を目的に,「個別指導塾の女性講師が,勉強の合間に生徒と雑談をしている」というシチュエーションを想定して収録した対話.

    話者は声優で,講師役は女性1名,生徒役は男女各1名.台本は10-20ターンの長めの対話150種類と4ターンで終わる短い対話720種類.音声データは合計で約8時間分あり,話者ごとに発話単位で分割されている.

    講師役の女性1名については,ITAコーパス(音素バランス文)324文を平静感情で読み上げた音声と,うち100文を4感情で読み上げた音声も含む.

  2. コールセンター対話 -NEW

    AIオペレータの音声合成を目的に,「コールセンターに勤務する女性オペレータが,顧客からの電話に対応する」というシチュエーションを想定して収録した対話.

    話者は1.の講師役と同一の女性声優1名(収録はオペレータ役の音声のみ).台本は2-12ターンの苦情対応対話820種類※1 と4ターンで終わるポジティブ傾聴対話600種類.音声データは合計で6.5時間分あり,発話単位で分割されている.

    ※1 苦情対応対話の台本は,不満調査データセット内の不満の内容を参考に作成されている.

話者数, 発声回数

男性プロ話者1名, 女性プロ話者2名,各1回発声

収録環境

スタジオ収録

音声ファイルフォーマット

WAV形式(48kHz・16bit・Mono)

配布形態

DVD 1枚 もしくは オンライン配布 (※NII-IDRのサイトに飛びます)

利用範囲

研究目的に限る

配布価格

無償

入手方法

CD/DVD版の郵送をご希望の場合:「入手方法」ページ の案内に従いメールでお申し込みください.

オンライン配布をご希望の場合:NII-IDRのサイト のフォームよりお申し込みください.

詳細情報

http://sython.org/Corpus/STUDIES/

http://sython.org/Corpus/STUDIES-2/

サンプル音声

http://sython.org/Corpus/STUDIES/

http://sython.org/Corpus/STUDIES-2/

更新履歴

2022/03/29 提供開始

2023/03/24 コールセンター対話データを追加

コーパスリストへ