11. 理研ワープロ操作対話音声コーパス (RIKEN-DLG)
データDOI
https://doi.org/10.32130/src.RIKEN-DLG
提供機関, プロジェクト
理化学研究所脳科学総合研究センター 言語知能システム研究チーム
コーパスの内容
a. 文書作成依頼対話
- ワープロ操作の専門家がユーザの希望を聞きながらコンピュータを用いて文書作成を行う.(ユーザ ⇔ 秘書 ⇔ オペレーター ⇔ 専門家の対話)
- 文書作成画面を録画したビデオを見ながら,専門家が自分の作業について説明する.(専門家の独話)
b. 質問応答対話
- ユーザが自ら文書を作成しながら,ワープロ操作方法について専門家に質問をする対話.(ユーザ ⇔ 専門家の対話)
Vol.1〜3 : 音声データ,書き起こしテキスト,形態素タグ付きデータベース
Vol.4 : 書き起こしテキスト,形態素タグ付きデータベース注1
話者数, 発声回数
Vol.1 : 文書作成依頼対話(9対話,9独話)1対話あたり最長2時間
Vol.2 : 質問応答対話 2002-1 (18対話)1対話あたり最長1時間
Vol.3 : 質問応答対話 2002-2(18対話)1対話あたり最長1時間
Vol.4 : 質問応答対話 2001 (15対話)1対話あたり最長2時間注1
のべ129名
音声ファイルフォーマット
RAW形式(16kHz・16bit・Stereo・LittleEndian) 注2
配布媒体
Vol.1〜3 : DVD 3枚
Vol.4 : CD 1枚
もしくは オンライン配布 (※NII-IDRのサイトに飛びます)
利用範囲
研究目的に限る
配布価格
無償
補足情報
注1. Vol.4に音声データは含まれません.
注2. Vol.1の独話の一部は「32kHz・16bit・Mono」で録音されています.
収録年度により,録音レベルにばらつきがあります.
ファイル毎のサンプリング周波数,チャンネル数,録音状態の情報一覧をVol.1に格納しています.
入手方法
CD/DVD版の郵送をご希望の場合:「入手方法」ページ の案内に従いメールでお申し込みください.
オンライン配布をご希望の場合:NII-IDRのサイト のフォームよりお申し込みください.
サンプル音声
文書作成依頼対話
- 0238 R:
- でここで画像をどうやって置けばいいのかわからなくて
- 0239 R:
- えっと
- 0240 R:
- 操作方法がわからなくていろいろと悪戦苦闘
- 0241 R:
- えしてるわけなんですけれども
- 0242 R:
- えっとその前にサンタがぼつになったんですね
更新履歴
2007/09/05 提供開始
2019/03/18 オンライン配布開始