9. IPSJ SIG-SLP 雑音下音声認識評価環境 (CENSREC)
9-e. 実環境車内 日本語単語 音声認識評価環境 (CENSREC-3)
データDOI
https://doi.org/10.32130/src.CENSREC-3
提供機関, プロジェクト
(社)情報処理学会 音声言語情報処理研究会 雑音下音声認識評価ワーキンググループ
コーパスの内容
- CENSREC-2と同じ実験車両で収録した単語および音素バランス文の音声データ
- 学習データ: ATR音素バランス503文
- 走行速度はアイドリングと低速走行,車内環境は通常走行のみ
- マイク種別 : 接話マイク
※遠隔マイク(バイザーマイク)収録のデータを (公財)名古屋産業科学研究所 中部TLO より購入可
- テストデータ: 「交通情報」「東京都」「ホテル一覧」など単語 50種類
- 下記の走行速度と車内環境を組み合わせた16種類の環境で収録 — 走行速度 3種類 : アイドリング,低速(市街地)走行,高速走行
- マイク 2種類 : 接話マイク,遠隔マイク(バイザーマイク)
— 車内環境 6種類 : 通常走行,ハザードOn,エアコン(Low),エアコン(High),オーディオOn,窓開
- 学習データ: ATR音素バランス503文
- 上記音声データを対象とした音声認識実験を評価するための評価ツール
話者数, 発声回数
- 学習データ:
- 293名(男性 202名,女性 91名),各マイク 計 14,050発話
- テストデータ:
- 18名(男性 8名,女性 10名),各マイク 計 14,216発話
音声ファイルフォーマット
RAW形式(16kHz・16bit・Mono・LittleEndian)
配布媒体
DVD 1枚 もしくは オンライン配布 (※NII-IDRのサイトに飛びます)
利用範囲
研究・開発目的に限る
配布価格
無償
補足情報
学習データのうち,遠隔マイク(バイザーマイク)で収録されたデータは,名古屋大学統合音響情報研究拠点CIAIRで構築されたデータベースの一部であるため,そのデータを使用する場合には別途 (公財)名古屋産業科学研究所 中部TLO からの購入が必要です(大学関係 : 21,600円,企業 : 108,000円).
ベースライン評価を行なうためには,この有償データが必要になりますのであらかじめご了承下さい.
有償データの入手もご希望の場合は,中部TLOへ取り次ぎしますので,CENSREC-3の利用申請時にお知らせ下さい.
(2017/07/21 更新)
入手方法
CD/DVD版の郵送をご希望の場合:「入手方法」ページ の案内に従いメールでお申し込みください.
オンライン配布をご希望の場合:NII-IDRのサイト のフォームよりお申し込みください.
サンプル音声
CENSREC-2と同じ実験車両で収録した単語データ
接話マイク | 遠隔マイク | |
---|---|---|
低速走行 | ♫ | ♫ |
高速走行 | ♫ | ♫ |
アイドリング | ♫ | ♫ |
更新履歴
2006/10/31 提供開始
2017/07/21 有償分データの案内を更新
2019/03/18 オンライン配布開始