[ENGLISH] [NTCIR ホーム] [NTCIR データ Home]
テストコレクションは,30件の文書クラスタ(毎日新聞記事データ1998,1999,読売新聞データ1998,1999),それらに対する1名による人手作成要約からなります.タスクは以下の2種です.
・生成タスク:指定された字数内で要約を生成します.
・抜粋タスク:指定された文数だけ文を抽出し,要約を生成します.
各タスクとも文字数,文数は2種設定されています.
なお,要約の外的評価のための要約中の重要事項を回答とする質問集も含みます.
※NIIからは要約データのみを配布します。文書データは日外アソシエーツから入手し,毎日新聞社,読売新聞社から研究利用許諾を得ることができます。
コレクション | タスク | 文書データ | 要約データ | |||||||
Genre | Filename | Lang | Year | # of docs | Types | Analysts | total# | |||
NTCIR-4 SUMM |
Multi doc |
新聞記事 |
Mainichi |
J |
1998-1999 |
30 セット | 2 |
1 |
60 | |
Yomiuri |
文書データは,以下の二種類のものを用います.日本語新聞記事データ入手方法参照
読売新聞日本語処理研究用記事データ1998,1999年版は,研究利用目的のための利用を前提として,日本データベース開発株式会社から研究利用許諾を得ることができます.記事は,yomi2ntcir.plを用いてNTCIR標準フォーマットに変換されたものを標準とします.
注意事項---
お申込み ---NTCIR-4 SUMMテストコレクションの申込み方法は次の通りです。NIIから配布するものはいずれも無料です。
- まず、「テストコレクション使用申込書」を、E-mailで、 idr-ntcir宛 に送付して下さい。
- NTCIR-4SUMMテストコレクションデータセットを申し込むには、併せて「利用申請書」が必要 です。
「テストコレクション利用申請書」
申請するテストコレクションすべてに対して共通です。1部で複数のテストコレクションの利用を申請することができます。
1部出力し、必要事項を記入し、署名または押印をして、以下の送付先に郵送してく ださい。
NIIで審査後,利用承認書をお送りします。
必要書類 ---
「利用申請書」送付先 ---
〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所
NTCIR事務局 (1309号室)
Phone: 03-4212-2750
FAX: 03-4212-2751