NTCIR Project
NTCIR-4 SUMM(テキスト自動要約テストコレクション)
データ利用手続き (研究目的用)

[ENGLISH] [NTCIR ホーム] [NTCIR データ Home]


NTCIR-4 SUMM (テキスト自動要約テストコレクション)



テストコレクションは,30件の文書クラスタ(毎日新聞記事データ1998,1999,読売新聞データ1998,1999),それらに対する1名による人手作成要約からなります.タスクは以下の2種です.

・生成タスク:指定された字数内で要約を生成します.
・抜粋タスク:指定された文数だけ文を抽出し,要約を生成します.

各タスクとも文字数,文数は2種設定されています. なお,要約の外的評価のための要約中の重要事項を回答とする質問集も含みます.

※NIIからは要約データのみを配布します。文書データは日外アソシエーツから入手し,毎日新聞社,読売新聞社から研究利用許諾を得ることができます。

コレクション タスク 文書データ 要約データ
Genre Filename Lang Year # of docs Types Analysts total# 

NTCIR-4 SUMM

Multi doc

新聞記事

Mainichi

J

1998-1999

30 セット 2

1

60
Yomiuri




 文書データ 

文書データは,以下の二種類のものを用います.日本語新聞記事データ入手方法参照

 

タスクデータ

・30件の文書クラスタには内容を簡単に表すタイトルとそこに含まれる文書IDが記述されています.
・各文書クラスタには人間が作成した要約,抜粋が異なる2種の長さで用意されています.
・外的評価のため要約に含まれる重要事項を回答とした質問集が用意されています.質問に対する回答は人間が作成した要約にタグ付けされています.



注意事項---

テストコレクションに含まれる文書データは、作成機関等から有償または無償でNTCIRで使用するために提供されたものです。いずれも、著作権があり、商品としての価値もあるものですが、情報アクセス研究におけるテストコレクションの重要性に鑑み、とくに、研究目的での使用を許諾していただきました。我々研究者は、今後も継続して文書データが研究に使用できるように、文書データ作成・提供機関からの信頼に応え、良好な関係を保つことが重要です。そのため、覚書等をよく理解し、文書データ作成・提供機関の権利を侵害しないように十分に配慮し、研究目的に限って使用してください

お申込み ---NTCIR-4 SUMMテストコレクションの申込み方法は次の通りです。NIIから配布するものはいずれも無料です。

必要書類 ---   

「利用申請書」送付先 ---

〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所
NTCIR事務局 (1309号室)

Phone: 03-4212-2750
FAX: 03-4212-2751