NTCIR Project
NTCIR-5 QAC(質問応答テストコレクション)
データ利用手続き (研究目的用)

[ENGLISH] [NTCIR ホーム] [NTCIR データ Home]


NTCIR-5 QAC (質問応答テストコレクション)



コレクションは、
    ・文書データ: 毎日新聞記事データ2000‐2001、読売新聞記事データ2000‐2001
    ・質問応答データ: 質問(50シリーズ、360件。日本語)、解答
    ・採点支援ツールからなります。
*NIIからは、研究目的では質問と解答からなる「質問応答データと採点ツール」を配布します。

コレクション タスク 文書データ タスク データ
ジャンル ファイル名 言語 年度 文書数 サイズ 検索課題 適合判定  
言語 #

NTCIR-5 QA

QAC3

新聞記事

ntc5-j01-mai00.txt

J

2000

12

135Mb

J

質問


2 (3)


ntc5-j01-mai01.txt

2001

11

143Mb

ntc5-j01-yomi00.txt

2000

13

183Mb

ntc5-j01-yomi01.txt

2001

24

312Mb




 文書データ 

文書データは,以下の二種類のものを用います.日本語新聞記事データ入手方法参照


課題
  1. NTCIR-4のQACのSubtask3 に相当する課題(情報アクセスのための対話(Information Access Dialog(IAD)タスク)であり,レポート執筆に必要な情報を対話的に収集することを想定した一連の質問について解答することを求めます.

  2. それぞれの質問に対して正解と判断されたものを過不足なく列挙することを求めます.

  3. 一連の質問(質問シリーズ)において,シリーズの先頭の質問には明示的に示され,その後の質問では,それ以前の質問の一部もしくはその解答への参照が含まれています.

  4. 質問の列は対話的に与えられるものと仮定されていますので, ある質問に回答している時に,それより先の質問を参照することは許されません.

  5. 解答は,対象テキストに含まれた何らかの名称もしくは値の表現です. 人名,組織名などの固有表現,金額や度量衡などの数値表現,作品名,日付,種や カテゴリの名称が含まれます.更に,複合名詞による事象の表現,慣用的な構成による概数表現や 範囲表現を含みます.


質問フォーマット

質問ファイルは以下の形式を持つ行の並びとします.

回答フォーマット

回答ファイルは以下の形式を持つ行の並びとします(いわゆるcsv形式).


 詳しくはQACホームページ、または NTCIR-5 QAC Task Overviewをご覧下さい.

入手方法

お申込み --- NTCIR-5 QACテストコレクションの申込み方法は次の通りです。NIIから配布するものはいずれも無料です。

参考書類 

お問い合わせ先 ---

idr-ntcir

注意事項---

テストコレクションに含まれる文書データは、作成機関等から有償または無償でNTCIRで使用するために提供されたものです。いずれも、著作権があり、商品としての価値もあるものですが、情報アクセス研究におけるテストコレクションの重要性に鑑み、とくに、研究目的での使用を許諾していただきました。我々研究者は、今後も継続して文書データが研究に使用できるように、文書データ作成・提供機関からの信頼に応え、良好な関係を保つことが重要です。そのため、覚書等をよく理解し、文書データ作成・提供機関の権利を侵害しないように十分に配慮し、研究目的に限って使用してください