NTCIR Project
NTCIR-4 QAC2(質問応答テストコレクション)
データ利用手続き (研究目的用)

[ENGLISH] [NTCIR ホーム] [NTCIR データ Home]


NTCIR-4 QAC2 (質問応答テストコレクション)



コレクションは、
    ・文書データ: 毎日新聞記事データ1998‐1999、読売新聞記事データ1998‐1999
    ・質問応答データ: 質問(約650件。日本語と英語への翻訳版)、解答
    ・採点支援ツールからなります。
*NIIからは、研究目的では質問と解答からなる「質問応答データと採点ツール」を配布します。

コレクション タスク 文書データ タスク データ
ジャンル ファイル名 言語 年度 文書数 サイズ 検索課題 適合判定  
言語 #

NTCIR-4 QA

QAC2

新聞記事

ntc4-j01-mai98.txt

J

1998

12

135Mb

J

質問


2 (3)


ntc4-j01-mai99.txt

1999

11

143Mb

ntc4-j01-yomi98.txt

1998

13

183Mb

ntc4-j01-yomi99.txt

1999

24

312Mb




 文書データ 

文書データは,以下の二種類のものを用います.日本語新聞記事データ入手方法参照


検索課題

QAC-1と同じく基本的に3種類とします.基本的にはQAC-1で設定したものを基にしており,QAC-1とのタスクの違いは以下のとおりでです.

  1. subtask2については,リスト型の質問として可能なすべての回答を返す質問文をsubtask1とは別に設定します.

  2. subtask3の枝問には,複数のものを設定します.(QAC-1では1つの枝問のみを設定)

  3. 対象となるテキストが増えます.(QAC-1では毎日新聞98,99年)

  4. 質問文表現については,文末表現の省略などの省略が存在する場合があります.(QAC-1ではフルのセンテンス)

  5. 回答の表現は,知識源である新聞記事中に現れている表現そのものであるとします.(QAC-1では必ずしも現れている必要はありませんでした)

  6. 根拠情報として回答を抽出した記事IDを返すものとします.(QAC-1では根拠情報はオプション)

  7. 設定した3種類のタスクのほかに参照タスクを設定をしています.

すべての質問は,回答が存在しない場合があり,回答が唯一であるとは限りません.

質問フォーマット

質問ファイルは以下の形式を持つ行の並びとします.

回答フォーマット

回答ファイルは以下の形式を持つ行の並びとします(いわゆるcsv形式).


 詳しくはQACホームページをご覧下さい.



注意事項---

テストコレクションに含まれる文書データは、作成機関等から有償または無償でNTCIRで使用するために提供されたものです。いずれも、著作権があり、商品としての価値もあるものですが、情報アクセス研究におけるテストコレクションの重要性に鑑み、とくに、研究目的での使用を許諾していただきました。我々研究者は、今後も継続して文書データが研究に使用できるように、文書データ作成・提供機関からの信頼に応え、良好な関係を保つことが重要です。そのため、覚書等をよく理解し、文書データ作成・提供機関の権利を侵害しないように十分に配慮し、研究目的に限って使用してください

お申込み --- QAC2テストコレクションの申込み方法は次の通りです。NIIから配布するものはいずれも無料です。

参考書類 ---   

お問い合わせ先 ---

ntc-secretariat