はじめに:
NTCIRは、情報検索、言語横断情報アクセス、テキスト要約、質問応答などの「情報アクセス技術」研究の評価ワークショップシリーズです。大規模な再利用可能なテストコレクション、評価の基盤、研究者のフォーラムを用意することによって、これらの研究を促進することを目的としています。「情報アクセス」は、伝統的な文書検索から、利用者による文書中の情報活用までを含みます。プロジェクトの初期から、日本語や東アジア言語のテキストを対象とした研究と、アジア諸言語と英語の間の言語横断応用に力をいれてきました。ワークショップは、およそ1年半に1回開催します。
タスクとテストコレクションの詳細は、参加者募集と各タスクのwebサイトでご案内します。
第4回NTCIRワークショップは、次の5つの研究部門を「タスク」として選択しました。詳しくは下記のリンクから、各タスクの参加者募集をご覧ください。
CLIRのテストコレクション中の文書データは、1998-1999年に出版された中国語(繁体字)、韓国語、日本語、(東アジアで刊行された)英語の新聞記事です。 英語と韓国語のデータ規模が拡大しました。韓国語は他の言語と同じ出版年のデータが利用できます。4言語ほぼ匹敵する規模の文書データを用いて評価を行います。NTCIR-3 CLIR (NTCIR-3のCLIRタスクで使用したテストコレクション)を、訓練用データとして配布します。
PATENTのテストコレクションは、特許と英文抄録10年分に拡張しました。 NTCR-3 PATENT(NTCIR-3の特許タスクで使用したテストコレクション)は、訓練用データして利用できます。
QACとTSCは、1998-1999年に出版された日本語新聞記事データを使用します。新聞の種類を増やし、同年代に出版された2紙の異なる新聞の記事データを使用すします。
WEBは、NW100G-01(NTCIR-3で使用したのと同じ文書データセット)を使用します。NTCIR-3 WEB(NTCIR-3のWeb検索タスクで使用したテストコレクション)は、訓練用データとして利用できます。
第4回NTCIRワークショップで使用するデータの詳細については、NTCIR-4データHomeをご参照ください。
タスク参加方法の説明をご参照ください。オンライン参加申込みは「タスク参加方法の説明」のページからリンクされています。
正式版プロシーディングスのフォーマット -> Please click here for the instruction
WORKING NOTES のフォーマット -> Please click here for the instruction
DATE SCHEDULE NOTE 2003-02-10 タスク参加者募集(言語横断検索と特許検索) Done 2003-02-21 タスク参加者募集(質問応答QAC) Done 2003-02-20
2003-03-03
2003-03-06参加者用覚書配布 Done 2003-03-01 タスク参加者募集(詳細版) Done 2003-03-20タスク参加申込み締め切り
Done 2003-03-24タスク参加申込み締め切り期限を4/20まで延期
*4月20日以降にタスク参加申込みをされる場合は、プログラム委員長神門 典子(kando)またはNTCIR事務局ntc-secretariatまでご連絡ください。Done 2003-03-30 文書データ配布開始 Done スケジュールは各タスクごとにことなります。概ね、評価は2003年の10月〜2004年1月の間になる予定です。 2004-02-20 評価結果を各参加者に返送 2004-03-31 成果報告会用のWorking Notes のカメラレディ原稿しめきり** 2004-06-02/04 成果報告会 (東京、国立情報学研究所) 2004-07-31 NEW! 会議論文集(正式版)用カメラレディ原稿提出 2004-10月 NEW! 会議論文集(正式版)公刊 (印刷版およびオンライン版) 2005-03-31までに タスクデータおよびテストコレクションの研究目的利用(ワークショップ参加者以外)
**: 優秀な論文は、ACM Transaction on Asian Language Informarion Processing (ACM-TALIP)の特集号に推薦されます。