情報検索、Q&A、テキスト自動要約技術の評価ワークショップを開催します。共通の テストコレクションを用いてこれらの研究を行うことに関心のある研究グループ はどなたでも参加できます。奮ってご参加ください。
言語横断検索タスク (CLIR) (アジアで出版された新聞記事)
特許検索タスク (patent)
質問応答タスク (qac)
毎日新聞(1998-1999):日本語 (約230,000件)*
テキスト自動要約タスク(tsc2)
毎日新聞(1998-1999):日本語 (約230,000件)*
Web検索タスク (web)
主として、jpドメインから収集したWeb文書。文書集合の規模は,参加者が扱いやすい規模(10GB程度)と,ある程度現実に
近い規模(100GB程度)を想定している.参加 者は国立情報学研究所内のオープンラボに用意した計算機資源を用いて索引付
けなどのデータ処理を行い,その結果を持ち帰って検索実験を行う形を取る.
データの使用許諾に関する覚書に記名、押印して返送してください
Below is a brief summary of the tasks envisaged for the Workshop. A participant will conduct one or more of the tasks or subtasks below. Participation in only one subtask (for example Japanese monolingual IR (J-J)) is available:
言語横断検索タスク (CLIR)
参加申込
文書と検索課題は、それぞ、4カ国語(中国語、韓国語、日本語、英語)
QACのWebサイト: http://www.nlp.cs.ritsumei.ac.jp/qac/
[タスク1] システムは,与えられた質問(100件の質問文)に対して, その回答と考えられるものひとつを優先順位をつけて5つ返す
[タスク2] システムは,与えられた質問(100件の質問文)に対して, その回答と考えられるもののリストをただひとつ返す.
[タスク3] タスク2の形式で回答するシステムに対して, 複数の連続した質問(枝問)に回答させる. 連続した質問の最初(先頭)のものは, タスク2で用いられる質問と同じ
TSCのWebサイト;http://lr-www.pi.titech.ac.jp/tsc/
[課題A: single] 要約対象となるテキストと,要約の長さが与えられ,参加者は,それを元に要約をplain textで作成し提出する.
[課題B: multi] いくつかの種類のテキスト集合を対象とし,それらのテキスト集合の要約をplain textで作成し提出する.この際,テキスト集合を用意するのに用いた情報(クエリ等)および要約の長さも合わせて,システムに与える.
[A. サーベイ検索] 従来の学術文書や新聞記事を対象としたAd Hoc型検索に相当し,固定した文書集合に対して新たな検索課題で検索を行う.精度と再現率の両方を重視した評価を実施する.従来の書式の検索課題を用いた検索(「A1. 検索課題検索」)と,所与の適合文書を利用した検索(「A2.類書検索」)の二つのサブタスクを実施する.また,評価には,ページを単位とするものの,Webページは長さが不均質であることを鑑みて根拠となるパッセージ(文書の一部分,提出は必須でない)を単位とした補助的評価についても検討する.
[B. ターゲット検索] 求めている答が見付かればよいもの(例えばファクト型の検索,あるいはサイトのトップページの検索など)で,精度が重視されるタスクである.検索結果は,根拠パッセージ(提出は必須でない)付きで,上位10件を順位付きで提出する.数種の評価尺度を検討する.
[C. 自由タスク] A,Bのサブタスクで使用する文書データに対して,自由に研究課題を登録し,研究を進める.研究成果は,NTCIR-3 成果報告会において論文/ポスターで発表を行なう.複数の参加者が得られた場合,サブタスクとして取り上げ,詳細を検討する.「C1. 分類出力タスク」,「C2. 音声入力タスク」はサブタスクとしての提案の例である.
DATE SCHEDULE NOTE 2001-06-25 タスク検討会: TSC2, QAC 終了 2001-07-23 タスク検討会: CLIR, 特許、Web検索 終了 2001-07-24
-- 2001-07-25情報処理学会FI研: NTCIR特別セッション(NTCIR WS 3 のタスクの検討) 終了 2001-08-01 正式な参加者募集案内 終了 2001-09-30 申し込み締め切り(タスク毎に多少異なる場合があります) 終了 2001-10-01 文書の配布 (新聞記事): 2001-10-15に延期されました 終了 2001-10
-- 2002-01Dry Run (タスク毎に時期が異なります)とラウンドテーブルディスカッション 終了 2001-12 オープンラボ開始:Web検索 終了 2001-12
-- 2002-03Formal Run (タスク毎に時期が異なります) 終了 2002-02
-- 2002-07ラウンドテーブルディスカッション(タスク毎に時期が異なります) 終了 2002-07-01 評価結果の配布 終了 2002-08-20 成果報告会用論文締切り Due 終了 2002-10-08
-- 2002-10-10NTCIR Workshop 3 成果報告会
1-2日目:タスク参加者のみ
3日目:公開セッション終了 2002-12-01 正式版会議録用論文の締め切り -
A.通常;検索結果を提出し、システムについて詳しく報告する。チーム名、および、チーム名と評価結果における略称(チームID)との対応付けを公表
いずれの場合でも参加者名のリストは公表します。ただし、結果はチームIDのみを報告し、チームIDと参加チーム名との対応づけを公表するか どうかは、参加の種類によってきまります。A,Bのいずれの場合でも、 (1)会議録に収録する論文、(2)システム説明フォーム、 (3)NTCIRを使用した研究に関する発表論文のコピーと書誌事項を ご提出いただ くことになります。個別の問題点について は、お気軽にご相談ください。
オンライン参加申込みは、
http://research.nii.ac.jp/ntcir/ntcir-ws3/application-ja.html
フォームの送信がうまく行かない場合は、フォームをテキストファイルとして保存、または、プリントアウトし、必要事項を記入して、下記に、電子メイル、
郵便、またはFAXで下記までお送りください。
NTCIRプロジェクト事務局
情報学資源研究センター
国立情報学研究所
〒101-8430 東京都千代田区一ツ橋2-1-2
Phone: 03-4212-2750 Fax: 03-4212-2751
email: ntc-secretariat