NTCIR Project
NTCIR-9 RITE
(Recognizing Inference in TExt)
データ利用手続き (研究目的用)

[ENGLISH] [NTCIR ホーム] [NTCIR データ Home]


NTCIR-9 RITE (Recognizing Inference in TExt)



NTCIR-9 RITE テストコレクションは、中国語簡体字(Cs)、繁体字(Ct)、日本語(J)のテキスト間の含意認識に関する実験に使用することができます。

テストコレクションは、次の4つのサブタスクからなります。

Collection サブタスク タスクデータ
言語 テキスト対 判定
(gold / gold standard data)
開発データ テストデータ
#
NTCIR-9
RITE
BC Cs 407 407 2種類 (Y/N)
Ct 421 900
J 500 500
MC Cs 407 407 5種類 (F/R/B/C/I)
Ct 421 900
J 440 440
大学入試 * J 499 442 2種類 (Y/N)
RITE4QA Cs - 964 2種類 (Y/N)
Ct - 682
J - 682

J: 日本語, E: 英語, C: 中国語 (Cs: 簡体字, Ct: 繁体字)

*大学入試サブタスクのデータは、現在NTCIR-9ワークショップ大学入試サブタスクのご参加者のみご利用いただけます。
データの利用許諾に関する交渉中です。ご利用が可能になりましたらご案内申し上げます。

README

Format


Test Data (Formal Run Data) Format

<dataset type="bc">
  <pair id="1">
    <t1>石垣島は、冬でもハイビスカスが咲き乱れる楽園だ。</t1>
    <t2>石垣島の冬の気温は高い。</t2>
  </pair>
  <pair id="2">
  : : : 
</dataset>

Dev/Test Gold Standard Data Format

<dataset type="bc">
  <pair id="1" label="Y">
    <t1>石垣島は、冬でもハイビスカスが咲き乱れる楽園だ。</t1>
    <t2>石垣島の冬の気温は高い。</t2>
  </pair>
  <pair id="2" label="N">
  : : : 
</dataset>

 入手方法

お申込み --- テストコレクションの申込み方法は次の通りです。NIIから配布するものはいずれも無料です。

必要書類 ---   

参考書類 ---   
「覚書」または「利用申請書」送付先 ---

101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所
NTCIR事務局 (1309号室)
Phone: 03-4212-2750
FAX: 03-4212-2751


注意事項 ---

テストコレクションに含まれる文書データは、作成機関等から有償または無償でNTCIRで 利用するために提供されたものです。いずれも、著作権があり、商品 としての価値もあるものですが、情報アクセス研究におけるテストコレクションの重要性に鑑み、とくに、研究目的での利用を許諾していただきました。我々 研究者は、今後も継続して文書データが研究に利用できるように、文書データ作成・提供機関からの信頼に応え、良好な関係を保つことが重要です。そのため、 覚書、利用申請書、利用規定等をよく理解し、文書データ作成・提供機関の権利を侵害しないように十分に配慮し、研究目的に限って利用してください。