[ENGLISH] [NTCIR ホーム] [NTCIR データ Home]
NTCIR-9 RITE テストコレクションは、中国語簡体字(Cs)、繁体字(Ct)、日本語(J)のテキスト間の含意認識に関する実験に使用することができます。
テストコレクションは、次の4つのサブタスクからなります。
Collection | サブタスク | タスクデータ | |||
言語 | テキスト対 | 判定 (gold / gold standard data) |
|||
開発データ | テストデータ | ||||
# | |||||
NTCIR-9 RITE |
BC | Cs | 407 | 407 | 2種類 (Y/N) |
Ct | 421 | 900 | |||
J | 500 | 500 | |||
MC | Cs | 407 | 407 | 5種類 (F/R/B/C/I) | |
Ct | 421 | 900 | |||
J | 440 | 440 | |||
大学入試 * | J | 499 | 442 | 2種類 (Y/N) | |
RITE4QA | Cs | - | 964 | 2種類 (Y/N) | |
Ct | - | 682 | |||
J | - | 682 |
J: 日本語, E: 英語, C: 中国語 (Cs: 簡体字, Ct: 繁体字)
*大学入試サブタスクのデータは、現在NTCIR-9ワークショップ大学入試サブタスクのご参加者のみご利用いただけます。
データの利用許諾に関する交渉中です。ご利用が可能になりましたらご案内申し上げます。
README
Test Data (Formal Run Data) Format
<dataset type="bc">
<pair id="1">
<t1>石垣島は、冬でもハイビスカスが咲き乱れる楽園だ。</t1>
<t2>石垣島の冬の気温は高い。</t2>
</pair>
<pair id="2">
: : :
</dataset>
Dev/Test Gold Standard Data Format
<dataset type="bc">
<pair id="1" label="Y">
<t1>石垣島は、冬でもハイビスカスが咲き乱れる楽園だ。</t1>
<t2>石垣島の冬の気温は高い。</t2>
</pair>
<pair id="2" label="N">
: : :
</dataset>
お申込み --- テストコレクションの申込み方法は次の通りです。NIIから配布するものはいずれも無料です。
- まず、「テストコレクション利用申込書」を、E-mailで、 ntc-secretariat宛 に送付して下さい。
- つぎに、利用許諾に関する「覚書」を2部、かならず両面印刷で出力し、必要事項を記入し、署名および押印をして、以下の送付先 に郵送してください。
NII側の押印後、データの利用許諾を示すものとして1部を利用申込者にお送りし、1部をNIIで保管します。必要書類 ---
参考書類 ---
- 利用規程
- NTCIR-9 RITE タスク統括論文 (2012.04.24更新版)
Overview of NTCIR-9 RITE: Recognizing Inference in TExt- NTCIR-9 RITE タスクウェブサイト
http://artigas.lti.cs.cmu.edu/rite/- ツール
http://research.nii.ac.jp/ntcir/tools/tools-ja.html
「覚書」または「利用申請書」送付先 ---
〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所
NTCIR事務局 (1309号室)
Phone: 03-4212-2750
FAX: 03-4212-2751
注意事項 ---
テストコレクションに含まれる文書データは、作成機関等から有償または無償でNTCIRで 利用するために提供されたものです。いずれも、著作権があり、商品 としての価値もあるものですが、情報アクセス研究におけるテストコレクションの重要性に鑑み、とくに、研究目的での利用を許諾していただきました。我々
研究者は、今後も継続して文書データが研究に利用できるように、文書データ作成・提供機関からの信頼に応え、良好な関係を保つことが重要です。そのため、
覚書、利用申請書、利用規定等をよく理解し、文書データ作成・提供機関の権利を侵害しないように十分に配慮し、研究目的に限って利用してください。