NTCIR Project
NTCIR-9 PatentMT(特許翻訳テストコレクション)
データ利用手続き (研究目的用)

[ENGLISH] [NTCIR ホーム] [NTCIR データ Home]


NTCIR-9 PatentMT (特許機械翻訳テストコレクション)



NTCIR-9 特許機械翻訳テストコレクションは,特許情報を対象とする中国語->英語 (C to E),日本語−>英語 (J to E),英語->日本語 (E to J)の機械翻訳を評価するためのテストコレクションです.

このテストコレクションは,次のようなデータから成ります.

文書データは,日本公開特許公報全文1993-2005年と米国特許庁特許全文1993-2005年です.いずれも図表情報は含みません.

コレクション 言語ペア 文書データ タスクデータ
ジャンル ファイル名 言語 年度 文書数 サイズ 翻訳課題 参照訳 人手判定 開発データ 訓練データ
言語 件数 言語 件数 件数 言語 件数 言語 件数
NTCIR-9 PatentMT C to E 特許全文 Patent grant data published from USPTO E 1993-
2005


C

2000文

E

2000文

100文×
adequacy:
23 システム
acceptability:
13 システム×
3判定者
C-E

2000文対

CE
***
約100万文対
E

2000文

J

2000文

100文×
  adequacy:
17 システム
acceptability:
11 システム×
3判定者
E-J

2000文対

E to J 特許全文 Publication of unexamined patent applications J 1993-
2005


EJ 3,186,284
文対
J to E 特許全文 Patent grant data published from USPTO E 1993-
2005


J 2000文 E 2000文 100文×
  adequacy:
19 システム
acceptability:
14 システム×
3判定者
E-J 2000文対 EJ

*** C to Eサブタスク用の訓練データのNTCIR-9タスク参加者の継続使用: 覚書の延長申請(管理料がかかります)により可能になります。詳しくは、特許管理者 (Ms Janice Chong) [] 宛てにご連絡ください。
ワークショップタスク参加者以外の方:覚書の提出により、有料で入手することができます。使用目的その他関連するリクエストの詳細について、特許管理者 (Ms Janice Chong) [] 宛てにメールをお送りください。

ファイル名 年度 配布方法
Publication of
unexamined patent
applications
日本公開特許公報全文 1993-1997年 NTCIR-4 PATENT: DVD-ROMまたはファイル転送等の電子的手段による配布
日本公開特許公報全文 1998-2002年 NTCIR-5 PATENT: DVD-ROMまたはファイル転送等の電子的手段による配布
日本公開特許公報全文 2003-2005年 NTCIR-8 PATMT: ファイル転送等の電子的手段による配布
Patent grant
data published
from USPTO
米国特許庁特許全文 1993-2002年 NTCIR-6 PATENT: DVD-ROMまたはファイル転送等の電子的手段による配布
米国特許庁特許全文 2003-2005年 NTCIR-8 PATMT: ファイル転送等の電子的手段による配布


文書データ, 検索課題および適合判定

 文書データ 

日本公開特許公報全文 1993-2005

1993〜2005年に特許庁から発行された日本語の公開特許公報全文データです.

米国特許庁特許全文 1993-2005

1993〜2005年に米国特許庁から発行された特許全文データです.特許として成立した出願だけです.


 


詳細は,NTCIR-9 PatentMTウェブサイトNTCIR-9 PatentMT Task Definition およびタスク統括論文 をご覧ください.

入手方法

お申込み --- テストコレクションの申込み方法は次の通りです.NIIから配布するものはいずれも無料です.

必要書類 ---   

参考書類 ---   

「覚書」送付先 ---

〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所
NTCIR事務局 (1309号室)

Phone: 03-4212-2750
FAX: 03-4212-2751

注意事項 ---

テストコレクションに含まれる文書データは,作成機関等から有償または無償でNTCIRで利用するために提供されたものです.いずれも,著作権があり,商品としての価値もあるものですが,情報アクセス研究におけるテストコレクションの重要性に鑑み,とくに,研究目的での利用を許諾していただきました.我々研究者は,今後も継続して文書データが研究に利用できるように,文書データ作成・提供機関からの信頼に応え,良好な関係を保つことが重要です.そのため,覚書等をよく理解し,文書データ作成・提供機関の権利を侵害しないように十分に配慮し,研究目的に限って利用してください.