[ENGLISH] [NTCIR ホーム] [NTCIR データ Home]
特許情報処理に関する3種類の技術(サブタスク)を評価するためのテストコレクションです.3種類のサブタスクとは,「日本語検索」,「英語検索」,「分類」です.日本語検索サブタスクと英語検索サブタスクでは,ある特許公報中の請求項を検索課題として,その請求項で主張されている権利を無効化できる別の特許公報を検索します.ただし,日本語検索と英語検索では,課題と文書の言語が異なります.分類サブタスクでは,Fターム(File Forming Term)に基づいて特許公報を分類します.文書データは,日本国公開特許公報全文1993-2002年,日本国公開特許英文抄録データPAJ 1993-2002年,米国特許庁特許全文1993-2002年です.いずれも図表情報は含みません.
コレクション | タスク | 文書データ | タスクデータ | |||||||
ジャンル | ファイル名 | 言語 | 年度 | 文書数 | サイズ | 検索課題 | 適合判定 | |||
言語 | 件数 | |||||||||
NTCIR-6 PATENT | IR | 特許全文 | Publication of unexamined patent applications | J | 1993-2002 | 3,496,252 | 94.5GB | J | 日本語検索 2,908 分類 21,606 |
4 |
特許抄録 | Patent Abstracts of Japan (paj) | E | 1993-2002 | 3,496,252 | 5,482MB | E | 1 | |||
特許全文 | Patent grant data published from USPTO | E | 1993-2002 | 1,315,470 | 52.6 GB | E | 英語検索 3,221 | 3 |
*全データをNIIから提供します.
Publication of unexamined patent applications |
NTCIR-4 PATENT および NTCIR-5 PATENT DVD-ROM, またはファイル転送等の電子的手段による配布 |
Patent Abstracts of Japan (paj) |
NTCIR-4/5 PATENT DVD-ROM, またはファイル転送等の電子的手段による配布 |
Patent grant data published from USPTO |
NTCIR-6 PATENT DVD-ROM, またはファイル転送等の電子的手段による配布 |
日本公開特許公報全文 1993-2002
1993〜2002年に特許庁から発行された日本語の公開特許公報全文データです.
日本語公開特許英文抄録データPAJ 1993-2002
JAPIO抄録(特許公報中の出願人抄録をもとに専門家が作成した抄録)を英訳した抄録です.
米国特許庁特許全文 1993-2002
1993〜2002年に米国特許庁から発行された特許全文データです.特許として成立した出願だけです.
(1)日本語検索サブタスク
・検索課題
日本公開特許公報全文から抜粋された請求項で,合計2908課題あります.一つの課題は一つの請求項からなります.NTCIR-4とNTCIR-5の検索課題と共通の課題がそれぞれ34件と1189件あります.
・適合判定
(H)引例(課題の特許公報を拒絶するために特許庁審査官が使用した特許公報)のうち,課題の特許とIPCサブクラスに重複がない,(A)引例のうち,課題の特許とIPCサブクラスに一部重複がある,(B)引例のうち,課題の特許とIPCサブクラスが完全に一致する,(C)不適合,の4段階です.課題の請求項が出願される前に公開されていた特許公報だけが適合文書となります.
(2)英語検索サブタスク
・検索課題
米国特許庁特許全文から抜粋された請求項で,合計3221課題あります.一つの課題は一つの請求項からなります.
・適合判定
(A)課題特許で引用されている特許のうち,課題の特許と異なるIPCサブクラスが付与されている,(B)課題特許で引用されている特許のうち,課題の特許と同じIPCサブクラスが付与されている,(C)不適合,の3段階です.
(3)分類サブタスク
・検索課題
1998〜1999年に公開された日本公開特許公報から抽出した特許公報(もしくは対応する英文抄録)が課題です.一つの特許公報(もしくは抄録)が一つの課題で,21606件あります.1993〜1997年に公開された日本公開特許公報はシステムを訓練するための訓練データです.
・適合判定
正解の分類は,課題の特許公報に対して特許庁から提供されている分類カテゴリです.
お申込み --- テストコレクションの申込み方法は次の通りです.NIIから配布するものはいずれも無料です.
- まず,「テストコレクション利用申込書」を,E-mailで, idr-ntcir宛 に送付して下さい.
- その後、利用許諾に関する「覚書」をメールで送付しますので、 テストコレクションごとに各2部,かならず両面印刷で出力し,必要事項を記入し,署名および押印をして,以下の送付先に郵送してください.
NII側の押印後,テストコレクションの使用許諾を示すものとして1部を使用申込み者にお送りし,1部をNIIで保管します.
必要書類 ---
参考書類 ---
「覚書」送付先 ---
〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所
NTCIR事務局 (1309号室)
Phone: 03-4212-2750
FAX: 03-4212-2751
注意事項---