NTCIR Project
NTCIR-6 PATENT(特許検索テストコレクション)
データ利用手続き (研究目的用)

[ENGLISH] [NTCIR ホーム] [NTCIR データ Home]


NTCIR-6 PATENT (特許検索テストコレクション)


特許情報処理に関する3種類の技術(サブタスク)を評価するためのテストコレクションです.3種類のサブタスクとは,「日本語検索」,「英語検索」,「分類」です.日本語検索サブタスクと英語検索サブタスクでは,ある特許公報中の請求項を検索課題として,その請求項で主張されている権利を無効化できる別の特許公報を検索します.ただし,日本語検索と英語検索では,課題と文書の言語が異なります.分類サブタスクでは,Fターム(File Forming Term)に基づいて特許公報を分類します.文書データは,日本国公開特許公報全文1993-2002年,日本国公開特許英文抄録データPAJ 1993-2002年,米国特許庁特許全文1993-2002年です.いずれも図表情報は含みません.

コレクション タスク 文書データ タスクデータ
ジャンル ファイル名 言語 年度 文書数 サイズ 検索課題 適合判定  
言語 件数
NTCIR-6 PATENT IR 特許全文 Publication of unexamined patent applications J 1993-2002 3,496,252 94.5GB J

日本語検索 2,908

分類 21,606


4
特許抄録 Patent Abstracts of Japan (paj) E 1993-2002 3,496,252 5,482MB E 1
特許全文 Patent grant data published from USPTO E 1993-2002 1,315,470 52.6 GB E 英語検索 3,221 3

*全データをNIIから提供します.

Publication of
unexamined patent
applications
NTCIR-4 PATENT および NTCIR-5 PATENT DVD-ROM, またはファイル転送等の電子的手段による配布
Patent Abstracts
of Japan (paj)
NTCIR-4/5 PATENT DVD-ROM, またはファイル転送等の電子的手段による配布
Patent grant
data published
from USPTO
NTCIR-6 PATENT DVD-ROM, またはファイル転送等の電子的手段による配布


文書データ, 検索課題および適合判定

 文書データ 

日本公開特許公報全文 1993-2002

19932002年に特許庁から発行された日本語の公開特許公報全文データです.

日本語公開特許英文抄録データPAJ 1993-2002

JAPIO抄録(特許公報中の出願人抄録をもとに専門家が作成した抄録)を英訳した抄録です.

米国特許庁特許全文 1993-2002

19932002年に米国特許庁から発行された特許全文データです.特許として成立した出願だけです.


 

(1)日本語検索サブタスク

・検索課題

  日本公開特許公報全文から抜粋された請求項で,合計2908課題あります.一つの課題は一つの請求項からなります.NTCIR-4NTCIR-5の検索課題と共通の課題がそれぞれ34件と1189件あります.

・適合判定

  (H)引例(課題の特許公報を拒絶するために特許庁審査官が使用した特許公報)のうち,課題の特許とIPCサブクラスに重複がない,(A)引例のうち,課題の特許とIPCサブクラスに一部重複がある,(B)引例のうち,課題の特許とIPCサブクラスが完全に一致する,(C)不適合,の4段階です.課題の請求項が出願される前に公開されていた特許公報だけが適合文書となります.

(2)英語検索サブタスク

・検索課題

  米国特許庁特許全文から抜粋された請求項で,合計3221課題あります.一つの課題は一つの請求項からなります.

・適合判定

  (A)課題特許で引用されている特許のうち,課題の特許と異なるIPCサブクラスが付与されている,(B)課題特許で引用されている特許のうち,課題の特許と同じIPCサブクラスが付与されている,(C)不適合,の3段階です.

(3)分類サブタスク

・検索課題

 19981999年に公開された日本公開特許公報から抽出した特許公報(もしくは対応する英文抄録)が課題です.一つの特許公報(もしくは抄録)が一つの課題で,21606件あります.19931997年に公開された日本公開特許公報はシステムを訓練するための訓練データです.

・適合判定

  正解の分類は,課題の特許公報に対して特許庁から提供されている分類カテゴリです.


入手方法

お申込み --- テストコレクションの申込み方法は次の通りです.NIIから配布するものはいずれも無料です.

必要書類 ---   

参考書類 ---   

「覚書」送付先 ---

〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所
NTCIR事務局 (1309号室)

Phone: 03-4212-2750
FAX: 03-4212-2751

注意事項---

テストコレクションに含まれる文書データは,作成機関等から有償または無償でNTCIRで使用するために提供されたものです.いずれも,著作権があり,商品としての価値もあるものですが,情報アクセス研究におけるテストコレクションの重要性に鑑み,とくに,研究目的での使用を許諾していただきました.我々研究者は,今後も継続して文書データが研究に使用できるように,文書データ作成・提供機関からの信頼に応え,良好な関係を保つことが重要です.そのため,覚書等をよく理解し,文書データ作成・提供機関の権利を侵害しないように十分に配慮し,研究目的に限って使用してください.