专利统计数据库PATSTAT

发布时间 2023-08-16 10:31:59作者: myrj

欧洲专利局(EPO)全球专利统计数据库PATSTAT是当前世界收录最全的专利数据库,专门面向专利分析人员、统计决策人员和高级研究人员。欧洲专利局发布的PATSTAT使用指南主要是对PATSTAT数据库使用进行全面性指导,帮助用户分析专利数据,为解决各种问题提供思路,并针对PATSTAT使用过程中的关键问题进行了探讨。

1. PATSTAT数据库信息来源

PATSTAT数据库包括了原始专利数据(主要来自专利文献著录项目数据库DOCDB)、法律状态数据、在线扩展数据以及欧洲专利注册数据。涉及的专利信息包括专利申请、公开、申请人、发明人、引文、专利家族、技术分类和优先权信息等数据。

PATSTAT的优势:第一,基于专利原始数据,PATSTAT可以根据研究院人员的需求进行国家、产业、企业层面的分析;第二,提供真实而非采样数据作为数据分析集合;第三,与其他专利数据库兼容,包括EEE-PPAT、OECD申请人名数据库(HAN) 、APE-INV、EPO全球专利法律状态数据库、OECD REGPAT数据库、OECD 三方专利家族数据库、NACE-IPC索引等。

PATSTAT的局限:第一,由专利审查员进行原始数据收集,例如优先权和引用数据质量高于其他著录信息,但是发明人地址信息覆盖率较低。第二,数据以欧洲为中心,由于各个专利局与EPO数据交换的约定随时变化,某些国家在申请、引用、申请人/发明人的数据存在缺失。

2. PATSTAT使用过程中的关键问题

(1)申请人和发明人字段

申请人和发明人字段存在著录不全和专利权人名称不统一的情况,避免的方法是尽可能全面地检索申请人和发明人,并更正名字的错误。其次,还可以使用PATSTAT独有ID标识,同一个专利权人,EPO会分配一个标识符DOC_STD_NAME_ID。此外,还可以使用一些包括EEE-PPAT、OECD HAN和APE-INV在内的公开免费数据库。

(2)专利家族

在实践中往往需要计算专利家族数量,主要由专利家族的不同类型决定。根据WIPO《工业产权信息与文献手册》中的有关定义,专利族可以分为简单专利族、复杂专利族、扩展专利族、国内专利族和仿专利族。PATSTAT数据库提供了两个专利家族表:一个是基于DOCDB数据库的tls218_docdb_fam表,主要针对简单专利家族的集合,包括了美国专利局的连续申请和分案申请;另一个则是基于INPADOC数据库的tls219_inpadoc_fam表,主要针对扩展专利家族。巴黎公约规定的优先权则在TLS204_appln_prior表中。以法国专利局专利家族每年引用平均数量为例,展示了相应的SQL语句:

Select

t01.APPLN_AUTH,Year(t01.APPLN_FILING_DATE) as year,

Count(Distinctt18.DOCDB_FAMILY_ID)/Count(Distinct t01.APPLN_ID) as avg

From

tls218_docdb_fam t18Inner Join

tls211_pat_publn t11aOn t18.APPLN_ID=t11a.APPLN_ID Inner Join

tls212_citation t12 Ont11a.PAT_PUBLN_ID=t12.PAT_PUBLN_ID Inner Join

tls211_pat_publn t11bOn t12.CITED_PAT_PUBLN_ID=t11b.PAT_PUBLN_ID

Inner Join tls201_applnt01 On t11b.APPLN_ID=t01.APPLN_ID

Where

t01.APPLN_AUTH='FR'

Group By

t01.APPLN_AUTH,Year(t01.APPLN_FILING_DATE)

(3)专利技术分类

PATSTAT数据库中发明专利是以IPC作为技术分类,由于IPC检索可能无法指向同一领域,或检出结果与目标技术不同,此时可以通过IPC_POSITION来检索能够较好的描述发明专利信息的IPC主分类号,有助于专利审查人员和使用者检索到感兴趣的主要技术。其次,当检索特定行业的专利时,由于技术的复杂性和技术融合的产生,技术分类往往与行业分类并不一致。此时,可以利用关键词索引,例如由美国专利商标局提供的关键词索引,它包含了与标准行业分类相匹配的美国专利分类USPC技术分类的信息。此外,还存在IPC分配错误的情况。

1、专利文献大量重复出版的结果,形成了一组组有不同国家出版的内容相同或基本相同的专利文献。各组专利文献中的每件专利说明书之间,通过一种特殊的媒介---优先权,相互联系在―起
2、所谓优先权,根据《保护工业产权巴黎公约》的规定,是巴黎联盟各成员国给予本联盟任意国家的专利申请人的一种优惠权,联盟内某国的专利申请人已在某成员国第一次正式就―项发明创造申请专利时,申请人有权享有第一次申请的申请日期。

3、人们把这种具有共同优先权的在不同国家或国际专利组织多次申请、多次公布或批准的内容相同或基本相同的一组专利文献称作同族专利。
以下为一组同族专利:
EDES等E-sAC1LAI EOSY1EHaE US4SA2mLA[中清团1D泰5年主先3峰》江元视BLESaHpOsLI西H1oaEIS0
rAS2eiOB4版pn。LoEPE知1国s
医通中团E,.uS
E守动DPetnnSsa5一

4、同族专利检索:
①在欧洲专利数据库系统中,在号码检索页面的字段中输入号码,将下方的including family选中,检索结果将显示同族专利文献列表。
②说明:只能在世界专利数据库中查找

5.不同国家或不同人申请同一专利,申请最早的有优先权
先根据appln_nr appln_filing_date排序
bys appln_nr:gen bz=_n
keep if bz==1
保留优先权的专利