关于非专利的信息检索,这三大常见策略你都清楚吗?

在专利分析业务中,对专利文献和非专利信息的检索是其中重要的组成环节。

专利文献对应有规范的著录格式及相应的数据库,检索相对容易。非专利信息形式多样,分布范围较广,不限于数据库,检索难度更大[1]。因此,非专利信息检索就需要采用合适的策略,以期达到事半功倍的效果。

那么非专利信息检索时有哪些常见策略呢?

检索方向设定——分解主题

由于非专利检索并没有特定的数据库,且非专利文献的内容和形式也并不统一,因此在检索非专利信息时如果直接针对主题进行检索,得到的信息可能会十分杂乱,无法快速获取所需的有价值信息。

为了解决这一问题,在面对较大的技术主题时,可以考虑对主题进行分解,以细化检索目标。分解时可依据两条检索思路展开:

#01可从技术问题、商业应用或竞争对手等角度进行拆分检索

检索方向可以根据针对技术问题、商业用途和竞争对手不同,从不同的信息来源里获取。
比如对于技术问题,可将重点放在查找专业文献情报源上,如知网、维普网、万方网;对于涉及商业用途的问题,可在专业的媒体网站上查找相应的案例信息,如36氪网站、彭博商业周刊网站;如需调查竞争对手,可结合查找竞争对手的官网、公开的商业报表(年报)、媒体报道的商业活动和展览、行业调研报告来分析判断。

#02可通过检索专业术语的名词解释、法规及案例,渐进理解检索主题

非专利信息检索的特点是目的明确,但检索的过程相对模糊,不同项目检索过程差异较大,但依然有相似的检索路径可循。
如检索的产品涉及陌生的专业术语,可在知网随问或维普公共文化服务平台网站查找专业术语的名词解释;如检索的产品可能涉及专利侵权等法律问题时,可使用法信网、无讼网,对法规和相关案例做初步快速检索或整理。
依据上述两条检索思路,可迅速明确检索方向,获得初步检索结果。在检索和阅读这些网站的过程中,还可根据已有数据和信息,结合行业特点、行业周期、发展障碍、发展趋势等因素对检索主题做进一步判断,再围绕检索主题不断调整检索思路。

二、关键词来源的选取与关键词的扩展
在检索过程中,选择合适的关键词可快速获得更有价值的信息。其具体技巧至少需要把握以下两点:

#01关键词来源的选取——根据判断标准辨识有效信息源

通常行业内使用专业术语,其组成的关键词常常难以事先预料,同时获取关键词的信息渠道往往质量参差不齐,会带来较多的噪音。这时需要有一套标准从繁杂的非专利信息源中做甄别,那么有哪些判断标准呢?
可从以下几个方面判断关键词的来源:
权威性:信息源越权威,信息中含有的关键词越准确。例如,赛迪网,它所属的中国电子信息产业发展研究院直属于国家信息产业部,有后者的背书,查找通信领域的关键词时,使用该网站检索则更加权威可靠[2]。
原创性:某网站的原创文章相对转载文章比例越高,则其覆盖的信息生产者越多,使用该网站检索,越不容易遗漏有价值的信息和关键词,同时也可对权威信息发布源起到补充作用。
时效性:更新频率是反映网站内容更新速度的量化指标。更新越快,说明时效性越强,可以找到一些比较新的技术或发展动态。
通过上述指标来筛选信息源,以获得更为准确的关键词,进而检索的信息更为有效。

#02关键词的确定——合理变换与限定
用上述信息源选择的关键词筛选,可提高命中有效信息的几率,但单一维度的关键词依然不能有效的覆盖更广泛的信息,于是关键词的合理变换与限定是避免漏检的重要前提。

  • 可根据不同地区、人群、行业变换关键词

对于相同事物,各个地区的人群有相应的称谓。如中国台湾地区的人会把摩托车称作机车,而日本人把汽车称作自動車(日语),在互联网上检索相应地区时,就需要以当地人的习惯称谓为准。
以检索国外雪茄生产工艺为例,可能初始会用雪茄相应的英文单词cigar作为关键词,但发现这样检索会带来很大的噪音,在网页上检索到的多是雪茄产品销售或评测信息。随着检索的深入,发现工业生产用到的是烟叶原料而非雪茄成品,了解到雪茄烟叶原料被归类为“dark tobacoo”,是行业内的习惯用语。因此,调整后检索词后,可以得到大量的雪茄烟叶生产信息,从而提高检索效率。

  • 根据技术效果或功能、要素作用/产地用途限定关键词

关键词扩展技巧不局限于采用行业术语、具体产品信息,还可以根据技术效果或功能、要素作用/产地用途来限定关键词。例如为了检索快递柜机械结构方面的内容,可增加整体布局或组装方式等关键词的限定,提高信息检索的准确度。

基于初步结果的追踪检索

随着检索的进行,获取的信息逐渐丰富,但信息的深度可能不足。为了获得更深入的信息,可结合现有信息,转换检索角度,开阔检索思路。具体来说,可基于结果做追踪检索,即对已找到的检索信息做深入挖掘,分析或推测出可能限制检索结果的因素,再提出解决限制检索结果的可行方案。

以检索属于电子产业的A地内窥镜企业信息为例。

根据新闻信息或调研报告,先得到A地的产业按地域分布情况:北部为电子产业区、中部为精密机械产业区、南部为钢铁机电产业区。再结合新闻报道、A地工商信息及企业官网印证的方式,发现A地的主要内窥镜企业集中在A地北部地区,这也与前述的北部为电子产业区相呼应,但中部和南部地区的内窥镜企业暂未检索到。

那么中部和南部地区的内窥镜企业真的没有吗?

根据前述的背景调查得知,A地南部地区面向东南亚市场,而面向海外市场的A地企业的官网有些可能只有英文页面,于是检索的重心转移到用英文词“Endoscopes(内窥镜)”进行检索,同时增加关键词“A地”进行地区限制。结果就发现了一家A地南部企业,进而弥补了中部和南部内窥镜企业的检索空白。
综上,非专利信息检索的常见策略:

  • 检索的初始,可按技术问题、商业应用或竞争对手三方面进行分类检索,还可以在查找相应的专业术语、法律法规过程中对检索的主题进行渐进理解。
  • 检索的过程,可借助权威性、原创性、时效性等指标来筛选信息源,以获得更为准确的关键词,根据不同地区、人群、行业变换相应关键词,或根据技术效果或功能、要素作用/产地用途来对关键词限定,减少信息的噪音。
  • 检索的分析,可对检索得到的初步结果进行追踪检索,分析或推测出可能限制检索结果的因素,再提出解决限制检索结果的可行方案,使得检索思路随着检索进行越来越开阔,丰富检索结果的深度。