北虫草专利检索策略研究

时间:2020-09-23 09:07:27 研究生论文 我要投稿

北虫草专利检索策略研究

  摘要:北虫草作为长白山代表药物,随着长白山资源的开发与利用,如何提升北虫草专利研究的水平,增强专利数据源的可信度,成为北虫草专利检索的核心问题。针对中国专利检索策略的一般思路,引入词频分析与比较分析的方法,研究适用于北虫草专利研究人员的中国专利检索策略方法。

北虫草专利检索策略研究

  关键词:检索策略 专利 词频分析 北虫草

  我国是虫草资源分布最多最广的国家,国内外对已经成功诱发虫草子实体的种类研究认为, 北冬虫夏草食用和药用价值可与天然冬虫夏草媲美, 这一发现, 引起了世界各地对北冬虫夏草的需求量激增, 因此, 人工培育具有自然形态的北冬虫夏草子实体, 具有特殊意义。

  通过专利检索发现,长白山药用植物资源产业系列品种开发的专利申请数量较多,但是其他品种从专利申请上难以看出优势。应在北虫草、鹿胎、林蛙等方面加大研发攻关力度,力争开发新药物、优势药物新剂型,获取基本专利,增强核心竞争力。

  在满足专利检索目标的前提下,实现专利数据集的全面与准确,是制定专利检索策略的目的。如何保证查全率与查准率是专利检索中的关键。常用的专利检索策略大多依赖于技术专家提出的关键词或者分类号检索,因而在专利检索中必然存在专家知识的主观判断。因而,基于技术信息资源的客观分析方法更应该得到应用和推广。本文基于专利文献和学术文献中的词频分析以北虫草的专利检索为例设计一种更为客观的检索策略。

  一、关键词检索

  具体的来说有以下几方面的问题:关键词检索很难全面获取所需的专利文献。北虫草由于是近些年发现其可替代冬虫夏草,因此较早的专利文献少有记录。翻译方面存在不足、同义词太多。由于北虫草属于中药,在古书记载名称较多,而英文翻译水平有限,在检索时存在难度,少有英文文献记录。专指性不强。由于早期对北虫草的认识较少,因此至今依旧容易将北虫草与冬虫夏草混淆,难以检索明确。

  二、分类号检索

  分类号检索的原理是基于专利局的专家们根据文献主题对专利文献进行分类所产生的序列号。因此,分类号检索是专利检索的有效检索途径。存在的问题:宽泛的分类标准:国际专利的分类在不同领域有不同的分类标准。分类号滞后:国际专利分类系统每5年才发布一次分类号,对检索人员来说参考价值大为缩水。分类号过时:很多免费的数据库,甚至是收费昂贵的数据库,都没有提供旧的分类号和更改后的分类号之间的链接,只有美国国家专利和商标局提供了这类服务。本文将数据采集中确定并获取专利数据集合的方法定义为“专利检索策略”,即明确专利分析对象与研究主题,结合专利分析研究的具体需求,整理并收集相关领域的背景资料,整合包括专家意见在内的多方资源与反馈信息,制定数据采集的目标数据集与检索词并进行多次修正,最终获得专利数据集合的过程。整个专利信息获取策略的流程分为词频分析、比较分析和结果修正三个阶段。

  三、词频分析

  词频分析是一种透过词频现象看内容本质的科学方法,也是目前内容分析法中最重要也是使用最多的工具。本文通过词频分析方法获取北虫草技术领域的关键词集合以辅助专家决策,解决了单纯依靠专家咨询获得检索词时可能存在的主观性或偏差性等缺陷。例如,为了解北虫草研究的总体特征、研究之间的内在联系以及研究的发展方向等,就可以通过对期刊文献中的关键词或专利文献中的技术核心词进行词频分析来进行一定的归纳[4]。进行词频分析的目的是采用文献计量学的手段统计出相应技术领域的热点主题词,再将主题词转化成适用于专利检索的专利检索词。事实上,专利检索词与热点主题词( 即技术术语) 仍然存在差异。同时,任何一篇文献的关键词并非仅仅局限于同一个领域,而是总结并概括了该篇文献相关的全部核心技术。因此,通过词频分析获得的主题词中必定会存在一部分或偏离既定研究领域,或不适用于作为检索词汇的热点主题词。对于这些主题词,需要依靠专家判断进行清除。

  四、比较分析

  所谓的比较分析是指在专利检索策略制定过程中通过将当前检索策略与常用检索策略、既往项目检索策略进行比较,不断地获得反馈并对检索策略进行修正的过程。通过比较分析,可以发现当前专利检索策略的缺陷与不足,将多种检索策略进行优化组合,以达到更全面和准确的检索结果。其具体流程如下:假设通过词频分析所得到的关键词检索策略A 所获得的数据集合为M,而常规检索策略B 所对应的数据集合为N。首先找出这两个数据集合所共有的数据,然后将两种检索策略间的不同结果进行比较。对属于检索结果数据集合M 但不属于检索结果数据集合N的数据,即是检索策略A所得到的独有数据集,称为M1,对M1中的专利文献进行逐项分析,以判断这些数据是否是冗余数据。其次,对属于数据集合N 但而不属于数据集合M 的数据,即是检索策略B 所得到的独有数据集,称为N1,对N1中的数据进行逐项分析以判断这些数据是否是遗失数据。通过以上比较分析方法,将关键词检索策略与常用检索策略分别进行比较,并根据反馈结果对当前检索策略进行反馈与修正,最终获得修正的'检索词集。然后再请该技术领域的专家对检索词集进行补充和完善,这样使得最终的检索词集既可以兼顾客观规律又可以反应专家的智慧。

  五、结果修正

  结果修正阶段首先需要通过对数据集进行包括关联分析、统计分析与聚类分析在内的专利分析,其目的在于尝试通过数据挖掘的手段找到数据集合中的异常数据,以期达到对检索策略进行再次修正的目的。其中,统计分析的重点在于词频统计,对于不符合检索目的的检索词或IPC 要及时剔除; 关联分析与聚类分析则侧重于寻找偏离整体的散点群,并判断散点群的成因。一般而言,此类散点群或为相应领域的技术创新点,或为无关数据。对于后者,应及时修正检索策略。在完成结果修正之后,检索策略最终完成,其对应的专利检索数据集即为最终数据集合。

  六、结论

  本文以专利检索四条标准为基础,以北虫草为例综合运用词频分析、比较分析等定性、定量分析技术方法,创造性的建立了一套适用于中国专利的检索策略制定方案,提高了国内外中国专利研究中数据源的可靠性,具有较高的实用性与科学性。为长白山药用植物专利申请和检索提供了新的方法。综上所述,本套专利检索策略在参考当前国内外先进科技文献检索方案的基础上,综合运用定性分析与定量分析的方法,结合北虫草的实际检索情况,制定与推广有助于增强国内专利数据检索可信度,提升我国专利研究水平。

【北虫草专利检索策略研究】相关文章:

1.北虫草与冬虫夏草的药用价值比较

2.基于内容的图像检索研究

3.图书检索系统体系架构研究

4.基于个性化的档案检索方式研究

5.浅谈高校音乐信息检索教学研究论文

6.基于内容的模糊图像检索技术研究

7.馆藏期刊检索结果存在的问题及对策研究

8.基于颜色特征的藏毯图像检索研究与实现