→ 电子商务  ·电子商务信息动态  ·电子商务理论研究  ·电子商务解决方案  ·电子商务成功案例
→ 电子政务  ·电子政务信息动态  ·电子政务理论研究  ·电子政务解决方案  ·电子政务成功案例
经营管理 ·经济观察 ·管理学堂 ·文化理论 ·企业研究 ·人力资源 ·私营企业 ·市场营销 ·创业园地 ·信息化建设
商业中国 商业信息 经管论坛 博雅艺术 博雅论坛
 
 
·为什么五粮液是您一生
·品牌文化,让消费者忠
·大话《西游》:企业文
·微软:这样软化企业形象
·国企激励:政策下的平
·企业文化左右联想
·诺基亚文化,从创新合
·武术与企业文化的联系
·让企业文化真正“落地
·红星家具集团有限公司
   
   
 
 搜索引擎
 
 艺术品收藏
 
 
 
 
电子商务互联网研究经营管理电子政务
  您目前的位置是:首页>>经营管理>>文化理论>>新闻内容
战略决策 辅之有道 谈企业竞争情报系统
企信经管 News.bizing.cn 阅读次数:
2004-4-23 18:47:54 来源:中国计算机用户 作者:谢立宏



  目前市场上出现的竞争情报系统虽然各具特色,不过在功能结构上基本可归纳为三个模块:情报收集、情报分析和情报服务。文中“情报”泛指所有加工前后对用户有利用价值的信息。

  全球商业竞争的日益加剧,促使有理论、有实践、有组织并且有职业化特征的竞争情报活动不断发展。

  同时,计算机应用和网络的飞速发展,使得竞争情报活动涉及的数据规模急剧加大。具体表现在信息量大、信息来源以及数据格式异构多源;辅助决策需求的强化加大了情报分析方法的难度。

  最终,必须对市场变化做快速反应的企业,不得不考虑把竞争情报的方法和步骤设计成计算机系统软件。把竞争情报的理念和功能溶入其中,以尽可能地提高企业的核心竞争力。这就促进了竞争情报系统(Competitive Intelligence System,简称CIS)的出现和快速发展。

  本文就CIS的实现技术做简要阐述。

  情报采集

  情报采集模块是CIS的重要输入系统,是竞争情报工作的基础。其工作质量和速度很大程度决定着CIS的效能和效益。

  当今多源异构的情报信息特征对情报采集模块是一大挑战。因此,CIS的采集模块必须具备全面的数据采集能力。针对不同的信息源设计相应的采集器,每个采集器都可以根据用户信息源的差异与用户的需求来设定。

  采集器被设置好以后将会自动地运行,并在运行时不断地观察信息源的变化和更新,把新的或更新过的信息传送给情报分析模块,并具备一定的信息排重功能。

  针对以下主流数据源,CIS应该具备相应的采集器:

  互联网采集器 按用户指定地址采集因特网上信息,主要由Spider/Robot程序实现。

  文件系统采集器 把各种文件格式的文件(包括Office文档、pdf、html、txt、xml、Flash、视音频等)自动读取到系统中。对不同格式文件的访问需要相应的应用程序接口。

  Lotus Notes采集器 采集存储于Notes文档库中的资料,例如OA系统信息。这可以通过OA系统输出获得,也可以直接访问Notes数据库,并集成其中的用户访问权限。

  关系数据库采集器 通过ODBC协议,采集存储于关系数据库(例如Oracle、IBM DB2、Microsoft SQL Server等)中的信息。

  此外,采集系统还应能够识别出信息源中真正有效的内容,这一点对采集目前“绚丽多彩”的互联网信息显得尤为重要,从而为情报分析模块作好准备。

  情报分析

  情报分析模块是企业CIS的核心,对于传统结构化数据,尤其是关系型数据的分析处理已有成熟的分析方法,而目前大多数情报信息来源于非结构化数据当中,因此提取其特征和进行基于自然语言的理解是分析的根本。

  目前常用的基于自然语言理解的技术主要有:

  文本分类 文本分类方法主要有基于统计的方法和基于人工智能的方法。

  基于统计方法的文本分类处理过程可以描述为:首先要对分类的文档建立其特征表示,一般是采用文档特征向量的方法。由于文档特征向量具有惊人的维数,因此必须进行特征抽取,以缩减特征向量的维数。得到文档的特征子集后,便可生成分类器进行分类。最后需要对分类器进行评估。其中的关键在于文本的向量化表示、特征提取、分类器构造和评估算法。这种方法基于经典的概率理论,目前得到了比较广泛的运用。

  基于人工智能的方法主要有人工神经网络、支持向量机等,这些方法是从基本数据挖掘的分类算法中演化而来,目前正逐步得到认可。

  相关文章分析 相关文章分析技术是文本挖掘的重要功能,是实现相关反馈的基础,也可用于去重分析。

  通常相关文章链接技术的原理如下:首先对文档建立索引,可以是全文索引,或者是部分词(被确认为表达文章主要概念的词)的索引。这些词主要是名词、动词、形容词等实词(连词、助词等通常不包含具体意义的虚词被过滤掉)。

  在进行相关文章链接处理时,首先对输入的文档进行分析,找到有意义的索引词,然后逐个词到索引库中查找与之相关的文档,并记录查询结果。然后根据每篇文档中包含索引词的多少、词频、文档的长度等信息来计算相似度。最后还可以根据相似度的大小进行排序,这样就找到了最相似的文档。

  自动摘要 自动摘要有助于用户快速把握情报信息的核心内容。它是利用计算机自动地从原始文献中提取文摘。

  自动文摘包括自动摘录、基于理解的自动文摘、信息抽取和基于结构的自动文摘四种主要的文摘方法。其中比较实用化的是自动摘录(Automatic Extraction)技术。

  自动摘录将文本视为句子的线性序列,将句子视为词的线性序列。它通常分4步进行:a.计算词的权值;b.计算句子的权值;c.对原文中的所有句子按权值高低降序排列,权值最高的若干句子被确定为文摘句;d.将所有文摘句按照它们在原文中的出现顺序输出。

  目前的自动摘要技术还处于一个初级阶段,实用化的自动摘要技术必将给承担大量信息处理CIS起到极大的性能提升作用。

  情报服务

  情报服务模块是CIS的输出系统,它的主要功能是根据不同层次用户的情报需求,动态地提供情报产品和情报服务。在这里,信息发布技术构成了主要支撑。

  通过互联网络进行信息发布是主要手段,基于B/S结构的企业信息门户(EIP)技术的CIS已成为当今主流,进行网络发布采用的主要技术体现在:

  内容的组织与表现 通常信息发布采用频道及模板技术,这样可以使得内容的展现分类有序而风格统一,便于用户浏览。

  用户管理和权限控制 为不同级别的用户设定相应的角色和访问权限,并提供单点登录功能,有效整合用户已有的应用系统。

  访问统计和评估反馈 基于系统日志功能,统计单条信息的浏览次数。并提供交互手段,支持用户的评论等反馈交流。

  术语解释

  竞争情报(Competitive Intelligence,简称CI)这一术语出现于20世纪80年代初,主要是指竞争主体为保持竞争优势所需要的一切有关竞争对手和竞争环境的情报,及其相关的情报活动。

  相关知识点

  多源异构 是指从数据集成的角度,描述数据的物理存储位置和其结构特性表现形式的多样化。

  结构化数据 泛指存储于关系数据库管理系统中的诸如财务账目、客户信息、业务操作数据等具有明显结构化特性的数据。

  非结构化数据 泛指扫描文档图像、传真、计算机生成的报告、字处理文档、电子表格、演示文稿、语音和视频片段等,不便运用关系数据库管理系统进行处理的,结构化特性不明显的数据。

  文档特征向量 是指用于表示文档的向量空间模型,其中主要记录每个术语在文档集合中出现的频率等,用于进行文档相似性等分析的信息。

  人工神经网络 是指为计算机模拟人类大脑的功能,而建立的一种应用类似于大脑神经联接的结构,进行信息处理的数学模型。

  支持向量机 是指基于统计学习理论的模式分类器。
责任编辑:
发送给好友
 
 
企业、政府级应用软件(客户、资产、项目管理、财务)
相关新闻
·企业家的财富观
·招商银行行长马蔚华:管理国际化与企业基业长青
·建设企业文化三个关键步骤
·小企业的生存新思维
·企业管理黄金定律
·企业伦理与企业文化
·中国企业如何建立自己的核心价值观
发表评论
 热点新闻
 
 
 技术驱动
 
 
 商业中国
 
 
最新商业评论
·企信经管新闻

 
 
 
 
友情链接
商业中国博雅艺术成功帖吧无忧成功