智源企业统一智能搜索引擎系统


1. 产品概述

数据是现代企业的重要资产,是企业科学管理、决策分析的基础。大型军工企业和科研院所经过多年信息化建设,已经建设了企业门户、网站、协同办公系统、ERP系统、PDM系统、文档管理系统、邮件系统、档案管理系统、文件系统等多种信息系统。这些系统中存在大量的设计文档、项目文档、历史文件、参考文献、研究报告、文本文件、网页等等非结构化信息资源。由于历史性等因素,这些应用系统存在着系统之间相对独立、信息不能共享、缺乏统一规范、可拓展性差等问题,导致系统无法满足用户对各类多源异构的信息进行快速、准确、跨库检索的需求。企业的专业技术人员在搜索信息时,往往需要在登陆多个系统进行查找。

智源企业统一智能搜索引擎系统是企业非结构化智能搜索和管理的基础架构平台软件,产品具备多源异构信息统一索引解析,企业信息资源统一智能搜索,信息个性化服务等功能。可以帮助企业进行异构资源整合,实现安全地跨系统的统一搜索和个性化信息服务。从而有效提升信息利用率,降低信息获取和处理的时间成本,提升决策支持水平等价值。

2. 应用价值

智源企业统一搜索引擎系统充分利用自动化和智能化的信息处理技术,可以实现以下应用价值:

1)解决“信息孤岛”问题,实现跨部门、跨数据库的异构资源整合和解析,提升业务系统信息利用率。自动采集、索引和整合多种信息来源、多种类型格式的信息资源,整合企业门户、网站、协同办公系统、PDM系统、文档管理系统、邮件系统、档案管理系统、文件系统等多种信息来源,并且可以解析Doc、PPT、XlS、PDF等1000种数据格式。

2)实现跨数据库统一智能搜索,降低信息搜索和处理的时间成本。运用智能搜索技术,建立安全、准确、快速的企业统一搜索引擎系统。

3)实现对行业数据库进行自动化分类和分析处理,帮助用户提高信息处理的效率。实现按照企业的信息需求,通过语义训练和关键词规则的方式,对信息进行自动分类,以便建立有序的行业数据库和知识库;系统支持按照目录树进行查询和文件管理。

4)实现对专家用户的个性化信息服务,提高决策支持水平。按照企业用户的信息需求,系统自动把有价值的信息关联,订阅和推送到所需要的专家用户手中。

3. 系统架构和功能

智源企业统一智能搜索平台是企业的统一非结构化信息基础架构平台, 系统功能包括了: 数据采集、信息搜索、内容关联、信息分类、个性化推送,支持海量数据和多维度信息应用的智能内容搜索服务平台。如下所示:

智源企业搜索系统使企业能够在保留人工控制能力的同时享受自动化带来的益处。具体功能如下:


1. 信息采集

1)对互联网信息采集:支持静态页面和动态页面的抓取,可以设置抓取网页深度,抓取文件类型,以及页面的特征分析和区块抓取。支持增量更新、数据源定位、采集过滤、格式转换、排重、多路并发等策略。特别互联网采集模块能够采集境外屏蔽网站信息。

2)对企业多源异构信息的整合和采集:多种类、模块化、分布式配置的采集工具可自动采集400种数据源(包括文本文件、数据库、邮件、Office文档、网站、大型应用系统等)、1000种格式的信息,实现了多源、多格式、有价值信息的一体化采集与整合。

2. 高度自动化和智能化的内容处理引擎

1)智能检索:支持海量的信息检索,千万级用户访问、每秒至少100次并发、响应小于1秒。具有自然语言检索,自动抽取上下文摘要/内容摘要,检索结果自动分组和自动生成相关内容。

2)自动分类:使用领先的智能分类器对信息自动分类,分类器的灵活性可以精确地根据非结构化文本中的概念进行分类。它保证根据内容对所有的数据进行最准确的分类。支持自定义的多级可扩展分类体系。

3)自动关联:关联服务是平台提供的最核心服务之一,也是最基本的内容服务。所有被平台管理的资源,无论是数据库资料,还是网页数据,或者内部办公文档,都能够彼此产生动态的关联,无需手工的链接维护。

4)自动排重:利用信息文档的内在特征进行智能分析,判断信息重复性,降低信息冗余度。

5)用户个性化订阅:用户提交订阅条件,系统根据用户的定制条件,可自动实时把符合用户要求的搜索结果信息发送给用户。

6)用户个性化推送:系统在后台自动分析用户搜索和浏览行为,从操作内容上分析相关用户的兴趣爱好,并积累用户独特的个性特征,从而提供信息自动推送、提示服务。

4. 产品技术优势

本产品的技术优势包括:

1)智能化:智能的中文信息处理动态推理引擎,动态推理引擎基于先进的模式识别技术(采用高性能概率模型技术,采用贝叶斯概率论和申农信息论),系统智能性高。

2)自动化:系统的所有服务器部件经由配置之后都可以完全自动化的运行,完全不需要人工的任何操作。系统的自动化程度非常高,通常由大量人工处理的工作现在都由计算机来完成,从后台的信息抓取、核心功能的实现,到前端用户个性化信息的推送,都实现了完全的自动化。

3)分布式部署:单引擎支持高达500 万份文档,文档数量的海量扩展只需增加引擎作分布式部署即可,使得的信息处理量没有上限;

4)安全权限集成,系统支持和第三方的安全认证系统的权限无缝集成,支持SSO单点登陆,即用户以一个用户名和密码登陆到系统后,会同步其它应用系统的用户信息,不用再次输入其它资源的用户名和密码。主要由用户服务器来实现。

5)高性能支持:可分布式的模块部署使得海量数据的响应速度达到秒级,支持PB级大数据的实时分析处理要求。




友情链接:    优乐彩安卓下载   斗鱼彩票_安全购彩   彩93彩票_安全购彩   优乐彩票聊天室   和信彩票注册