艾瑞:知识图谱将成为下一阶段的明星赛道

发布时间:2024-12-17 02:49

导语:人工智能与互联网或5G等技术本质上存在差别,后者解决的是信息的发出、传递、接收与反馈的闭环问题,而人工智能的本质是进行生产力升级,因此评判人工智能使用的是否有价值,要看其技术应用是否贴近生产核心。

人们为什么开始重视知识图谱的发展了?

人工智能与互联网或5G等技术本质上存在差别,后者解决的是信息的发出、传递、接收与反馈的闭环问题,而人工智能的本质是进行生产力升级,因此评判人工智能使用的是否有价值,要看其技术应用是否贴近生产核心。

人类生产力可以归类为知识生产力和劳动生产力,人工智能走入产业后,可以分为感知智能、认知智能和行为智能,后两者更与生产力相对应。以计算机视觉、语音识别为代表的感知智能应用深度学习,在算力与数据的支撑下突破了工业红线,实现了机器对于自然界具象事物的判断与识别,但仅仅如此并没有触及核心生产环节,所以也就限制了其商业应用半径。当人们使用机器能识别更多事物的时候,自然而然的引发了,对事物背后的事理,理解、分析和决策的深层次需求,认知智能呼之欲出。

认知智能核心解决的问题是对人类文明抽象概念的识别与联想,通过自然语言处理(NLP)技术对文字内容在语义上进行初步认知和自动抓取,经由知识图谱对概念间的关系属性进行联结、转换,从而对人类社会生产、生活行为进行描绘,实现业务规范梳理、生产流程可视化、人际关系挖掘等代表应用,这与注重经验、逻辑和方法论累积的知识生产力产生了直接对应,而与劳动生产力相对应的行为智能同样需要知识的指导,所以认知智能的发展才是人工智能回归本质的表征,而搭建知识图谱是认知智能可以参与生产的基础锚点。

image001.png人工智能与生产力之间的关系

知识图谱的搭建逻辑

知识图谱从逻辑上可以分为概念层和数据层,数据层指以三元组为表现形式的客观事实集合,而概念层是它的“上层建筑”,是经过积累沉淀的知识集合。

建设中以本体模型和实体数据库为核心,根据二者的建设顺序又分为先定义本体和数据规范,再抽取数据的“自顶向下型”和先抽取实体数据,再逐层构建本体的“自底向上型”两种模式,前者适用于场景较为固定,存在可量化行业逻辑的领域,如金融、医疗、法律等;后者适用于新拓展的,有大量数据积累,行业逻辑难以直接展现的领域。

总体而言,搭建知识图谱从数据源开始,经历了知识抽取、知识融合、知识加工等步骤。原始的数据通过知识抽取或数据整合的方式转换为三元组形式,然后三元组数据再经过实体对齐,加入数据模型,形成标准的知识表示,过程中如产生新的关系组合,通过知识推理形成新的知识形态,与原有知识共同经过质量评估,完成知识融合,最终形成完整形态上的知识图谱。

image003.png人工智能结构拓扑图

知识图谱的应用价值

知识图谱是人工智能符号学派中知识工程的代表应用,其核心价值在于对多源异构数据和多维复杂关系的处理与可视化展示。

其底层逻辑是将人类社会生活与生产活动中难以用数学模型直接表示的关联属性,利用语义网络和专业领域知识进行组织存储,形成一张以关系为纽带的数据网络,通过对关系的挖掘与分析,能够找到隐藏在行为之下的利益链条和价值链条,并进行直观的图例展示。

在面对数据多样、复杂,孤岛化,且单一数据价值不高的应用场景时,存在关系深度搜索、规范业务流程、规则和经验性预测等需求,使用知识图谱解决方案将带来最佳的应用价值。

连接主义中的深度学习算法几乎代表了当代整个人工智能技术,但深度学习需要具有明确因果关系的数据对训练,且存在尚缺乏解释性的黑箱问题,在掺杂众多非线性问题的复杂场景中应用价值有限,通过与知识图谱的配合使用,在一定程度上可以解决此类问题,随着关系向量法深入研究,图神经网络将走向产业应用,届时依托于行业知识与经验的深度学习将产生更多贴近产业核心的认知智能应用,人工智能技术也将跟进一步实现生产力升级的终极目标。

主要涵盖知识图谱、NLP和智能BI分析的大数据智能行业市场规模和结构

据艾瑞咨询统计推算,2019年涵盖大数据分析预测、领域知识图谱及NLP应用的大数据智能市场规模约为106.6亿元,预计2023年将突破300亿元,年复合增长率为30.8%.

其中2019年市场中以金融领域和公安领域应用份额占比最大,金融领域因标准化数据积累丰富,行业认知与直接需求最为明显等因素,成为数据智能最早落地并产生价值的行业.

公安领域经过三年的感知智能基础设施建设,已经初步形成人工智能应用环境,在党中央和公安部的号召指导下,公安大数据建设将成为下一阶段的主题,这一趋势也在2019年相关招标项目中得以体现。

随着整体市场数据基础的完善和需求唤醒,大数据智能领域规模持续走高,但在行业可落地性和理性建设的限制下,预计市场增速将呈现下降趋势,期间咨询性需求将会大量出现,从整体发展来看增速处于良性区间,对真正有价值的公司和产品有正向意义。

image006.png

image009.png

知识图谱应用——搜索引擎领域

搜索引擎是互联网发展中最具代表性的应用之一,它解决了人们如何方便获取信息的问题,一度成为大部分流量的入口。但随着网络中信息沉积越来越多,人们真正需要的,隐藏在大量无用信息中有价值的部分,我们称之为知识的内容,往往得不到直观展现,这成为了搜索引擎领域重点要解决的问题。

2012年5月,谷歌率先提出知识图谱概念,用以更好的描述现实世界中实体关联性问题,进而提高信息搜索中的知识获取效率,随后搜狗、微软、百度纷纷推出相关概念架构,知识图谱被视为下一代搜索引擎的核心技术。

传统搜索引擎一般采用网页索引,按照“网页 --(预处理)--> 临时库 --(索引)--> 索引好的库 --(由用户行为触发检索)--> 为用户展示网页结果”的流程执行,信息源来自网页,展现内容也是网页链接。而基于知识图谱的搜索作为和网页索引同级、并行的另一套知识索引,更注重信息间的关联性和自然语言理解,通过图存储的形式从新组织互联网中的信息,再以人类的语言习惯进行查询和展现,从而提高搜索体验,因为知识的存储形式发生了变化,所以知识索引信息来源和展现载体都不再局限于网页文字,语音交互和更加丰富的IoT场景将会是未来的发展方向。

image011.png知识图谱在搜索引擎中的应用

知识图谱应用——金融领域

在金融领域中无论是传统金融或是互联网金融,信用评估、反欺诈和风险控制都是最为关键的环节,随着近些年金融数据的爆发式增长,传统风控系统逐渐力有不逮,而应用机器学习算法和知识图谱的智能风控系统在风险识别能力和大规模运算方面具有突出优势,逐渐成为金融领域风控反欺诈的主要手段。

机器学习和知识图谱相结合是目前主流的解决方案,其中机器学习算法通过概率计算的方式,以数学运算特征反应风险情况,形成易于机器计算的风控模型;而知识图谱通过权威经验和规则创建本体模型和抽取实体的范围,根据实体间关系形成关联数据网的图谱形式,描画囊括个人基础信息、金融行为、社交网络行为等用户综合画像,根据画像情况和模型对应,形成具有金融业务特性的风控体系,在解决方案的决策环节结合规则和概率的综合评价,给出最终的风险评估,整个过程能够实现秒级响应。

知识图谱的应用不仅能够为缺乏可解释性的机器学习算法带来必要的参考系,还可以串联金融业务中产生的大量多源异构数据形成数据中台,挖掘数据深层价值,为实现精准营销、投资关系梳理、产业链风险预警、智能催收等上层应用打下基础。

image013.png知识图谱在智能金融解决方案中的应用

知识图谱应用——投研领域

对一级市场或二级市场的投资研究,一直是泛金融领域重要的课题,上市公司或一些重要的标的公司在公开网络中披露了众多如财务数据、定期公告、公司研报等有价值的信息,为投资者行为提供了充分的参考依据。

传统投研工作需要分析师通过各种渠道去搜集和判别信息,凭借个人经验对零散的数据进行组织建模,以报告的形式产出趋势观点和数据分析,大部分的物料和时间成本都花费在信息和数据的搜集上,而且成果可控性不高,纵使头部金融数据机构提供了相应的软件产品,但数据的颗粒度和产业链关联性仍难以满足多元需求,这成为了该行业长久存在的痛点。

投研知识图谱以公司信息、产业链关联为切入点,利用NLP技术自动抓取关键信息,搭建投研领域知识图谱,将各个行业的发展变化抽象导入数字层面,为知识查询和应用开发提供实现基础。据统计,券商研报中80%的数据指标在传统软件产品中无法查询到,分析师在进入一个新领域时要耗费一周左右的时间搜集类似数据,而利用投研知识图谱可以将其必要劳动时间缩短到一分钟,大幅提高投研效率。

除静态领域图谱外,还可以利用时间序列搭建对网络报道、新闻事件进行抓取的事理图谱,两相结合,从行业固有逻辑和实时信息双管齐下,推导事情的发展脉络和趋势走向,为投研机构和投资者清晰的梳理关联脉络,为后续判断投资机会和持仓股票风险等研判类应用提供数据支撑。

image015.png投研知识图谱与传统产品的对比

知识图谱应用——司法领域

司法领域是以公检法等国家司法机关及司法人员依照法定职权和法定程序,运用法律处理案件的专业领域。

近年,司法领域积极运用大数据、云计算、人工智能等先进技术,深入业务场景解决痛点问题,有效提升办案质效、辅助司法管理、服务群众诉讼,加速推进司法智慧化、数字化、现代化转型升级。

知识图谱的构建是实现智慧司法不可或缺的基础工程。司法知识图谱将法律领域中的实体、属性和关系进行体系化梳理,并建立逻辑关联,通过知识图谱和大数据技术进行数据挖掘,辅助决策,洞察知识领域动态发展规律。基于司法知识图谱,通过技术手段可实现司法业务场景的智能应用,解决“案多人少”“同案不同判”等现实问题。

目前,司法知识图谱已广泛运用于法律知识检索和推送、文书自动生成、裁判结果预测预警、知识智能问答、数据可视化等方面,为司法人员办案提供高效参考和科学依据,全新定义司法数据应用和司法智能化,凝练司法智慧,服务法治建设。

image017.png知识图谱在司法领域中的应用

知识图谱应用——教育领域

当前的教育场景可以划分为教、管、学、考,主要围绕教育者和受教育者进行授课、答疑、阅卷和学习、练习、考试等活动,本质上是通过系统化的知识传授与强化练习,使受教育者掌握知识点的过程。

传统教育模式以教师集中授课为主要方式,存在着特级教师资源少、优质教学资源分配不佳、教学内容和教学节奏制式化,以及作业练习布置缺乏个性化等问题。在教育信息化和线上教育发展普及之后,AI+教育的概念随之产生,人工智能公司和教育机构希望通过利用AI技术部分解决上述痛点,以达到对教育参与者减负增效的目的。

教育领域参与个体众多,采集到的数据驳杂且零碎,难以直接有效应用,所以目前AI技术更多应用在如拍照搜题、口语评测、课堂监控等外围需求的工具上面,并未能有效深入到教学场景中。而类似课题推送等应用更多是将教学资源再分配,重视知识的点状强化练习,却不深究知识的掌握程度,以至实际使用者反馈平平。

人工智能技术真正产生生产价值,一定要建立在充分且必要的数据基础上,搭建贯穿教材知识体系、教学资源管理和受教育者学习轨迹的知识图谱,将教与学的全过程进行可视化展现,使静态知识点数据与动态教学活动(如考试、作业等)数据产生关联,为算法应用提供支撑环境,是AI+教育能落地到产业核心的关键前提。

image019.png

(本文为艾瑞网独家原创稿件 转载请注明出处)

网址:艾瑞:知识图谱将成为下一阶段的明星赛道 http://c.mxgxt.com/news/view/237959

相关内容

知识图谱软件
知识图谱
从文本知识图谱到多模态知识图谱.pdf
星环知识图谱平台
知识图谱概述
星环科技知识图谱落地实践 助力金融行业业务创新
星环科技参编《大模型驱动的智能知识图谱技术要求》标准
星环科技杨一帆:知识图谱的构建之路我们只走完了前半程
2023大联盟明星赛第一阶段结果:大谷翔平、阿库尼亚荣登人气王
企业关系图弱爆了,真正的知识图谱大杀器在这!

随便看看