探密百度智能搜索的web30时代

2019-05-15 06:40:53 来源: 孝感信息港

未来学家尼葛诺庞蒂说过,比特将代替原子成为互联数字时代的基因。用爆炸一词来形容信息时代的迅猛发展绝不为过。上个世纪90年代,WEB1.0时期搜索引擎才刚刚进入我们的视野,一转眼我们已经被WEB2.0的社交媒体为首的交互式传播所包围,而在大数据、云计算盛行的今天,智能化已经成为我们即将来临的WEB3.0时期的标签。信息成为生活的必须,我们很难想象没有了搜索引擎的入口,将给我们的生活带来多大的不便。而搜索引擎有甚么窍门,在日星月异的科技发展中历久弥坚?

现代人群获得知识便利获取信息和知识的方式就是搜索关键字。对于中国民来说,百度一下已经成为一种潜在的生活习惯,通过关键字检索,获得相关信息。那智能化的搜索引擎究竟是什么样的呢?后面隐藏着怎样的技术呢?今天让来为你揭开这层神秘的面纱。

知识图谱为你贴心构建完整的信息关系

首先,我们来做一个实验。打开百度,输入韩寒,你不但会看到百度百科对他的详细介绍,和他新浪微博的动态,还有门户站对韩寒的的报道,和韩寒贴吧和专辑等的链接。这样的多产品的搜索聚合,把垂直领域的相关信息一打尽。仔细的你一定还发现了,在页的右侧,出现了与韩寒相干的人物链接。除了国民岳父的好女儿韩小野,《上海绝恋》中的虐爱情人郭小四,和水火不容的仇人方舟子的链接外,还有老婆金丽华和传说中的秘密情人赵卓娜。如此贴心的智能化服务,不禁让坐在电脑前的八卦人儿会心一笑。

这种以用户为中心的化搜索与服务,后面隐藏的技术称为知识图谱数据分析技术。知识图谱(MappingKnowledgeDomain)是指用可视化技术来发现、描述、分析以及终展现数据或文本之间的相互关系。在海量数据挖掘的今天,需要有高速有效的算法,将杂乱无章的数据进行分类梳理,并通过可视化技术把结果展示出来。这样一来,复杂的知识体系通过数据挖掘、信息处理、知识计量和图形绘制显示出来,关系越来越完善,和用户的互动也越来越强。

这样一来,在垂直搜索的基础上,在水平面上也铺开了一张大,满足不同用户的各种需求。

基于知识图谱数据分析的智能化算法比拼

智能化时期,算法要求是越精确越好,特别是以简单可靠为文化宗旨的百度来讲,精益求精是鼓励百度不断完善的目标。对于完美技术的追求,对创新因子的渴望,是百度一直在努力的方向。

百度知识图谱数据分析比赛已近日启动,旨在寻找到更加精确的匹配算法,完善知识图谱分析,创造完美的用户体验,这将是技术达人们的一次盛会。在有趣的比赛方式下,达人们只需要完成百度给出的两个任务,并根据任务要求设计出一套算法,精确高效地达到任务目标。

任务1是实体类似度计算,也就是说杂乱的数据间,怎么样找出实体间的相似性和关联信息。达人们需要根据实体对应的描述,配对有关联的实体。例如:韩寒、郭敬明、田亮,韩寒和郭敬明是一对,因为他俩都是作家;韩寒和田亮是一对,他俩都是国民岳父;但郭敬明和田亮没有类似点,没法配对。任务2需要达人们不仅要挖掘出有关联的实体,还要推理他们的关系,算法越准确,得分率越高。如发掘出韩寒、韩小野两个关联实体,进而推理出他们是父女关系。

智能化时代的新生活方式

文本当然不止文字一种载体,针对于图片匹配、语义识别等识图技术,也在智能化领域运用繁多,在这个人人都有照相机和麦克风的时期,图片成为一种传播的主要文本。特别是以图识图的功能,大大丰富了人们获得信息的渠道。在江苏卫视《强大脑》有达人快速分辨照片中的人脸特点,作出分类判断,而识图算法也将智能化高效地完成这一任务,完成人机强交互。

在比特时代,人人都在谈大数据。真正有意义的是隐藏在数据背后的关系。WEB3.0时代的智能搜索,关键在于定位,如何能通过关键字或特征图,找到用户心仪的目标,如何以小见大。

我们将进入智能时代,同时也将进入一个达人和创客汇聚的平等、自由的思想碰撞的时期。我们庆幸地看到MOOC的发展和以百度开放研究社区为主的技术达人们汇集的平台在飞速发展。

也许,有了达人们的新算法,在WEB3.0的智能搜索时代,我们应该重新来讲述盲人摸象的故事:从前有个盲人,他摸到了一个类似尾巴的东西,百度一下,他知道了自己摸的是头大象。

月经推迟经量少怎么办
引起月经量多的原因
怎样减少痛经的疼痛
本文标签: