度秘告诉你 智能机器人能做什么

发布时间:2024-12-16 02:28

度秘告诉你 智能机器人能做什么

人工智能将带来过去不敢想的能力。李彦宏说:“我在这里也邀请每个人重新想象你所在的行业,重新想象中国经济,重新想象世界的未来。”

9月1日,2016百度世界大会在北京举行。百度作为最早布局人工智能的技术公司之一,毫无意外地把大会主题设定为人工智能。这回首次向外界全面展示了百度人工智能成果——“百度大脑”,并宣布对广大开发者、创业者及传统企业开放其核心能力和底层技术。

“百度大脑”由数十万台服务器构成,是一个超大规模的神经网络,拥有万亿级的参数、千亿样本、千亿特征训练,能模拟人脑的工作机制,学习训练极其复杂的模型。3年前,它的智力水平就相当于2-3岁孩子。那么现在几岁了?百度创始人、董事长兼首席执行官李彦宏对这个问题的回答是“我也不知道它现在是多少岁了”,人脑和电脑发育过程毕竟还是很不一样的。

虽然很神秘,“百度大脑”的应用已经深入到我们的日常生活中,且从其中一个说起。

会“读心”的机器人

这个智能机器人名叫“度秘”,在手机百度APP的“我”选项里能找到。通过简单的指令,能让度秘做不少事。

在大会现场,可以与度秘互动。把压力测试器夹在手指上,你的心理压力值便被度秘感知到。度秘会进行心理疏导,有个女孩被测出来压力特别大,度秘给她唱了首歌。

度秘除了能够识别语音和图像外,更关键、更核心的技术,是能够用人的语言来与人进行交流,并且能够理解人的很多意思和意图,尽管不是每一次都能理解。

度秘拥有自然语言的能力能做什么呢?8月17日,全球首次人机同台解说通过B站(哔哩哔哩)视频直播,主角就是度秘和知名解说员杨毅。一人一机联袂为广大球迷解说里约奥运男篮首场四分之一决赛。据百度自然语言处理部高级总监吴甜介绍,在奥运会开始之前,度秘就已经学习了历史上大量真实比赛的解说数据,通过借鉴机器翻译的思路,将获取到的各种比赛数据转变生成自然语言解说,并加强了对篮球比赛领域知识库的学习,使其能够在比赛场景下像专业篮球讲解员一样进行推理并准确表达。

屏幕上就是杨毅(左)的搭档度秘

杨毅对这位搭档的评价是,上知天文,下知地理,知识储备比人丰富,表达也是比较清楚的,而且能与观众互动,缺点是语速太慢了。但是,度秘经过再次强化培训,单独进行了一场决赛的解说,杨毅听后表示度秘的语速明显加快了。

杨毅想象,如果每位球迷收看比赛的时候,身边沙发上都能摆一个小机器人(其实不一定需要实体的机器人,手机足矣),一边看比赛,一边有什么问题就问小机器人,随时获得解答,小机器人就真正成了球迷的好朋友。

以上只是度秘的能力的一些例子。未来,度秘会嵌入到各行业,提供人工智能的能力。

听说看画——人工智能的四大能力

小机器人为什么能做那么多事,在于人工智能的进步。

李彦宏在演讲中首次全面揭示了百度人工智能的核心——百度大脑的四项基础能力:语音、图像、自然语言理解和用户画像能力。人们的“智能生活”将越来越精彩。

这四大能力的发展阶段并不一致。其中语音已经进入了相对比较成熟的阶段,在很多领域开始进入实用阶段,识别的准确率也已经很高了。图像最近几年也有了长足的进展。相对来说,自然语言的理解、或处理能力更难一些,并处在一个更加早期的阶段,因为它除了认知方面的能力之外,还要求有推理、规划等等能力,才能够真正地理解自然语言。用户画像的能力,本来并不属于人工智能的领域,但是由于近年来大数据的发展,尤其是大型互联网公司有能力搜集很多用户的数据之后,再通过机器学习的方法,把一个人的特征描绘得非常清楚,所以,用户画像也变成了百度大脑的一个重要功能。

·语音,又分成语音的合成和识别两个方向。

语音识别,百度的语音识别引擎第二代Deep Speech 2,把语音识别的准确度做到97%,甚至有时已经超过了人对语音的识别能力。今年《MIT科技评论》杂志,把这项技术评为“2016改变世界十大突破技术”之一。

李彦宏播放了一段视频,一名销售人员在跟客户通话,百度大脑一直在实时地精准识别双方的对话,同时根据客户的问题,实时推荐下一步怎样应对。

许多公司有电话销售部门,销售人员的水平参差不齐。把最优秀的销售人才的经验、话术总结给人工智能,人工智能再实时教给其他人,活学活用,那么刚刚上岗一个月的新人也能具备最优秀销售的能力了。

语音合成,就是机器可以把文字转换成语音,念出来。过去的语音合成很“机器”,每个字之后的停顿都是一样长,是匀速的、没有表情的。而现在已经像人说话一样自然了,体验大大提升。比如,过去用户人均在小说频道会花大概40分钟,现在要停留将近两个半小时,因为听小说变成了一种享受。不仅抑扬顿挫,而且,机器读出来的小说,和广播有本质区别,广播每个人听到的东西是一模一样的,语音合成可以做到按个人需求定制,或快或慢,或模拟任何一个你喜欢的人的说话方式。

百度地图导航可以选李彦宏的声音,实际上就是机器合成的。百度大脑合成了一段张国荣的声音,张国荣留下的国语资料比较少,合成比较难。普通人只要按要求说50句话,机器就能学会你的说话方式。

·图像,专业术语叫计算机视觉。其中最为大众喜闻乐见的大概是人脸识别,现在人脸识别准确率已经达到了99.7%。

人脸识别

现场识别嘉宾的脸

图像识别还在很多领域应用。比如地图街景采集,采集来图像之后要对图像中各种各样的目标进行识别,这座大楼是什么楼,那个路牌上写的什么字,地面上的标识是左转还是直行。又如无人车,要用计算机视觉技术去识别前后左右的物体,前面的车在哪儿,怎么运动的。

图像技术与AR(增强现实)结合,真实世界与虚拟世界交错,产生了新颖的广告形式。欧莱雅新出的一套植物系列洗发水,用手机百度扫描产品图片或实物,手机屏幕上就会展现相配的花草和音乐。

·自然语言处理,除了度秘,可以再举个例子:翻译。把一种语言转换成另一种语言,要做到信、达,必须得理解这种语言在说什么。百度翻译已经可以支持27种语言、数百种不同方向的对译了,李彦宏演示的一段视频中,出租车司机通过翻译APP与外籍乘客交流,英译中、中译英,聊得很带劲。

·用户画像,现在百度已经有接近10亿的用户画像,对他们的识别用到了千万级的细分标签。这些标签主要在两个维度上体现,一个是通用的维度,如人口学特征、短期的意图、位置属性;另一个是垂直行业的特征,如他在金融领域是什么样的情况,在保险、医疗、旅游、健康等领域都有什么样的爱好、习惯,等等。

最近几个月,手机百度增加了各种各样的文章显示,这些文章万人万面、亿人亿面,是根据每个用户的兴趣进行的个性化推荐。过去两个月,文章的阅读量增长了10倍。6月份上映的电影《魔兽》,其出品方传奇影业,就是利用了百度大脑的用户画像功能来提升它的票房。首先把人群分成三类,一类人是不管怎么样都要看的,另外一类是不管怎么样都不会看的,传奇影业真正关心的是中间类型的人,可能会看可能不会看。通过用户画像把这些潜在观众识别出来再精心设计进行推广,把他们拉进了电影院,最后票房提升超过了200%。

影视明星胡歌人气高涨,他的粉丝是什么样?令人惊讶的是,他们最感兴趣的是旅游出行、网络购物、餐饮美食,李彦宏当场答应,要通过糯米或其他的平台给胡歌粉丝提供专享的优惠。

胡歌粉丝兴趣偏好

人工智能将给各行各业的人群带来过去大家做不到的、不敢想的能力。李彦宏说:“我在这里也邀请每个人重新想象你所在的行业,重新想象中国经济,重新想象世界的未来。”

(本文图片由作者提供 图片编辑:曹立媛 编辑邮箱:[email protected]

栏目主编:文字编辑:题图来源:图片来源:图片编辑:编辑邮箱:

未经正式授权严禁转载本文,侵权必究

此文章不存在或已下线

网址:度秘告诉你 智能机器人能做什么 http://c.mxgxt.com/news/view/206679

相关内容

科普,无人机+人工智能=?
14岁男孩痴迷聊天机器人自杀身亡后,人工智能明星公司Character.AI遭起诉
张学良凭什么能当东北王,这个视频告诉你
谁能告诉我鼻屎糖是什么!哈哈!
人工智能会取代人类吗
科技爆款=人工智能技术+嘻哈明星
科技爆款 = 人工智能技术 + 嘻哈明星
揭秘林志颖智能私宅 微信智能家居打造亲民价格
你能告诉我吗?廖凡 廖凡什么是爱情 片段 瞬间戳中泪点 爱情
这场人形机器人大会太火!宇树科技、傅利叶等明星企业“同台竞技” “天才少年”稚晖君的智元机器人也来了

随便看看