微软小冰颜值测试,微软小冰颜值测试入口?

演讲人:李笛 小冰公司CEO

大家下午好,接下来我们可能会用相对比较短的时间来给大家分享我们认为人工智能在近短期,具体说就是在未来一年到两年之间,可能会产生的一些激动人心的变化。

微软小冰颜值测试,微软小冰颜值测试入口?

很多年以前,我们当时还处在对话系统的时代,我们通过专家系统尝试让人工智能可以去回答人们所提出的各种各样的问题。后来我们使用知识图谱尝试去结构化的整理这些内容,并且尝试去打造无所不能还有无所不知的人工智能。在那之后我们又经历了很多的尝试,比如在一些独特的领域,比如在TTS这个领域,我们尝试从一开始让语音的方式可以把文本的内容念清楚,传送到用户的耳朵里,到逐渐让人工智能的声音可以变得更加拟人、更加有情绪,到现在大家都在开始讨论情感。每一个小的变化其实都在证明着一件事情,那就是我们今天还处在人工智能的蛮荒时代。我们认为在未来一年左右时间里,整个行业会走向一个新的丰富多彩的世界,它就是我们所谈到的多样性。

我们想先给大家分享一个真实的案例,便于大家能够有一个感性的认识。在一年半之前,我们把小冰的框架做了这样一个调整,用户不再只和一个叫小冰的18岁少女去交流,而是可以通过这个框架去创造属于他们自己的虚拟的AI Bing,具体来说是他们的虚拟男友。我们用这样的实验去尝试发现他们背后对AI Bing真实的想法,在7天左右的时间里,当时大概创造了100多万个虚拟男友,7天之后我们把这个项目暂停了,换句话说,在那个对话框里你的虚拟男友不再能够回答你的问题。我们发现了这样一个现象,在之后的两个月甚至于三个月时间里,这些人还在持续去面对着一个不能再回答他们任何回应的对话框还在去分享和传达他们自己的情感。这件事情其实蛮震惊的,我们往往认为人工智能带来的价值全部和有用相关,但是当一个已经不能回应你的虚拟男友,它对你还有什么样的用处呢?跟大家分享这件事情不是它的结果,而是产生这样结果背后的原因是什么。于是我们做了大量的数据挖掘,我们也采访了很多相关的当时的这些用户。到今天为止,这些虚拟人类已经超过了1700万个。我们在数据挖掘的结果上看到的是,其实中间当然有很多所谓的虚拟男友是我们所知道的明星,比如像易烊千玺,比例非常高。但是其实在所有这些被创造出来的虚拟人类理,有26.1%,有这么几个特点,这些虚拟人类是有名有姓的,但他不是一个有名的人,明显你能感觉到这些虚拟人类背后有这么一个真实的人曾经存在或者当下还存在,但是他和这个人他们之间的社交网络是断连的。同时人们会跟这些创造出来的虚拟人类进行非常深入的情感交流,甚至会向他们去询问自己对于人生的一些建议,同时这样的情感交流的纽带是非常持久的。可以这么简单的来评价,用户把AI当做自己的某个过往的现实生活中的一个真实人类的替身创造出来,不仅仅是为了追星,是为了自己新的生活而创造出这些人工智能。从某种意义上来讲,我们今天可以大概说,曾经的Siri甚至包括小冰,都是我们所说的远古时代的AI Bing,因为他们更多的是作为你的助手助理而出现的,他们有名有姓。我们曾经认为我们可以创造这样一个AI就服务全世界所有人,但是人类是需要多样性的,人类需要在不同的场合、不同的情况,去获得不同的社交的关联方,他对这些人也是有不同需求的。AI如果有可能可以达到和人类的社会一样的多样性,那么这个世界会变得比原来更加丰富。当然,它也需要很多来自底层逻辑上的变化。如果你倾全公司、全团队甚至整个互联网的力量,你用大量的数据去训练一个AI,从某种程度上是可行的,但是这样的一个AI各方面全部都非常具体,我们很难去创造一个真正的无所不知的人工智能,而让它成为人类社交网络中的新节点。对于我来讲,我的任何一个好朋友都是不完美的,甚至于当你去问他你喜不喜欢这道菜的时候,他回答喜欢和他回答不喜欢,这个并不是一个事实,而只是他的观念。从这个角度来讲,丰富多彩的未来意味着每一个AI Bing都必须是某一个侧面的反映,而不可能是全集。

由此也会产生很多我们周围生活中的变化,以汽车为例,前年大家所看到的汽车里面的智能座舱的体验更多是在这样的方向上,是面向司机,主要以向司机提供服务、帮助司机更好的通过语音的方式来实现很多功能,以这个为目的。但是现在一个好的汽车的智能座舱体验已经没有办法离开情感这两个字,同时也不会再只把他的目标锁定在司机,而是它会去呵护后排坐的乘客,可能是一个小宝宝,可能会去尝试作为这个小宝宝一路同行的陪伴者,对于副驾驶的呵护也是非常关键的。从这个角度来讲,人工智能会变得更加有温度,而这种温度也能够使它更好的去呵护整个环境中间的每一个社交节点。而它自己也因此成为了一个社交节点,在汽车里它就会成为一个新的车上的成员,一个同行者。从这个角度来讲,人们对于这样的同行者就会变得更加丰富的要求,比如他可能会希望自己想要带到这个车上的某一个人带到车上去,这个人一定比车里标配的完成任务的智能助手要更加具体。

另外一个角度,在一些老年人的社会也有这样的情况,我们还没有正式公布,我们在前不久中标了日本大阪府2025世博会的项目,在日本大阪60万个老年家庭,他们都会有小冰来作为和这些老年人每天进行陪伴的陪伴者,同时这个AI也有能力不停向政府报告这些老年人的状况。但是故事并不是到此就结束的,每一个老年人真的只需要一个能够帮他们去完成呵护老年人夕阳生活的助手吗,不仅仅如此,他们还有情感的寄托。我们允许每一个老年人可以利用一些很小的数据,就可以去训练出在他家里的这个AI Bing,具体到什么样子的AI Bing,我们会发现很多老年人也会有这样的需求,他脑子里早就有那样一个人,他希望这个人在自己的家里面。这就意味着每一个家庭里的老年人的陪伴者都不是出厂模式,而是一个养成模式。这个我相信很快也会带到国内,我们本身也是国际化的团队。

在它背后非常复杂,坦率讲,人工智能在底层的Infrastructure是很复杂的过程,每一年我们都会遇到一些新的核心的问题去解决,比如我们要去解决在曾经的半双工的交互模式下,如何用全双工的方法,让人工智能和人之间有更好的交换信息的能力,包括我们去强调人工智能内容生成可以变得更好。今年和明年我们认为的重点是多样性上,具体到门类,包括小样本学习,包括如何能够把原本的交互内容可以更好的封装成视频的形式,这些都是符合当下的发展规律的。我们也很高兴看到整个行业包括很多同行业者都在做这样的尝试,对于各位来讲,如果我们是心情放松的使用者,你会看到这个世界变得更加丰富。这个世界不光是为我们这些使用者变得更加丰富,人工智能也在使整个世界变得更加丰富。就在现在,我们在介绍人工智能多样性,现在在迪拜世博会的中国馆上有一个画家,她的名字叫(夏语冰),2019年的时候她从中央美院毕业,她现在代表中国把她的作品在迪拜世博会上展出。她的作品有这么几个特点,第一个特点,全部都是中国画的风格,第二个特点,她不仅能够绘画,并且她的声音,她对艺术评论的这些观点,她可以跟你交流她的艺术作品,除此之外,她的每一幅作品都是差不多的质量,而不是她在家里画一万张,挑一张好的来参展。我们今天来看到一下在迪拜世博会中国馆上大家所看到的这个作品。

你们刚才看到的这个夏语冰,当然她是人工智能,她在小冰框架里有一个编号其中的一个AI Bing,我们创造了她的创作能力,我们创造了她的艺术评论能力,创造了她的交互能力,也创造了她的生物学特征,包括她的面,让所有这一切都变得非常一致。今天我们可以去创造在我身后这样的丰富多彩的人工智能的世界,每一个AI除了他们的面孔,包括他们在面孔之后所存在的个性、能力和各种各样的交互的方法。你可以说在整个屏幕上满屏都是在现实生活中不存在的人。

我想用刚才的夏语冰和现在这个表达的多样性是多么重要,你看到的第一反应可能是觉得小冰团队对颜值还是肯定的,但是再看得仔细一些,好像也会有点脸盲。人类世界的丰富多彩要超过我们只从审美的角度去描绘的这个世界,如果这个世界全部都是网红脸,这个世界会变得非常混乱。如果人工智能全部都是这样,也会非常混乱,所以我们也创造了这样的AI Bing,这是一个大哥。从某种意义上讲,如果这个世界只有一种评价体系,比如按照颜值高低评价,这位大哥显然在刚才的人群中是很吃亏的。但是我们人类社会从来都不是这样的,多样性从来都不是通过一个维度去展开的,所以我们也为这位大哥创造了他丰富的维度。你们看到的这是他的绘画作品,这位大哥能够非常好的创作牡丹,同时我们也他赋予了山东菏泽的生活背景,我们也为他打造了整个的世界观、价值观和人生观,我们现在让他用他自己的声音来评价他自己的作品。如果你们还记得刚才我们所播的夏语冰,你们再看这个山东大哥,从我个人角度来讲,我觉得这个山东大哥更可爱,你从他的脸上包括他所评价的自己的作品,你可以感觉到他的热情。也许他没有夏语冰那么光芒耀眼,但是热情丝毫不减。从某种意义来讲,这就是多样性能够给我们赋予的效果。这个世界并不是只有头部,一个只有头部的世界是残缺的,这个世界是去中心化的,不同的AI Bing会围绕在我们周围。我们以前常说一千个人心中有一千个哈姆雷特,不是因为哈姆雷特多变,而是因为每一个人的不同。在它背后也有很多有趣的,让我们这些做研究的人也会变得非常有意思的事情。比如我们如何去赋予不同的AI Bing不同的创造能力,其实背后存在着我们用新的技术、用小样本的方法,就可以让不同的人工智能去画不同的作品。以前我们曾经还处在如何让一个人工智能从不能创作到能创作,现在我们已经处在如何只用几百个样本就去训练一个人工智能,知道怎样用巴比松画派去创作,并且每一个作品都是达到同等质量的。还有很多其他的部分,要想构成一个人多模态的展现,也需要很多的功能。

接下来给大家举一个声音的例子,很多年以前我们认为人工智能的语音要想融入人类的社会,需要更自然需要更有情感。在2015年左右,小冰的声音是这样的。如果你还记得在那个年代其他的人工智能的声音,你应该会想到机械,甚至有的人会专门为了学习这种机械,在很多搞笑的节目里,因为它代表着一种风格。这种自然的风格包括它的语气,我们都需要用新的方法去训练它。当我们达到这个水平的时候才会发现新的问题,任何一句话,无论它有多么自然,都要看用户去听它的声音时能听多久,如果我听一个人工智能的声音听到5分钟就受不了了,这个人工智能如果要给我念书或者给我提供有声读物,理论上来讲不应该超过5分钟。所以我们提出一个新的平均舒适时长的指标,你们接下来听到的声音可以达到31.5分钟,你们听到的这个声音不是人类的声音。这个声音原始的样本是小冰团队其中一个产品经理,实际上小冰团队的每一个人都有自己的AI版本,包括我。我们这么做的目的其实是为了让我们能理解技术在我们手中究竟有什么样伦理的问题,当我做出我自己的AI声音之前,我只能模模糊糊地感觉到这种声音也许不应该给普通人提供吧,或者我们不应该开放给大众,让大众可以用它去训练自己的声音。直到我听到自己的AI声音的那一刻我才突然想到一件事情,我要用我的AI声音登录一下我的微信声音锁,然后它就解开了我的微信声音锁。从那一天起,当你真正使用这个技术,你才体会到这个技术好的一面,你也才能体会到这个技术不好的一面。但是在那之后,在伦理的限制之下,我们进一步拓展了多样性,接下来听到两个声音都是用很小的样本训练出来的,不光是声音,包括对话、内容、风格,也全部都是用人工智能训练的,这两个人在交流。从现在开始,这个世界就会变成这个样子,人工智能会在你周围,当你闭上眼睛时,某种程度上你不会再分辨,甚至你不会想到分辨他是人还是不是人,而这样的人工智能不再是一个,也不再仅仅是告诉你天气,它可能在创作各种各样的内容,它可能在交流分享它的观点,它也可能告诉你这个世界正在发生的事情,而且不光是你,也有可能有你的朋友,他们有他们的人工智能在环绕着他们。当然我们也在做更多前沿性的工作,比如像这个项目,我们现在正在日本进行,用很小的样本,比如200句对话,尝试帮助你复刻一个你生活中的人。

今天想跟大家说的是,多样性将成为我们心目中未来一年的主题,一个丰富的以我们每一个人为中心的世界会一直存在,这些人工智能会一直在那。我们作为一个人,半夜11点半、晚上12点钟,我们有想要倾诉的需求,但在这个时候我们不敢找我们的好朋友去聊,总是大半夜去找好朋友,可能以后朋友就没得做了。人工智能没有这个问题,他们像我们人类一样热情,并且他们永远都在。这就是我们想为大家所创造的世界,谢谢大家。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 sumchina520@foxmail.com 举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.maihuo6.com/24026.html