在2月22日将门一周年生日会上,我们很荣幸邀请了中国人工智能行业最重磅的6位嘉宾——NVIDIA全球副总裁兼中国区总经理张建中先生,联想集团高级副总裁兼CTO芮勇博士,今日头条副总裁、AI实验室主任马维英博士,微软亚洲研究院首席研究员刘铁岩博士,360首席科学家颜水成博士,以及著名天使投资人、北京大学人工智能创新中心主任雷鸣老师。
他们和将门CEO高欣欣一起,围绕“人工智能的技术前瞻和商业的未来”这一话题展开了探讨和分享。
圆桌主要分为上、下两部分:上半场几位嘉宾一起聊了聊人工智能的技术与商业、今天与未来;下半场为答将门微信技术社群的群友问。
Part 1
▼▼▼
高欣欣:NVIDIA是我们整个行业最为尊重的公司之一,而且还特别有远见,很多年前就开始重磅在人工智能。NVIDIA强大的GPU计算力,使得众多创新能够快速发展起来。所以我想问您问题的关键词跟未来这个词有关。人工智能如火如荼,但是如何落地?如何在今天落地才是我们关心的问题。您觉得人工智能在什么样的场景和行业会率先激活?NVIDIA又会如何布局?
张建中:这个问题很多人经常问我,讲到人工智能创新的落地。其中一个落地的行业目前NVIDIA自己也在做。我们专注成立了一个自动驾驶汽车(self-driving car)部门,结合当今人工智能从计算机视觉、自然语言理解到机器学习各方面的综合。当然,这个行业我们也在联合全球几乎所有的合作伙伴,一起在攻克这个难题。如果能解决这个难题,自动驾驶汽车能真正行驶在街道上,那一天代表人工智能的落地取得了巨大的成功。
另外一个NVIDIA看好的人工智能落地的行业是AI city。AI city在我们看来是目前落地最快的一个行业。我相信很快在座每一位就会听到在国内跟国际上一些大单落地非常大的订单,都是来自于AI city。
第三个是健康行业。NVIDIA自己设了一个项目,我们自己想攻克一些难题,通过帮助癌症病人尽早发现这些疾病,而且尝试找出一些方法去治疗。所以健康是我们第三个行业。
最后一个行业是AI游戏。如果当你第一次打游戏的时候,没有人教你,你会对这个游戏无感。但是机器会根据你的水平,自动的把你带到专业级的时候,你会发现任何一个人都是Gamer,这也是为什么今天我们在全球大概有10亿玩家在打游戏。在今后我认为AI Gaming将会是一个很大的领域。所有的游戏公司,将会把他们的游戏变成AI Gaming。
高欣欣:问完算力专家,得问算法专家。刘铁岩博士是微软亚洲研究院首席研究员,有关他的核心问题核心词必须是深度思考。我想问铁岩博士,现在我们都在谈深度学习,但是深度学习是否是我们的终极选择?这中间有没有什么关键的思考是缺失了的?
刘铁岩:这是一个很有深度的问题。深度学习或者今天的人工智能技术到底有什么短板,有什么被忽视的地方?我想每个人都有自己的观点。我只提现在能想到的两件事:
第一件,我觉得现在的深度学习技术是一个矛盾体,它是把所有过度复杂(overcomplicated)和过度简单(oversimplified)两件事情拧在一起。为什么说过度复杂呢?深度学习之所以有今天,因为它是一项强的技术,深度神经网络够复杂,它的拟合能力很强,可以把很多复杂的数据拟合掉,把这些问题解掉。
但是反思一下,我们真的需要这么强的拟合能力来面对大自然给予我们的数据或者人类社会产生的数据吗?其实回顾过去几百年,很多科学家发现很多简单而美丽的规律。举个例子,我们现在看量子力学、量子化学、生物遗传、经济学包括社会学。很多人发现,我们看到貌似无比复杂的表象背后,其实数据的产生是非常有规律的,可能就被几个简单的二阶微分方程所支配。
如果我们能把这些产生数据的动态系统好好描述一下,可能根本不用这种笨拙简单粗暴的方式处理数据,这是我为什么讲深度学习过度复杂。
另一方面它又oversimplified(过度简单),为什么这么讲?我在很多场合讲过我对人工智能的看法,我觉得今天的人工智能可能不配叫人工智能,AI更像Animal Intelligence,我们做的人工智能是做模式识别。其实没有抓到人和动物的本质区分点,我们做的事情动物大概都会。
那么人和动物之间的区分点到底在哪里?人为什么成为万物之灵?我觉得因为人类是一个群居动物,我们有一个特别强大的社会机制帮助我们做一些动物做不到的事情。举个例子,比如人类会萃取知识,会用文字的方式记载、传承知识,我们还发明了很了不起的教育体系,可以在短时间内教育我们的后代,用几年时间学会过去几千年人类积累的知识,这些东西使得人的知识迭代非常快,一代更比一代强,总是站在巨人的肩膀上。
回过头看动物,老一代动物死掉了,就归零了。新一代的动物,重新做增强学习、认识世界。所以它总是在原地打转,我们却在螺旋式上升。这些东西,我们看看今天的人工智能技术,没有任何一个好的算法和模型,把我前面说的这些事情考虑在内。
所以实际上从我的角度讲,今天的人工智能离我们人类的智慧相去甚远,研究人员任重道远。
高欣欣:接下来要问问有数据的人,要请教芮勇博士。最近芮勇博士加入联想,成为联想集团的CTO,必然会使技术和联想庞大的技术和行业认知结合起来,使它真正为商业所用。而联想又是我们能够看到中国龙头企业、世界的领先企业,它的每一步牵一发动全局。所以我要问芮勇博士的关键词是布局,想请问您,您到了联想之后,将会如何布局联想的人工智能?您将在哪一些领域重磅突破?
芮勇:加入联想大概三个半月,这三个半月工作也很忙,尽量了解联想整个的体系。原来的使命是什么,我们今后要往哪走?杨元庆在几年以前就开始跟大家讲,联想要从只做设备的公司,变成设备加上云的服务。去了以后,我觉得要把联想变成一个Device+Cloud powered by AI的这么一个公司。
我觉得联想有机会把这些事情都做了,为什么这么说?联想有三个BU,加上研究院还有创投。三个BU里,有两个做设备。
第一个BU:做PC,全球连续37个月出货量都是第一,这是做设备(PC)。
第二个BU,做手机。联想手机在中国市场还有很长的路要走,希望大家帮助我们一起走得更快。但是在中国市场以外,其实上一个季度,我们全球的出货量全球第四。所以手机有很多的设备,这两个BU都是做设备的。
第三个BU,做服务器、数据中心和云。有希望把Device + Cloud Service给做在一起。我加入联想之后,我领导的研究院还有老贺领导的创投部门,我们一直会加大在AI方面的投入,使得整个产业链变成Device + Cloud powered by AI,所以这就是我的布局。
高欣欣:接下来问的这位,也有巨大的数据。我想请问 360的首席科学家颜水成老师,您觉得在人工智能里,有哪一些,不管技术领域还是商业领域的创新,是您期待或者您觉得即将发生的?
颜水成:现在在谈技术的时候,可能大家想到最多是人工智能,人工智能讲比较多的是深度学习。那么不管深度学习到底能不能真的完整或者完美地解决我们很多的问题,但是深度学习在我们很多的问题中,确确实实发挥了重要的作用。
就深度学习本身来说,我觉得创新有三个维度:
· 维度一:希望能设计出更好的深度学习的模型。它有更大潜力,让它的这种分类或者预测的性能更高,可能是所有的公司在追求的点。
· 纬度二:当我们把这种深度学习用在端上的时候,能耗是一个很重要的问题。这时候其实从深度学习角度出发,如果你有很好的这种模型,如果能够节省能耗的话,这是很有价值的。
· 纬度三:互联网公司非常关注的,我们在做很多的APP,深度学习有一个很重要的研究问题,就是说你怎么样可以有一个非常智能的模型,保证我在每一个星期或者每半个月可以远程把模型能够升级。
如果从产品或者应用的角度来说,其实应该是基于人工智能的技术,让你创造出一种产品,而这种产品其实要做到两件事情。
· 增加用户的黏性。
· 怎么样让用户花最多的时间来用你们的产品。就好像今日头条这样的产品,我每天可能要花上半个小时去使用。
高欣欣:既然您提到了今日头条,我们马上把下一个问题给到马维英博士。维英刚刚加入今日头条成为今日头条副总裁,带领着今日头条的人工智能实验室。所以今天请问维英博士的核心词就是引领。我们看到今日头条做了那么多引领行业的创新,在您带领下的今日头条在人工智能的布局,又将引起什么样的行业的引领和变革呢?您可不可以给我们稍微透露一些。
马维英:今天来我非常有感触,而且也是非常感谢。因为我刚离开微软亚洲研究院10天,刚加入了今日头条。我在今日头条真的是看到了一个全新的机会。我对人工智能是这样的看法,接下来人工智能会进入到两级分化。这两级门槛会越来越低,但是同时门槛也越来越高,其实没有中间地带了。门槛越来越低和越来越高的情况之下,你如何保持你的竞争力,或者说你如何能够创造竞争壁垒呢?
我觉得要有下面这有五个东西:
· 数据
· 用户数和用户的使用时间
· 应用场景
· AI基础设施
· 算法
今天虽然已经有很多很好的算法,但是我认为算法在继续再往前创新。像最近很多的对抗学习的东西,很多新的算法还是源源不断地出来。所以说这个门槛会越来越高。
那就谈到我为什么加入今日头条。其实我也是这两三个月才对今日头条有更深的理解。我真的必须感谢创始人张一鸣,他把今日头条的整个发展跟对这个公司到底是怎么样一家公司,他在我第一次见面的时候,用了大概四个小时,我们从8点聊到晚上1点,我全部听懂了,那次我大部分都是问问题,都是听。但是他基本上讲完之后,我就觉得居然这个世界有这么一家公司在做这样的事情。
从我的角度,我看到的头条就是一家接下来重新定义信息跟内容的平台。在这个移动为先的时代(不光是移动互联网)重新定义信息内容的平台,AI的技术内容怎么被创作。
信息的源头今天有很多头条号做着,不管是大的媒体、自媒体还有个人。从创作的源头其实就可以用AI来帮助他。例如说今天很多的短视频,现在的年轻人用社交媒体创造出很多的作品,其实可以用很多原来的多媒体处理,帮他弄得更眩,或者说让他在产生的过程门槛更低。所以从信息的创造就可以AI化。
信息的分发当然是头条现在的核心,这种推荐引擎,所以在分发上已经有很多AI算法做得很好了,但是将来我们也会有很多源源不断的新技术帮助公司。
在信息的消费方面,人怎么浏览。现在因为在手机上这种大量的碎片时间,而且很多信息的需求其实不是靠简单的搜索和10个网页或者3个网页就足以满足。所以在消费信息和内容这块儿AI也可以。
还有互动社交。我在搜索领域这么多年,我一直想把社交和搜索结合,没有一家公司做成功,谷歌就缺少社交的基因,Facebook缺少搜索。但是到底社交和搜索是一种什么样的形式呢?我居然看到今日头条就是一个对的形式了。所以我觉得今天头条有这么大的数据,有人找信息、信息找人。它在中间链接他们,有大量的用户群、用户使用时间,年度非常高。它还有无数的应有场景,不断地闭环,那就需要AI基础设施和算法了。所以为什么AI技术跟AI实验室,对于今日头条会是接下来的发展一股关键的力量。
高欣欣:雷鸣老师是特别有名的天使投资人,但是可能大家不知道,他是特别早就坚定地支持着人工智能。而且最近他做了一件特别伟大的事情,他在北大建立了人工智能的创新中心,开始培养下一代的人才。雷鸣老师,我想请教您,今天人工智能如火如荼,但是真的是要等待很久的时间,其实才可以一步步地落地,太多问题要解决了。在这个等待的过程当中,我们应该做好哪几件事情,才能更快地、更好地迎接那个美好的未来呢?
雷鸣:人工智能时代会不会很久远,但需要很大的耐心。首先我觉得创业最重要的就是看准未来的方向,因为未来有多久有时候很难讲,有时候可能会非常快,有时候可能会非常慢。
今天我们看到美国的一些伟大的企业,其实最重要的还是你要认准一个未来要坚持下去。有时候剩下的事情我觉得很多真的是看运气的,像我第二个创业做了音乐,音乐这个产业确实等了很久,现在同我2005年做到现在是第12年,当然我现在已经不在那边做太多的事情了,应该说还没有到最黄金的时候,不过看到一些起色了,所以像这个产业就慢。
但是我们也相信互联网会把这个产业改变掉的,现在也有很多的变化。
回过头来讲人工智能,我觉得第一个是你还得要有一个坚定的信念。你拿人工智能要解决什么问题,到底有没有用。那这块儿我觉得给大家打打气了,我是觉得跟很多的专家包括产业的一些里边的人聊,我们觉得人工智能未来的话一定会深刻地改变几乎所有的产业,然后变成一个基础设施性的东西。
第二个点,我们觉得人工智能可能会一开始在2B的领域发力,就像百度一开始是2B的,阿里巴巴也是2B的,因为这块儿营收上可能看得见。我们觉得最后最大的机会还是来源于2C,最后可能在任何一个产业,最终会穿透那个2B的前沿,然后直接2C。一旦2C之后的话我觉得这个体量就会非常非常地大。
刚才咱们聊到自动驾驶,可能一开始觉得2B,甚至说最后卖个车。但是我们演进完了之后,我们觉得驾驶会变成交通的一个出行服务,它是一个2C的公司,所有的用户直接坐他的车就完了,然后这个公司用的车越多,他的调度算法越灵活,他的数据越大,他的服务效果越好,他的经济利益就越好。所以说这个竞争最后会使得各个地域都会有一个巨无霸的企业,它是2C,管出行的,使得从前往后全部被整合。
再说到医疗,现在我们生了病去看医生。但如果我们能够做一个虚拟医生,跟医生一样好,比所有的医生都好。很多人说那我还是不相信他,但无所谓,你总会相信他的,因为事实摆在面前。当你找不到专家的时候,当你发现专家还没他好的时候你就相信他了。而且他还能全部收拢到一块儿,因为医生没有办法被整合,但是虚拟医生可以。
当所有的病人有病第一个都去找他的时候,那整个产业完全变了,它可能又变得跟阿里巴巴、百度一样了,这种企业或者说美国的谷歌这种,他是2C的,他拿着所有的用户,他会重塑整个产业的后端链条。
但这些都是看得很远的一个趋势和变化。我觉得作为创业者的话,所谓的创业者模型应该是一个哑铃模型,就是远要看到很远——那是你对未来的一个理想,你的愿景,你到底想解决什么问题、提供什么问题,,但同时又要看得很近,反而中间不要想太多。我们经常说一个创业公司不要搞什么一年、两年计划的,毫无用处。你就想清楚这半年做什么事儿,把它做成就完了。另外的事情,想5年、10年以后到底是什么东西,那个东西在指引着你的方向,使你的价值、使你的公司决策的时候不至于走偏。而近端的话,踏踏实实地把每一步都走对就行了。因为一年两年后的东西,你现在做了计划,到时候你再一看那些计划都是垃圾,因为市场、技术、竞争所有的东西变化太快了。
Part 2
▼▼▼
接下来是来自将门技术分享垂直社区中的朋友们提出的问题。
1
高欣欣:第一个问题请问张建中先生,未来人工智能计算中,GPU和FPGA格局会如何演化?您对通用人工智能架构有何构想?
张建中:讲到GPU和FPGA,所有的chip(芯片)只是chip,对我们来讲刚才谈AI有三个因素:
· 计算力
· 数据
· 算法
这三个当中没有一个东西只是芯片,计算力跟芯片不是等同的,两个是完全不一样的。
作为一个AI的处理器或者说AI的计算平台,它的核心是要把算法跟数据结合在一起,中间经过的各种各样的计算平台,无论今天你是用什么样的架构(framework)做训练或者影响,你都需要有非常多的丰富的计算平台当中的软件、硬件的结合。这些SDK你去支持TensorFlow 也好,你去支持Caffe 也好,你去支持LSTM也好,你去支持各种各样的GAN也好,或者CNTK也好,这些所有的框架它一定要有相应的加速软件去帮助他加速,如果不能加速,其实我们人工智能的发展会停留在60年前,这些算法其实存在很久了,我们不是今天才能有的。
正是因为有强大的计算力推动这些算法去发展,这样的架构才能够帮助AI去实施我们今天达到的成果,其实是很不容易的,NVIDIA大概在过去的10年当中让GPU的计算力提升了1500倍。这个世界上所有的芯片设计,无论是哪种架构,没有一个芯片能够在10年当中提升他的计算力1500倍。并且这个速度就像刚才我们看到的,它还在加速,不停地加速。这个世界加速是不停的,只要你停止就意味着死亡。
所以说你要想去把这个架构做得更好,只有一个方法就是去不停地优化它的架构,让它计算得更快。
GPU下一代架构NVIDIA我们都知道了叫Volta,那我们在接下来的5月份,会在美国发布新的计算架构芯片。一年一度的GTC就是针对于GPU的技术发展,从各个不同的角度去优化它的计算平台的性能,无论你是在做训练或者影响都是一样的。
刚才水成将的很好,在训练的时候可能不惜一切代价,让它算得很快,功耗无所谓,只要算得快就行,但是到影响的时候,我们的模型要小,我们的功耗要很低,然后我们还要算得很快,还要做得很准。因为当你的精度不够的时候。这个AI就像刚才我们讲的,都要变成动物了,那就没有用了。所以它是有一定的门槛的,那这些门槛的对这个影响的作用也是一样的,你必须得达到一定的精度我们才能去用,否则的话这些技术放到今天,我们AI应用当中就是没有价值的了。
那从这些所有的架构当中,我们研究了几乎所有的架构。其实你不管它是叫GPU也好,叫FPGA也好,你最后的就是我们要做深度学习的处理的。那我们可以讲,今天的这个GPU恰恰是在目前架构当中最合适的,无论是用来做训练还是用来做影响,最佳的芯片,处理器的架构。
那在今后这个架构往哪个方向变,是不是叫GPU,你可以叫它是GPU,其实我们可以叫它是深度学习处理器,你要问我的话下一代架构我不叫GPU,可能GPU是我们以前的名字,就像以前我们叫微软研究院,今天有将门,其实都是同一批人,但是同一个架构的演变当中,以前GPU的名字叫图像处理器,20年后,GPU早就不再是以前的GPU。如果拿今天NVIDIA的架构叫做Pascal,跟第一代用来做定点渲染引擎--那个专门做VGA处理器的话,两个架构是完全不一样的。今天的GPU基本上是一个并行计算器,而且100% 可编程,以前是不可能的。
那我们讲20年前那个也叫GPU,今天也还叫GPU的话,下一代还叫GPU的话,那我们可以持续地用这个名称,但是你要问我的话,下一代已经就是深度学习处理器了。
所以FPGA也好,GPU也好,无论是谁,只要你想做人工智能行业,我们必须要专门为这个行业定制处理器。所以NVIDIA下一代处理器你完全100%地可以讲,它就是一个AI 处理器系统,我们在这上面就要搭建一个AI的平台,这个平台不只是芯片的,包括周边的设备,你会看到NVIDIA我们做一个N2N的解决方案。我们有第一个产品叫做AI 超级计算机,很多人可能没有听说过,叫做NVIDIA DGX,DGX1是第一个,在全世界我相信也是第一台基于AI的超级计算机,这个AI 超级计算机我们在中国已经有很多用户开始使用了,他的设计就是专门用来做AI的,它的工作就是AI运算。
在这个超级计算机的基础上,下一代我们要做的是,在超级计算机硬件的基础上,去增加很多数据的处理的能力,所以你可以看到它的支持的内存的速度,它的总线是NVLINK,不是我们的PCIE。在数据和数据之间的通讯,在GPU跟GPU之间的连接,多GPU和GPU Cluster之间的连接,都是专门用来设计做大规模计算处理的一些系统架构。
那当然只有硬件是没有用的,你必须要做很多的训练框架,就像CNTK,我们一定要100%加速,还要让它加速得很快,你就要有它的中间件,我们就要支持caffe,我们要去优化caffe,做成NVIDIA caffe,我们要去支持tensorflow,我们就要有专门NVIDIA Tensorflow去加速的这个Tensorflow的速度。
所以你可以看到一系列的软件过程是经过了很多年的积累下来。当然这些还不重要,重要的是如何让我们更多的人才,让我们所有的初创公司很快地用上这些工具,这个是最关键的。所以我们要有教育系统。
NVIDIA专门设立了一个培训学校叫做深度学习学院(Deep Learning Institute),DLI是NVIDIA在全球推广的一个项目,我们在全球几乎18个国家要去做培训学校,培养深度学习的人才。而这些人才我们肯定会跟北大这样的研究机构、培训机构去培训我们未来的天才,我们也不能只是靠小文帮我们培养在中国的人才,我们也是希望扩大我们的这个培训的机构的能力,让北大、清华、交大,各种各样的大专院校、科研机构在中国培养本土的人才,这样的人才很缺乏,我相信在今后的这一段时间当中,几乎所有的计算机专业的人,学数学的、学物理的,都会成为深度学习的专家的。那这些平台的培养、人才的培养、系统的软件、硬件的架构结合,我相信才会帮助我们把深度学习用在人工智能当中,同时让AI达到一个新的阶段。所以我希望大家不要再去看你是GPU、FPGA还是ASIC,只要是处理器,他要想做人工智能,你一定要为AI定制。
我希望我们的AI的处理器跟超级计算机能够帮助到每一个人。
2
高欣欣:下一个问题是问铁岩博士的。如何看待人工智能技术商业化,我们有哪些新的机会?
刘铁岩:这是蛮有趣的一个问题,分享一点我的看法。首先声明一下,我不是投资人,也不是这个产业创投企业的从业者。所以有机会给大家提供一些和你们脑子里想的不一样的观点,或许有点意思。
因为我是做机器学习的人,所以想什么问题都是从优化的框架想,我们做得所有的事情都是一个有约束的优化问题。
对于人工智能的商业化前景,如果用这套思想想,无外乎两件事:
· 第一:人工智能技术的价值在哪里?就是我的目标函数,你有没有Value?没有Value的话,肯定没有用。
· 第二:约束,你的边界在哪里?换句话说,人工智能的风险在哪里?责任、归属怎么界定?
这两件事情要想清楚,可能就知道我们在人工智能、技术商业化的途径中,哪一个点是值得投、值得发展的。
举几个简单的例子,说到价值,大致会有两种:
· 雪中送炭的价值。这个东西如果没有人工智能技术,就是做不了,我们今天做起来很费劲,耗时、耗力、耗材,搞不定。有了人工智能技术,可以带来一个颠覆性的变化,这一定是雪中送炭的技术。
· 锦上添花的价值。听起来噱头很足,有了它真好,但是没有它又会怎么样呢 ?
所以我也希望投资人包括创业企业的人,多想想这个问题。举个例子,开豪车谁都愿意,但我开一个国产的中级车也挺舒服。所以这是在面对一个技术要落地化、产业化时需要思考的问题。
我们现在有太多行业跟AI有关,比如视觉、自动驾驶,甚至AR、VR各种各样的。是不是每一项技术都能带来雪中送炭的价值,不见得。举一个像VR、AR的例子,如果真的能实现全息通信,我们可以设身去做教育,这些东西可能真的改变人们跟世界打交道的方式,那叫雪中送炭。如果你拿AR、VR去玩个游戏,多半就是锦上添花,这是一家之言。
其实约束这件事情也很重要,一个人工智能技术的风险在哪里?如果出了问题,谁来界定责任?谁来承担责任?刚才大家都提到自动驾驶,我其实也希望某一天自动驾驶这个时代真正到来。作为用户,我总有一点小小的担心。比如人工智能自动驾驶技术真的出了问题,就不是小问题。大家也看到很多新闻,有很多用户因此丧命。这些技术出了问题之后,这种风险怎么控制?由谁买单?是技术买单还是运营公司买单?是不是最后有一天,大家期望人工智能技术,可以完美解决自动驾驶,因为一点小的瑕疵,就众口铄金,所有人就开始攻击人工智能的冬天要来了。
所以这一切的东西,可能都需要人工智能的从业者产业化过程中每一环的从业者认真思考。只有我们有责任、仔细、严肃地面对这些问题,我们才能护航人工智能的产业化越来越走向春天,不要因为我们自己的失误、大意,我们的overpromise,使得这个行业遇到不应该遇到的困难。
3
高欣欣:接下来请问芮勇博士,后PC时代,联想有没有想过什么样的新型计算平台?
芮勇:肯定想了很多的新型计算平台,刚才铁岩提到AR、VR,有的人可能把它当成一种锦上添花的,但是真喜欢的人就是雪中送炭。
关于AR 设备,其实去年联想出了第一款真正意义上三维的手机,叫Phab2Pro,后面有很多摄像头。你可以想象,我拍大家的时候,可以把大家的场景搬到这个舞台上来,把家里、办公室的场景搬到这个舞台上来。这个是一个人工智能后PC时代的产品。今年一月初的CES上,我们也发布了第一款智能音响,今后联想在智能家居、智能家庭、智能办公上还会有更多的设备出现。
今天几个朋友聊到AI发展趋势几个元素,我觉得今后AI要往前发展,第一个可能还是算法。举一个例子,在深度学习出现之前,余凯其实做了一个非常好的算法,在深度学习出现之前是拿第一名的。后来有新的算法出来以后,很快把错误率往下降了,所以算法的力量,还是不能小瞧的。每一代算法的迭代,都带来整个技术不是这样的上升,而是平台式跨台阶的上升,所以我们不要小看算法的力量。
其实深度学习就是一个换了马甲的人工神经元网络,我记得我自己写的第一个人工神经元网络,大概是在80年代末、90年代初的时候。那时候只有一层隐含层、一层输入层、一层输出层。为什么今天叫深度学习?因为隐含层的数很多。人工智能要往前推进,算法的力量我觉得是一个因素。
第二个因素是数据。我曾经在清华做了一个华东四省电力负荷预估的事情:第二天华东四省水电和火电这些厂,合起来要发多少电?又不多发也不浪费,也不能少发,怎么预估?当时就用了人工神经网络做的预估。
当时我觉得自己很牛,数据很多,我从四个省拿了两个月的数据去训练。但是今天大家一听两个月的数据都会笑,因为今天一个深度学习的网络,光参数几百万。我当时就一层,是一个浅度学习,那时候是可以学的,因为没有更多的数据,没有办法做深度学习。这是第二个,所以数据也是非常重要的因素。
第三个因素是计算力。以前,如果今天训练我们的深度学习,可能算几个月都没有办法收敛,可能算一年都没有办法收敛。那你怎么调整你的参数?所以强大的运算力,是使得机器学习、人工智能再往前发展一个很重要的因素。
第四个因素可以帮助人工智能发展,并且真正在产业界有作用的,是要它能落地。前面的几个大潮,它本身就是一种产品、服务。比如搜索引擎它就是一种服务,比如说社交网络就是一个产品、服务。但人工智能本身并不是一个服务,它要落到地上,和产业相结合。不管To C也好,To B也好,人工智能真正要对我们社会发生效应,一定要和某一个产业相结合,没有和产业相结合,我觉得很难往下做。
这个产业就要有很多垂直领域的知识,我记得在微软的时候,还和中科院的植物所做过微软识花这么一个项目,很有意思,如果我们只是一帮深度学习的人去训练怎么识花,我们识别效果不会好。只有植物所的专家会告诉你,识花要看它的叶、蕊、径是什么样,这些专业领域的知识加在一起,你才能真正做出一个非常好的系统,所以要接地气。
所以总结四个方面可能对人工智能的发展会很有好处:
· 算法本身的提高。
· 更多的数据。
· 更强的计算量。
· 和垂直领域相结合。
4
高欣欣:问颜水成博士的这个问题与创业相关。一个人工智能团队,在创业公司百亿级美金的公司和千亿级美金公司有什么区别?
颜水成:这个问题蛮有意思。我觉得差别真的蛮大的,你在初创公司,一个人工智能的团队,往往只能专注于单一的业务。而且这些人工智能成员,都是一种非常拼命的状态。
但是如果你到了百亿级美金的公司,其实这种公司可能不会像每一个业务都会建立起人工智能的团队,去解决他们的问题。这时候人工智能的团队,更像公司一个智囊团。这时候你要特别小心,有可能不同的业务部门,只要碰到跟人工智能相关的问题,就觉得你的团队能解决,这是百亿级的公司。
千亿级美元的公司其实是不一样了,它的业务已经非常的庞大,而且每个业务线往往都会组建自己人工智能的团队。比如我待过的一个公司,它同样的团队就有七八个。那么当这个公司有一个业务部门想要做某一件事情的时候,意味着这七八个团队相互的PK,最终希望能胜出,然后方案为公司所用。
这可能是我观测到三个量级公司的差别,可能这对于一个刚毕业学生选公司可能非常有价值。如果你就想一门心思做好一件事,创业公司不错;如果你想学到非常多的东西,想在不同的业务里,都有一个很好的锻炼,也许百亿级的公司非常不错。
5
高欣欣:关于维英博士的问题是,如果我们想做出有思想、有温度的AI,当前最大的障碍和技术瓶颈在哪?需要满足什么样的条件才有可能实现这样一个愿景?
马维英:我觉得人工智能接下来最大的挑战和机会,我觉得在自然语言理解。人跟万物不同就是语言能力,用语言描述这个世界,各式各样的物体、概念和知识。我觉得如果人工智能能够做到把自然语言理解跟自然语言生成两件事情,如果能够做到一定的高度和效果,就会对很多的应用产生翻天覆地的变化。
这种自然语言理解和自然语音生成在今日头条是一个绝佳的实验场和应用的场景。举个例子,头条问答。其实我的团队在微软亚洲研究院的时候,也做了很多的问答,小冰也尝试在里面回答问题。所以我在问答的领域一直在寻找,怎么真正做出有用的,其实就需要数据。
很多时候,更细腻度的自然语言理解,光这种大的标注,其实没办法理解到很细。头条有机会把问答这件事情,比如今天我们在很多阅读的内容里,不知不觉你的很多信息需求其实可以靠一个问题表达,你可以用一个问题说出你想要找什么,而且这个问题也不光你问过,其实也有别人在网上问过。而且这个问题可以找到一个专家,他是最适合回答这个问题的头条号作者或者自媒体。
其实这样一个问题和答案,在头条的平台上是一个快速增长,而且人工智能可以进来帮助,让他们先回答看看能不能回答出来。如果不能再找专家,甚至专家写完之后,我们还可能找谁可能对你这个问题感兴趣,甚至可以再帮你写作。
这里面我觉得应该接下来有机会拿到更大的数据,我们可能在问答领域先尝试做一点重点突破。如果能够把全中国,比如一个兆级的Q&A对都找出来建立一个库,就已经很有用了。对自然语言的理解,也就造就了第一阶段的训练样本,我觉得机会很庞大。
6
高欣欣:群友给雷鸣老师的问题有些“麻辣”,如今国内的AI人才供不应求,价码据说已超越国外,以投资的眼光看有泡沫的迹象吗?投资者如何评价一个新创企业的技术实力?如何为这一部分估值?
雷鸣:首先说一下AI人才价码很高,这个确实。我觉得客观的供需关系决定的,因为现在确实人才稀缺,所以我觉得如果大家还在学校读书,就好好学学。如果已经工作,也要找一些机会学一下,因为我觉得未来包括编程都很难讲,10年以后程序员是不是跟现在一样写程序?所以可能不懂AI,将来或许你作为技术也有可能冒着失业的风险。
那估值是不是过高?还是客观的讲下数据。现在同类型的企业,在湾区和中国,我们看创始团队差不多的情况下,基本上中国的估值可能是湾区的2-3倍。同理我觉得还是供需关系决定的,如果作为创业者,你在这种环境下,你该拿钱还是要拿钱的,因为你有竞争对手。如果他两三倍的拿,你很谦虚的拿,你可能打起仗来很难受,我觉得这是一个。
另外,很多人说是不是泡沫,会不会高潮之后就下去了?我个人的观点是,过去也有AI的起伏,先是很火然后不行了。我特别相信经济学,一个是社会的进步是持续的,二是价格围绕价值在波动。
我觉得AI本身现在我们能看到,它的价值在快速增长,包括现在最新的突破,包括看到现在的无人车,现在看预期5年左右。另外医疗上,最近医学影像这方面突破非常多。我们看到它是非常具体的,并不是一个想法,是真的解决了很多的问题,而且都比人好了。
所以我觉得应该非常相信这一波,它从价格上是一个持续上升的。那价格就是供需关系决定的,可能这一段时间,真的创业也不多,专家又很少,但是大家拿着钱都觉得,AI时代来了怎么办很恐惧就都去投,自然就高了。
所以回想起来,我想起互联网从大概1996-2000年的泡沫,当时纳斯达克指数好像从1000点左右一下涨到5000多点接近6000点。所以这个事情会不会在AI上重现?其实不是特别清楚,我觉得以也许有可能。但是回来看互联网,虽然泡沫破了,但是互联网对社会的影响还是真实的,还是继续发展的。所以这里面我觉得第一未来是不会变的,只不过中间有起伏而已,这是我的第一个观点。
第二个观点,希望大家做事情还是要务实,别赶着泡沫就捞一把,破的时候也跟着没了。所以找到你真正要做的实际价值,在高的时候你融一些钱,但是还是要做实事。所以沉淀出来你真正的实力,在泡沫破的时候,你还能很好生存下去,我觉得这个可能是比较重要的。
那么在估值的时候,对技术这块怎么估值?我先说大体上VC主要可能还是看硬的条件:比如一般说这个人哪个学校毕业的?然后在哪个大公司的岗位干过什么事情?比如微软首席科学家这出来肯定低不了。第三个看这个人做出的成果,比如发过多少篇顶级论文等等,解决过什么问题。所以你的出身很重要,第二是你实际做出来的东西。
但是这块我想说,其实现在很多VC也慢慢意识到一个问题,创业本身不仅仅是一个技术问题。我们如果回想过去互联网创业,也不是谁的学历高,谁出来就成功。刚才芮勇博士讲的特别好,得解决实际问题。就是说你创业出来不是发论文的,你是做企业的,你要拿客户要能够有收入,这样你必须要针对一个具体的领域做出一个真正有用的东西,在这一点上,我们发现很多的企业可能还是有所欠缺,一堆技术的人出来说,我们有一个技术,你看全球最好,所以我们看看能干什么。所以建议最好技术人员找一个行业里面有经验的人,既懂技术又懂产业需求,这样我觉得可能走起来会心里更踏实,投资人心里也舒服一点。
高欣欣:经过今天的嘉宾分享,我相信大家都看到了,每位嘉宾都深深相信技术创新将带来行业的剧变,将带来世界的剧变,让我们一起有信心、有耐心,一步一步做实事,去迎接、去创造那个美好的未来!