首页 行业资讯正文

【大咖云集硅谷AI大会】人工智能商业化的趋势与挑战

Robin.ly 是立足硅谷的AI视频内容平台和社区,服务全球工程师和研究人员,通过与知名人工智能科学家、创业者、投资人和领导者的深度对话和现场交流活动,传播行业动态和商业技能,打造人才全方位竞争力。

人工智能(AI)技术的快速发展激发了广泛的行业创新,金融、零售、教育、出行……几乎所有产业都正在进行或即将迎来智能化革新。在技术持续发展和资本大量涌入的2019年,AI应用的落地及推广愈发成为产业关注的核心问题。

6月1日,Robin.ly的半年度会议“人工智能商业化的趋势与挑战”在硅谷计算机历史博物馆成功举办。本次活动聚焦当前人工智能技术在自动驾驶、机器人和教育等产业的应用和商业化经验。

编辑

Robin.ly硅谷2019人工智能商业化大会

本次会议邀请到通用智能机器人公司Vicarious AI联合创始人兼CTO Dileep George、明星自动驾驶创企Drive.ai联合创始人王弢、教育科技公司流利说硅谷AI Lab主任刘扬分享了他们在各自领域的AI实践。在专题讨论环节,商业自动驾驶车队智能管理公司Nauto的CTO Ruslan Belkin、激光雷达公司Quanergy的CEO及联合创始人Louay Eldada、交通服务应用平台Ridecell自动驾驶部门Auro联合创始人Nalin Gupta 等人就自动驾驶的未来发展问题进行了精彩讨论。近300名来自硅谷科技公司和高校的工程师、研究人员、学生、创业者及投资人参与了本次活动。

1

AI技术商业化是大势所趋

Robin.ly和硅谷最大AI猎头公司TalentSeer的创始人Alex Ren在欢迎辞中表示,商业社会的范式正从“软件吞噬世界”逐渐转向“AI 驱动世界”,与20年前软件和互联网技术的商业化一样,AI技术的商业化是今后势之所趋。然而,高达97%的创业公司活不过种子轮,而完成A轮融资后也有89%的公司难逃倒闭。

编辑

Robin.ly及TalentSeer创始人Alex Ren致欢迎辞

“创业失败往往不是因为没有技术或者缺乏激情,”Alex Ren说,根据他作为AI人才顾问及投资人在过去3年对200多家公司的观察总结:“失败最重要的三个原因是:没有找准市场需求,没有保证现金流,和没有组建好团队。”

要将技术转化为产品,成功推向市场并得到消费者的认可,除了研发、产品和工程的能力,还需要领导力、企业经营、对智能产业洞察等超越工程师和研究人员技术专长的基本技能。

“这也是我们举办这次会议和我创立Robin.ly的原因,”Alex 说:“Robin.ly旨在打造一个汇聚工程师、研究人员、商业领袖和投资者的内容平台和社区,帮助下一代AI领导者在新技术时代取得成功,推动AI商业化的进程。”

2

王弢:AI在自动驾驶中的挑战与机遇

王弢在人工智能、计算机视觉、机器人领域有10年以上研究经验,在斯坦福攻读硕士和博士期间师从吴恩达。他在研究生和Google实习时看到了深度学习对计算机视觉带来的巨大改变,博士在读期间便与同学共同创立Drive.ai,这也让他成为最早一批将深度学习用于自动驾驶领域的研究人员。

Drive.ai王弢谈AI在自动驾驶中的挑战与机遇,Robin.ly AI Commercialization 2019

编辑

演讲中,王弢介绍了大规模深度学习在自动驾驶领域的应用,比如车道注释、车辆检测、车距检测和路面检测。L3技术在当下已经相当成熟,而L4的商业化存在技术、法律和经济三方面的挑战。

在技术上,王弢认为深度学习存在致命的局限,因为罕见案例(rare events)的数据极难收集,而包括致死车祸在内的安全隐患恰恰就存在于数不清的罕见案例之中。深度学习“黑盒子”的特性让人无法通过逆向工程来预测结果,再加上数据的对抗性攻击,仅仅是改动图像中的几个像素,就可能让计算机完全识别不出路上的行人。现有技术还无法做到让车辆在完全脱离人类控制后也保证100%安全。

编辑

【图说】深度学习在自动驾驶领域的局限:数据的长尾效应,包括致死车祸在内,越是罕见的案例数据越难收集。来源:王弢,AI in Autonomous Driving: Challenges and Opportunities,Robin.ly AI Commercialization 2019

至于法律法规的制定,如今事故的责任归属还没有统一的定论,这在某种程度上也打开了一个安全缺口,对车辆路测的限制条例也在讨论之中。最后,L4自动驾驶的成本也十分高昂,包括前期的研发投入和后续的运营成本。

对此,王弢认为除了在实践中探索,我们还需要经得起理论验证的方法,他目前在思考的一个问题是,能否用一个数学公式来统一表达不同的驾驶场景,从而形成更完善的自动驾驶理论。另外,将问题限制在一定范围内,比如只运送货物而非人类,能在一定程度上简化特定场景下的自动驾驶问题。在对车辆类型的选择和车内有效空间的利用,都对降低成本起到一定的帮助作用。

3

刘扬: 深度学习时代的语言处理

流利说硅谷AI Lab主任刘扬博士曾任得克萨斯大学达拉斯分校教授,并先后在Google、Facebook 担任研究科学家,她在机器语音和自然语言处理领域发表了140多篇会议和期刊论文。此前Robin.ly曾对刘扬博士进行过专访,讨论了她从学界转向产业界以及将技术应用落地的体验。

编辑

流利说刘扬谈深度学习时代的语言处理,Robin.ly AI Commercialization 2019

她的演讲从我们熟悉的Amazon Alexa、Google Assistant、Apple Siri等工业应用切入,介绍了语音和NLP领域的一些当前最优结果,比如Google Duplex媲美真人的发音,在智能手机上做实时语音识别,以及机器问答达到人类水平——不久前,科大讯飞使用基于Google BERT、自编码器和自研的注意力模型AoA(Attention-over-Attention),在斯坦福机器阅读理解数据集SQuAD 2.0取得了略优于人类平均水平的得分。

刘扬博士接着讲了深度学习在NLP中的应用,其中一个重大的技术突破是word2vec,通过将语义映射到向量空间中,让我们能用数学语言表达词语的含义。此后,深度学习逐渐用于文本标记和分类、语言建模、句子表示等多种NLP任务。接下来,序列到序列(seq2seq)模型、注意力模型,以及2018年的Google BERT,深度学习不断在NLP 取得成功。

编辑

【图说】Google BERT全称是BidirectionalEncoder Representation from Transformers,即“双向Transformer的解码器表示”,模型的主要创新点在预训练(pre-training)方法上,使用了Masked LM和Next Sentence Prediction两种方法分别捕捉词语和句子级别的表示。Google BERT表明对语言模型进行双向训练是可行且有效的。来源:刘扬,Language Processing in the Deep Learning Era,Robin.ly AI Commercialization 2019

但刘扬博士也补充说,如今一些先进 NLP 模型表现虽好,方法并不简练。在谈到当前的挑战和未来发展趋势时,她认为接下来迁移学习将是 NLP的重点研究方向,因为它能有效应对缺乏标记数据的问题。此外,结合知识库、背景信息和常识,构建可解释的模型和多种模型结合也是未来值得探索的方向。

4

Dileep George: 机器人时代的人工智能

Dileep George博士是著名的人工智能、神经科学专家和创业者。他毕业于斯坦福大学电子工程专业,曾和神经科学大牛、《人工智能的未来》作者Jeff Hawkins共同创建了机器智能软件公司Numenta。2010年,他与Scott Phoenix共同创立了Vicarious AI,致力于开发拥有人脑级别的视觉、语言和自动控制系统的高等智能机器人,这家初创公司获得了众多科技大佬的投资,包括Facebook创始人Mark Zuckerberg、Tesla创始人Elon Musk、Paypal的创始人Peter Thiel、Amazon创始人Jeff Bezos等。

编辑

Vicarious AI Dileep George谈机器人时代的人工智能,Robin.ly AI Commercialization 2019

George博士在演讲开场提出了这样一个问题,在廉价的发动机、传感器、电池、处理器和塑料等素材已经唾手可得的2019 年,为何我们还是无法制造出早在1962年动画片《杰森一家》(The Jetsons)里描绘的机器人女仆Rosie那样的家庭机器人?

George博士指出,一个主要原因在于如今的AI都相当于“old brain”,也即水母、鱼类、两栖类、爬虫类、啮齿类和鸟类的脑。要实现 Rosie 那样的机器人,需要具有新皮层(neocortex)的“new brain”,即哺乳动物的大脑。不具备推理、认知等高级功能的AI也被称为“狭义 AI”,需要海量的训练数据,然后通过少量的测试数据“学习”。通用AI则能够在接受少量训练数据后,举一反三,得到近乎于无限的测试数据集,并且达到像人一样的鲁棒性。

编辑

【图说】“old brain”和“new brain”:通用 AI 需要哺乳动物所拥有的“new brain”,具备推理、语言和意识等高等功能。来源:Dileep George,AI for The Robot Age, Robin.ly AI Commercialization 2019

George博士以Vicarious AI的两项研究为例,介绍了他们开发的新型 AI与普通深度神经网络的不同。首先是2017 年在《科学》杂志发表的攻破 CAPTCHA测试的论文。CAPTCHA测试作为验证用户人类身份、保护网站不受机器攻击的经典方法,曾被证实机器的通过率仅为1%。Vicarious AI将神经科学的发现引入生成组成模型框架模拟人类的“常识”,这样得到的新型 AI在Google发布的网络机器人识别工具reCAPTAs上准确率达到66.6%(字符级准确率可达94.3%)。George博士表示,从少数例子中学习和扩展的能力是人类智慧的标志,这项研究对于研发通用AI有重要的启发。

另一篇2019 年初发表在《科学-机器人》上的论文,介绍了他们开发的能够理解“概念”的机器人。当人类看到一组有规律的输入-输出对时,能够从数据对中推导出相应的规则。在这项工作中,他们引入了一个复制人类概念学习的计算框架。这里的“概念”被表示为一个计算机程序,包括视觉感知系统、工作记忆和动作控制器。计算机的指令集具有解析视觉场景、引导注视方向和注意力、想象新物体、操纵视觉工作记忆的内容,以及控制机械臂运动的指令。机器人对概念的推理就是将输入转换为输出。George博士说,通过将心理意象、感知符号、体验认知和指示机制等认知科学思想引入机器学习领域,他们距离构建拥有常识的机器人又进了一步。

5

专题讨论:自动驾驶与智能交通的未来

在专题讨论环节,多位自动驾驶相关初创公司的创始人和CTO与Robin.ly及TalentSeer创始人Alex Ren就自动驾驶和智能交通的未来发展做了精彩讨论。

编辑

参会嘉宾都认为 L4-L5 自动驾驶终将实现,问题只是时间。刚从中国访问归来的激光雷达公司Quanergy的CEO及联合创始人Eldada表示中国尤其是政府在智慧城市、智慧交通等自动驾驶相关的基础设施建设方面大幅领先美国,这一观点得到了Ridecell自动驾驶部门联合创始人Gupta和自动驾驶智能管理公司Nauto CTO Belkin博士的认同,后者还指出在基础设施方面硅谷有望落地的只有私人投资的自动泊车。但王弢博士认为,基础设施建设并非越多越好,因其成本极高,应该考虑投入产出比,并非所有问题都需要通过建设基础设施去解决,例如能通过某种方式让行人无法横穿道路,就无需考虑行人检测的问题。

Tesla CEO Elon Musk的“激光雷达(LiDAR)无用论”遭到了Eldada强烈反对,他认为在技术上LiDAR是唯一的3D传感器,从成本上其造价也在逐步降低。王弢也认为,不使用LiDAR就无法真正做到无人驾驶。Gupta和Belkin博士则给出了相对缓和的观点:前者认为安全第一,如果Tesla真能做到当然很好,但目前看我们仍然离不开LiDAR;后者则表示从成本角度出发,结合特定场景(比如运货而非载人),不用LiDAR虽然风险系数更高,但成本也会更低,因此Musk所言并非毫无道理。

嘉宾还讨论了如何让司机信任自动驾驶设备和如何在保证安全的情况下大胆创新的问题。嘉宾认为尽管事故责任归属越来越多地被划分到自动驾驶汽车制造商乃至出行平台身上,但安全与创新两者并不相斥。王弢博士指出,关键问题是需要制定一套安全合理的测试规范,否则目前所有的自动驾驶路测实际上都是在用人的生命做实验。

最后,就自动驾驶商业化道路选择,Belkin博士以Nauto管理车队数据为例,表示为自动驾驶公司提供工具或服务本身就是一种盈利方式。王弢对此表示赞同,但也指出“只有真正有金子的时候卖铲子才能赚钱”,关键还是要占据产业链上最具价值的点,无论是客户渠道、关键技术还是其他,否则将会陷入残酷的价格战。Eldada先生说,实际上当前亟待解决的一些问题在技术上也是最容易解决的,因此诸如自动泊车、交通拥堵预测等应用,自动驾驶商业化已经在发生。Gupta博士总结,自动驾驶将颠覆各行各业,当这一问题被真正解决后,赚钱可以说是最不需要担心的问题,当前行业应该聚焦如何让自动驾驶更加安全。(完)

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论