菜单导航

第四范式戴文渊:先知登场

作者: 小思瑶 发布时间: 2021年10月12日 18:23:18

  风口不会随便眷顾一个人。因为历史不会对默默“打怪升级”着墨,它只看结果。

  在阿西莫夫的代表作《基地》中,除了先知谢顿贯穿全线,其他主角都是门徒。他们内在为直觉所驱动,外在被时代所推动。他们在历史上的出场毫无征兆,却在潮流中游刃有余。你会惊叹,为什么是他?

  离开谷歌、微软、IBM、Facebook、阿里、百度,告别自己过去的所有荣耀,重新走上创业之路,崇尚技术的护城河。为什么是他?新华网开辟“出走的门徒”系列,讲述这样一群科技界理想主义者的现实路径。

第四范式戴文渊:先知登场

  从五道口出发,大概地铁十分钟、或者走路一个半小时,就能到达地球中心“上地”。当你走过这里的街道就会发现,挖掘机在冬天挥着大爪子寻找青草的味道,麻辣烫和烤串的香味即使在白天也勾搭诱人。

  在这里,吃和住解决了,这帮人就开始琢磨着改变世界。他们会一边撸着串,一边聊着怎么样让用户每天对着冰箱说话,“10元钱+2小时”能不能同时解决产品封装和一顿晚饭,以及你怎么判断正在烤串的大爷是不是一个人工智能。到了夜晚,他们一边看着凌晨2点的北京,一边坐车到回血点——回龙观完成新一轮的升级。

  这里,聚集了目前中国技术最好的一批人,空气中都漂浮着未来的味道。

  戴文渊从最开始背靠香港,还是决定,在两年前把公司搬到了上地。然后,目前能支持超大规模集群以及数据量的人工智能应用者开发平台——“先知”,在这里降临。

  从拿到ACM竞赛冠军,到研究人工智能,再到织出百度凤巢,登上华为诺亚方舟……戴文渊用近十年证明,“AI”是可以“for someone”的。未来十年,戴文渊的第四范式和“先知”平台要证明的,是“AI”终将“for everyone”。

  如果回头看戴文渊的这十几年就会发现,所谓先知,并不见得是可以某一次时,比别人先走三步;而是在趋势开始前,永远可以精准地先走半步。

  预兆:用3岁孩子的思考模式跳出AI固有解决方法

  沈南鹏在第一轮就投了第四范式。那是在2015年,当戴文渊把所有要干什么都说完之后,沈南鹏问,“你有什么问题想问我的?”戴文渊就问,你怎么看待我们做的这个事情。现在回忆起来,戴文渊依然记得当时沈南鹏说,“我其实不太关心你们做的是什么。在创业的初期阶段,相较于具体的业务,我更关心你的团队。”

  红杉投资看人。2年过去,说起这一幕,戴文渊说,如果现在再见到沈南鹏,“我很想告诉他,我还在做当时的那个事情”。

  所谓“当时那个事情”,戴文渊是在2005年入坑的。彼时,他获得了2005年ACM国际大学生程序设计竞赛世界冠军。这项由美国计算机协会(ACM)主办、被称为计算机界奥林匹克,一般描述是“入门之后基本拿奖靠智商,拿到银牌就能成为offer收割机”。

  那会,上海交通大学计算机系有一个实验班,学生大三就可以按个人喜好选择实验室。戴文渊在外备赛,等结束时,像图形学(即CG)等热门方向都选完了,只剩下冷门的人工智能没有人选。“那个年代,没有人相信AI能做成。”戴文渊说。

  在学术界,戴文渊多走了的半步,叫做迁移学习。

  如今,在迁移学习领域,论文引用数排名第一的,是戴文渊的导师、香港科技大学计算机系教授杨强,华人界首位国际人工智能协会院士。而戴文渊,凭借10年前发表的一篇论文(Boosting for Transfer Learning),单篇论文引用排名世界第三。

  但在当时那个年代,整个AI学界都是基于凸优化(机器学习中的最优化问题)做AI研究。参加学界会议,一半的人都在研究最优化,就和现在一半的人都在做深度学习一样。

  而且,即便是深入多年的学者,自己也不相信基于这条路,AI可以做出来。可以建出非常好的数学体系,却没有能力为它提供知识的内容。我国自动化领域的领军者王飞跃教授曾说,“到2005年,人工智能领域在中国几乎没人了,全走了。”当时甚至有一个说法,做人工智能的全都是吹牛的。

  走这样一条学术的路径,做出来的效果和一个3岁小孩的认知力相比,还差的很远。那为什么不去学习3岁的小孩怎么思考?人是基于神经的学习,为什么AI不能用神经网络做?杨强带着戴文渊,在没有太多经费支持的情况下,硬是把这个方向坚持了下来。