当前位置：首页 > 资讯 > 正文

顶级AI华人学者朱松纯确认入职清华，回国筹建通用人工智能研究院

woniu
资讯
2020-09-18
35558

近日，根据网络流出的一份清华大学拟聘新进校人员公示名单，加州大学洛杉矶分校（UCLA）统计学与计算机科学教授，UCLA 计算机视觉、认知、学习与自主机器人中心主任朱松纯拟加入清华大学自动化任职教授。与此同时，他还将与清华、北大共同筹建「北京通用人工智能研究院」，并出任院长。

顶级AI华人学者朱松纯确认入职清华，回国筹建通用人工智能研究院第2张

朱松纯是计算机视觉领域的顶级学者，他的回国，将为国内人工智能的发展带来强劲动力。

一、个人简介

顶级AI华人学者朱松纯确认入职清华，回国筹建通用人工智能研究院第3张

朱松纯（Song-Chun Zhu），湖北鄂州人，全球著名计算机视觉专家、统计与应用数学家、人工智能专家。曾任美国加州大学洛杉矶分校（UCLA）统计学系与计算机系教授，UCLA 计算机视觉、认知、学习与自主机器人中心（Center for Vision, Cognition, Learning and Autonomy，VCLA）主任。研究范围涵盖计算机视觉、统计建模与计算、认知科学、机器学习、自主机器人等领域。

朱松纯于 1996 年获哈佛大学计算机博士学位，师从国际数学大师大卫·曼福德教授，在国际顶级期刊和会议上发表论文 300 余篇，并三次问鼎计算机视觉领域国际最高奖项——马尔奖。在认知科学领域，如视觉常识推理、场景理解等领域做出重要贡献。朱松纯在 1990 年代率先将概率统计建模与随机计算方法引入计算机视觉研究，提出了一系列图像与视频的结构化解译的框架、数理模型和统计算法，发展了广义模式理论 [General Pattern Theory]。

二、工作经历

朱松纯于 2002 年加入加州大学洛杉矶分校统计系与计算机科学系，担任副教授，并于 2006 年晋升为正教授。朱松纯组建了 UCLA 视觉、认知、学习和自主中心，并领导了美国多个大型跨学科 AI 项目。他长期致力于构建计算机视觉、认知科学、乃至人工智能科学的统一数理框架，其中包括作为统一表示形式的时空、时间和因果图（STC-AOG）以及用于推理和学习的众多蒙特卡洛方法。

2005 年，朱松纯联合沈向洋 [Harry Shum] 等多位知名科学家在中国湖北省鄂州市创建民办、非营利性国际交流平台——莲花山研究院，并任院长。研究院的一个先期项目是收集大量的图像，手工标注图像中的场景、物体和部件、关系、功能等，至 2010 年已积累超过 50 万张图像数据，是发展计算机视觉的物体识别和图像解译任务的先行者。

朱松纯组织过多场学术研讨会及会议。在 2012 年罗德岛普罗维登斯举行的计算机视觉与模式识别（CVPR）会议上，朱松纯作为大会主席向 Ulf Grenander 颁发了先锋勋章（Pioneer Medal）。2019 年 CVPR 在美国加州长滩举行，朱松纯再次担任大会主席。

2017 年 7 月，朱松纯在美国洛杉矶创立暗物智能科技 DMAI，致力于打造基于强认知 AI 的技术平台。

三、学术成果

朱松纯已在国际顶级期刊和会议上发表论文 300 余篇，其研究成果集中在以下四个时期和领域：

1、视觉的统计建模与计算理论 —— 为马尔的视觉理论建立统一的数理模型

1995-2005 年期间，朱松纯教授与导师曼福德、UCLA 同事以及博士生，为计算视觉创始人马尔提出的早期视觉 [early vision] 概念，包括纹理 [texture]、图像基元 [Texton] 以及原始简约图 [primal sketch] 等建立了一个统一的数理模型；提出统计建模的最小最大熵原理 [minimax entropy principle]；将神经学和心理学的发现，植入统计物理的吉布斯模型 [Gibbs Model]，从而导出一类新型的马尔科夫随机场的概率模型 [FRAME]，并将该模型扩展到中层视觉模型，描述形状与格式塔 [Gestalt] 组成原则；发现自然图像的尺度不变与尺度变化的统计规则，将各种视觉模式及其对应的数理模型映射到一个连续的熵频谱 [entropy spectrum] 和信息尺度 [information scaling]；进一步研究了各种模型之间跳转和感知转化 [perceptual transition] 的机制，与博士生王亦洲 [现为北大教授] 导出感知尺度空间理论 [perceptual scale space]。

在 1990 年代，朱松纯发展了两类新的非线性偏微分方程（PDE）。一类用于图像分割，将 PDE 连接到统计图像模型的这项工作在 ICCV 2013 上获得了赫尔姆霍茨奖。另一类称为 GRADE（Gibbs Reaction and Diffusion Equations，吉布斯反应和扩散方程）于 1997 年发表，并在计算机视觉领域首次采用 Langevin 动力学方法进行推理和学习随机梯度下降。（Stochastic gradient descent，SGD）。

2、实现图像与场景的解译（parsing）计算框架 —— 扩展了模式识别创始人傅京孙先生的句法模式识别理论

1999-2010 年期间，朱松纯与其首位博士生屠卓文 [现为 UCSD 教授] 提出用数据驱动的蒙特卡洛马尔可夫链方法[Data-Driven Markov Chain Monte Carlo]求图像分割和解译 [Image Parsing] 问题的全局最优解；与其博士生 Adrian Barbu [现为FSU教授] 提出了 Swendsen-Wang Cut [SWC] 的蒙特卡洛算法，在通用的概率采样 [sampling] 计算中，实现大的状态跳转，突破传统方法计算的瓶颈问题。

该领域的这一进步使拆分合并运算符在文献中首次可逆，并且比吉布斯采样器和跳跃扩散方法快了 100 倍。这一工作获得第九届国际视觉大会颁发的马尔奖，并重新激起了同行对于图像解译工作的兴趣。

2006-2015 年间，朱松纯教授提出了概率随机的与或图 [and-or graph] 模型来表达上下文相关图语法 [graph grammar]，重启了模式识别领域创始人傅京孙先生倡导的句法模式识别框架；提出时空因果与或图 [Spatial，Temporal，Causal And-or graph STC-AOG] 为物体、场景、事件和因果关系建立统一的模型，并用于场景与事件的解译任务。

3、提出人工智能的「暗物质」—— 研究视觉与认知的物理与社会常识

自 2010 年以来，朱松纯将计算机视觉与认知科学、自然语言理解、机器人等学科结合，探索他所称的「人工智能的暗物质」——占 95％的、无法通过感知输入观测到的智能。

视觉与认知科学的结合：实现物理常识的推理，比如物体和场景的物理属性、使用功能、行为的因果率；和社会常识的推理，比如人的意图、动机、目的。由此丰富了对场景和事件的理解的内涵。

视觉与自然语言理解的结合：通过人机情景对话来获取常识，并于 2010 年率先从图像和视频的解译图中自动产生文本描述的 I2T 【Image Parsing to Text Generation] 方法。

视觉与机器人结合：提出来自主机器人与人类深度协作的认知构架 [cognitive architecture] 和通讯协议，以到共境【shared situation】、共识【shared model】、共行【shared plan】、和共同价值观【shared value】。

4、探索迈向通用人工智能的新的研究路径 ——「小数据、大任务」范式

朱松纯在 2017 年发表了一篇广为流传的文章《浅谈人工智能：现状、任务、构架与统一》。在文中，朱松纯将行业中流行的数据驱动型深度学习研究称为「大数据、小任务」范式。该范式使用大量标注的数据为每个特定任务训练神经网络，导致 AI 模型无法解释、应用范围狭窄等问题。与之相反，朱松纯提出了「小数据、大任务”的范式，主张以此来实现通用人工智能。

朱松纯团队构建了一个大规模、物理逼真的 VR / AR 环境，用于训练和测试负责执行大量日常任务的自主 AI 智能体。这些智能体整合视觉，语言，认知，机器学习和机器人技术等领域的能力，在此过程中发展物理常识和社会常识，并使用认知架构与人类进行交流。

四、学术职务

2015-2020 年，第二次担任美国视觉、认知科学、AI 领域跨学科合作项目 MURI 首席科学家[Principal Investigator]；

2016 年，再次当选国际计算机视觉与模式识别大会[CVPR]2019 年度主席；

2011-2013 年，担任国际模式识别协会 Aggarwal 奖评选委员会主席；

2012 年，担任电气和电子工程师学会[IEEE]计算机学会会士[fellow]评选委员会副主席；

2012 年，担任国际计算机视觉与模式识别大会 [CVPR] 主席；

2011 年，电气和电子工程师学会[IEEE]计算机学会会士 fellow；

2010-2015 年，首次担任美国视觉、认知科学、AI 领域跨学科合作项目 MURI 首席科学家；

2005 年，与沈向洋等创建民办、非营利性国际交流平台湖北莲花山研究院，并任院长。

五、奖项荣誉

2017 年，计算建模奖 [Computational Modeling Prize]，国际认知科学学会 [Cognitive Science Society]

2013 年，赫尔姆霍茨奖 [Helmholtz Test-of-Time Award]，第 14 届国际计算机视觉大会颁发

2008 年，第二届 J.K.Aggarwal 奖，国际模式识别协会

2007 年，马尔奖荣誉提名，第 11 届国际计算机视觉大会

2003 年，马尔奖，第九届国际计算机视觉大会

2001 年，Sloan fellow， Sloan 基金

2001 年，青年教授奖励基金 [Career Award]，美国国家科学基金委员会

2001 年，杰出青年科学家奖 [ONR Young Investigator Award]，美国海军研究所颁发

1999 年，马尔奖 [Marr Prize] 荣誉提名，第 7 届国际计算机视觉大会颁发

1995 年，哈佛大学工程领域 Ali Jury 奖

1992 年，哈佛大学研究生院奖学金

六、回国任职

到 2020 年，清华大学自动化系已建系 50 年。

自动化系的一级学科为「控制科学与工程」，1998 年，自动化系获国家首批一级学科博士学位授予权，2007 年被评为国家首批一级重点学科，学科综合实力强、交叉创新多、发展前景广。在 2016 年全国一级学科评估中，「控制科学与工程」学科被评为A+全国最高水准。

自动化系拥有高水平的师资力量，截止2020年，自动化系现有教师 89 人，其中教授、研究员 40 人，副教授、副研究员 40 人，助理教授、助理研究员 9 人。中国科学院院士 2 人，中国工程院院士 2 人，国家教学名师获得者 2 人，教育部长江特聘教授 3 人，国家杰出青年基金获得者 12 人，国家优秀青年基金获得者 12 人。戴琼海、张长水、鲁继文、黄高等大牛均属清华自动化系。

朱松纯的加盟，又给清华自动化系添加一员大将。

此外，朱松纯教授此次以「国家战略科学家」身份回国，还将受邀与清华、北大共建民办非盈利机构，北京通用人工智能研究院，并出任院长一职。

该研究院将聚焦人工智能前沿技术，致力培养人工智能领域的跨学科、原创型人工智能人才，同时打造新一代通用人工智能平台。构建一个通用型的强人工智能，也是朱松纯一直在追求的。

七、学术人生

熟悉朱松纯教授的人，对他严谨的治学精神，也从不吝惜赞美之词。

曾经在朱松纯 UCLA 的 VCLA 实验室访学一年多的微软亚洲研究院视觉组研究员代季峰，这样评价朱松纯教授「朱松纯老师对视觉领域大方向有着一流的直觉，对数学（尤其概率统计）一丝不苟，善于拿大资金。他对学生是刀子嘴豆腐心，实验室里的学生私下都叫他老朱。」

顶级AI华人学者朱松纯确认入职清华，回国筹建通用人工智能研究院第4张

对视觉领域大方向有着一流的直觉

朱松纯教授的实验里学生人数较多，自然要用雄厚的funding资金来支撑。朱教授在最近几年应该都是美国大学视觉界里funding最多的教授（不知道是不是要加个「之一」）。

从 2011 年起，朱老师的实验室，作为 PI 拿到的资助超过 4000 万美元，其主要原因就是其「研究思维超前」。

能够拿到这些大 funding，意味着朱教授对这个领域的大方向「有着一流的直觉以及领先和准确的把握」。

而朱教授这种的「第六感」在多年前就已经有所体现。

顶级AI华人学者朱松纯确认入职清华，回国筹建通用人工智能研究院第5张

2012 年，朱松纯教授主持的一个 MURI 大项目在 UCLA 开会，他上台讲了一通「vision meets language」，说视觉和语言的结合会是一个重要的问题，比如看到一整个图片，系统应该输出一段话描述它，比如看到一个 bounding box 区域，要描述这里面发生了什么，这个用一个 hierarchical 的 And-Or graph 该如何实现。

当时很多视觉领域的大佬都觉得有些天方夜谭。没想到过一两年，这就是红极一时的 VQA 任务，不过是用神经网络实现的。

「能够提前感知到未来的大方向」，这是顶级的 research 感觉，这也是朱松纯教授最厉害的地方。

朱松纯教授提的大方向，虽然有错的，但是正确的概率已经是很高了。

对数学（尤其是统计）一丝不苟

跟朱教授讨论的时候，最经常被 challenge 的就是「这个算法不对，数学上是错的，这个 CV 领域最近火的技术在统计上是不对的」

对大部分研究者来说，概率模型流行就用概率模型，SVM 流行就用 SVM，神经网络流行就用神经网络。

而朱松纯教授是有信仰的，那就是他的「概率模型」，曾经在 SVM 之前引领了视觉领域的潮流。那是他们自己的东西，所以不像其他人那样可以轻易舍弃。

朱教授曾经说过「做 research 像下围棋，不能东下一颗西下一颗，地盘全被别人占了」。

对学生刀子嘴豆腐心

这是朱教授受到的争议最大的地方。

刚去他实验室的时候，会很不适应他的批评，但你慢慢了解他，就好了。

他对学生的长远发展和重要利益，是非常好的；虽然批评时很难受，但过后他不记仇；还有同实验室吴教授的平衡和调和。

其实学术圈的老板，脾气大一些、对学生push的非常多，算是 research 人的通病吧。

但最后找工作什么的关键时刻，他和同实验室的吴教授都是非常 supportive，有人情味的。

朱松纯教授的女儿在年满 18 岁之际放弃了美国国籍加入中国国籍，也许从那时起，朱松纯教授的回国计划就已经提上了日程。

朱松纯这次回国，将为国内人工智能尤其是通用人工智能的发展，带来强劲动力。他也离「人工智能大一统理论」的梦想上更近了一步。

作者简介：武 ********* 识教育科技有限公司专注于人工智能、机器人工程、智能制造、云计算、大数据、区块链、信息安全、互联网营销、健康护理等多领域、多层次「新工科」「新职业」人才培养与输送。公司立足湖北科教大省，辐射全国，提供专业共建、师资培训、联合实验室、科研项目合作、实习实训就业、职业技能培训等整体解决方案。同时与诸多产业领军企业建立战略合作关系，融合产业先进技术，为金融、医疗、教育、安防、交通、零售、制造、农业等行业用户，提供多维解决方案。在全国众多院校、企业、研究机构、投资界等多方合作发展中发挥纽带作用，为推动相关领域人才培养和产业发展贡献力量。