当前位置:首页 > 资讯 > 正文

思尔实验室主任李世鹏:人工智能要从数据驱动走向逻辑思维

9月23日,由南方财经全媒体集团旗下《21世纪经济报道》主办的“2022年度21世纪科技峰会”正式召开。

思尔实验室主任李世鹏:人工智能要从数据驱动走向逻辑思维  第1张

会上,思尔实验室主任、国际欧亚科学院院士、IEEE Fellow李世鹏指出,人工智能发展经历三个重要的阶段,而今天人们的期望已经来到基于深度学习解决所有问题的阶段,但问题在于深度学习本身没有推理能力,过度依赖数据,大数据的前置收集准备成为限制人工智能发展普及的瓶颈。

在最早的基于符号逻辑的推理证明阶段,证明了数学原理的诸多定理,由此外界对人工智能也产生很高的期望,比如智能机器将成为国际象棋冠军、发明和证明有意义的数学定理、谱写优美的乐曲等。

“但实际上它没有实现,问题出在哪里?没有解决智能机器如何把实际的问题抽象成符号的逻辑,所以它只能支持模拟推理少数特定规则下运行的场景。”李世鹏表示。

至上世纪七十年代末,人工智能进入第二个阶段——基于人工规则的专家系统阶段,成果主要包括将逻辑推理上升为专家系统,知识工程神经网络的BP算法解决了学习的收敛问题,专家可以手工构建规则,选取特征来解决一些小规模的特定问题和考核要求。

“这个时候问题又出现了,专家没那么多时间,也没有办法穷尽所有的规则,这里面的经验教训就是那么知识不能仅仅靠专家手工来表达,要靠自动学习,于是到2007年前后,人工智能发展到了第三个阶段,也就是大数据驱动的深度神经网络这个阶段。”

这个时期由算法、算力、大数据的发展共同发力,不再需要去手动选取一些数据特征,或者是构建一些规则,深度学习能从标注的信息中自己习得出普世模型。这也推动了人工智能在语音识别、图像识别以及语言处理等感知智能方面做出巨大成就,而且能够实际解决一大类事业中的共性问题。

必须承认的是,深度学习已经在实际中发挥了巨大的作用,“它的成功之处在于开源的AI框架,只要有足够多的标注数据,足够强的计算资源,就可以渲染出一个非常有用的模型,而且摆脱了各种特征选择对人的经验和智力依赖。”李世鹏表示。

李世鹏指出,今天人们的期望已经来到基于深度学习解决所有问题的阶段,但问题在于深度学习本身没有推理能力,而过度依赖数据,所以大数据的前置收集准备成为瓶颈。

“最大的问题是对大规模数据标注的依赖越来越成为人工智能发展的瓶颈,没有足够的数据,就很难去创建足够准确的模型,想要拓展到更多的应用场景,都需要同样规模的标准大数据,因此人工智能的推广就变得非常困难。”李世鹏表示。

李世鹏指出,科学界也在探索各种方法,以优化算法为核心,减轻对数据依赖瓶颈,比如说对数据深度学习算法优化、效率提升、计算量降低等,在模型压缩方面,也有连续学习、小样本学习以及迁移学习等。

“今天通过人的认知科学,我们看到具体规则并不重要,只要有足够多正确的逻辑,总是可以训练得到一个收敛的通用规则模型,所以我们需要打破专家系统所需要专家的标准瓶颈,让普通人来参与标注来生产大量的规则,这也是我们要拥抱的从大数据到大规则的变化。”李世鹏表示。