首页 资讯正文

专家观点 | 人工智能现状及发展(上)

图书简介:

江厦智库策划出版《中国新基建与5G智慧城市建设》图书,组织以中科院院士为顾问、以各领域研究专家为核心的编委会。汇聚各类专家和企业家,包含在新基建5G网络、数据中心、人工智能工业互联网、特高压、高铁、轨道交通和新能源汽车充电桩、新一代信息技术、新材料及航空航天等不同领域的关键技术研究+创新应用案例组织研究文章。

本文作者简介:

边小勇 ,《中国新基建与5G智慧城市建设》图书课题组成员。博士,副教授,江厦智库科技合伙人 。

文章预计阅读15分钟

AI——伟大的起点:从图灵机说起

机器能取代人工进行快速、自动计算吗?图灵机就是当时全新的计算模型。

1、图灵机

可计算理论可以追溯到1900年,当时著名的大数学家大卫·希尔伯特(David Hilbert,1962-1943)在世纪之交的数学家大会上给国际数学界提出了著名的“23个数学问题”。其中第10个问题是这样的:“存不存在一种有限的、机械的步骤能够判断“丢番图方程”(Diophantine Equation)是否存在解?”这里就提出来了有限的、机械的证明步骤的问题,即今天所说的“算法”。但在当时,通用计算机还要半个世纪之后才会出现,人们还不知道“算法”是什么。不过,当时数学领域中已经有很多问题都是跟“算法”密切相关了,对“算法”,即“如何计算求解问题的步骤”的定义和是否可被算法计算的判定呼之欲出。

1936年,英国科学家阿兰·图灵(Alan Turing,1912-1954)发表的《论可计算数及其在判定问题上的应用》一文中,被以上这个问题深深的吸引了并进行了探索,就此提出了一种十分简单但运算能力极强的理想计算装置,并描述了一种抽象的可实现通用计算的机器,这就是著名的图灵机。最简单的图灵机是用0和1及其三种逻辑运算“与”、“或”“非”构造的,它有一条无限长的纸带,纸带分成了一系列均匀的方格,每个方格有不同的颜色。有一个读写头可以沿带子方向左右移动,并可以在每个方格上进行读写。读写头有一组内部状态和控制规则集。在每个时刻,读写头都要从当前纸带上读入一个方格信息,然后查找自己的内部状态转换表,根据程序输出信息到纸带方格上,并转换自己的内部状态,然后进行移动。

图灵机建立了指令、程序及通用机器执行程序的理论模型,奠定了现代计算机原理,这是图灵一生最大的贡献。

专家观点 | 人工智能现状及发展(上)

(阿兰·图灵)

如下图所示,图灵机可以用一个五元组(Κ, Σ, qi, δ, qj)直观地描述,5个元素的含义如下:

Κ 是有限个状态的集合{q1, q2, ..., qm}

Σ 是符号的集合{S0, S1, S2, ..., Sp},通常,可以认为这个符号字母表仅有S0, S1两个字符,其中S0可以看作是0,S1看作是1,它们只是形式化的两个符号

qi 表示读写头当前所处的状态

δ 是控制器规则表,形如:根据控制器当前状态和当前读写头读入的符号,产生读写头动作指示,读写头新位置写入的符号,并更新控制器新状态

qj 表示下一步机器的状态

专家观点 | 人工智能现状及发展(上)

(图灵机)

图灵机从给定袋子的某个起点出发,它的动作完全由其初始状态及内部五元组来决定。一个机器计算的结果是从机器停止时带子上的信息得到的。容易看出,q1S2S2Rq3指令和q3S3S3Lq1指令如果同时出现在机器中,当机器处于状态q1,第一条指令读入的是S1,第二条指令读入的是S3,那么机器会在两个方块之间无休止地工作。另外,如果q3S2S2Rq4指令和q3S2S4Lq6指令同时出现在机器中,当机器处于状态q3并在带子上扫描到符号S2时,就产生了二义性的问题,机器就无法判定。

例如,设b表示空格,q1表示机器的初始状态,q4表示机器的结束状态。如果带子上的输入信息位10100010,读写头对准最右边第一个为0的方格,状态为初始状态q1。按照以下规则执行后,输出正确的计算结果:

q101Lq2

q110Lq3

q1bbNq4

q200Lq2

q211Lq2

q2bbNq4

q301Lq2

q310Lq3

q3bbNq4

显然,最后的结果是10100011,即对给定的数加1。其实,以上命名计算的是这样一个函数:S(x)=x+1。

图灵机不仅可以计算后续函数S(x)=x+1,显然还可以计算零函数N(x)=0。投影函数

专家观点 | 人工智能现状及发展(上)

以及这3个函数的任意组合。这3个函数都属于初始递归函数,而任意原始递归函数都是从这3个初始递归函数经有限次的复合、递归和极小化操作得到。因此,每一个原始递归函数都是图灵机可计算的。

尽管图灵机具有可模拟现代计算机的计算能力,并且蕴含了现在存储程序的思想。但是在实际计算机的研制中,还需要有具体的实现方法和实现技术。在图灵机提出后不到10年,世界上第一台存储式通用数字电子计算机就诞生了。由于阿兰·图灵对计算机科学的杰出贡献,美国计算机协会(ACM)决定图灵奖,从1966年开始颁发给在计算机科学领域做出突出贡献的科学家。

2、图灵测试

1950年图灵在他的论文《计算机器与智能》当中,开篇就提出了这样一个问题:机器有智能吗?如果一台机器能够与人类对话,而不被辨别出其机器的身份,那么这台机器便具备智能,这就是著名的图灵测试。图灵奠定了现代计算机科学的基础和人工智能的雏形,被称作“计算机之父”和“人工智能之父”。这个问题启发了无穷想象,一个人工智能的新时代即将开始。

人工智能发展的重要里程碑

人工智能发展的重要里程碑具体表现为以下三个方面:

世界上第一台电子计算机

1946年,世界上第一台计算机恩尼亚克诞生了,长30.48米,占地约170平方米,它能够重复编程,速度是机电式计算机的一千倍,人工计算的二十万倍。

IBM“深蓝”计算机 vs 国际象棋大师卡斯帕罗夫

1996年2月10日,超级电脑深蓝首次挑战国际象棋世界冠军卡斯帕罗夫,但以2-4落败。比赛在2月17日结束。其后研究小组把深蓝加以改良,1997年5月再度挑战卡斯帕罗夫,比赛在5月11日结束,最终深蓝电脑以3.5–2.5击败卡斯帕罗夫,成为首个在标准比赛时限内击败国际象棋世界冠军的电脑系统。IBM在比赛后宣布深蓝退役。

阿尔法围棋(AlphaGo)大战

谷歌DeepMind公司开发的人工智能阿尔法围棋(AlphaGo)在2015年10月以5比0的战绩完胜欧洲围棋冠军、职业围棋二段樊麾,这是人类历史上,围棋人工智能(AI)首次在公平比赛中战胜围棋职业棋手。谷歌于2016年3月向围棋世界冠军、韩国棋手李世石发起五番棋挑战,阿尔法围棋以总比分4比1战胜李世石。后来,谷歌又推出阿尔法围棋升级版,并邀请世界排名第一的围棋世界冠军、中国棋手柯洁于2017年5月与之进行三番棋大战,阿尔法围棋以总比分3比0战胜世界排名第一的柯洁。

人工智能与机器学习

机器学习最初被定义为“不显式编程地赋予计算机能力的研究领域”。是基于现有的数据产生预测模型的“算法”学科。主要任务是评估“学习算法”的好坏以及开发新的“学习算法”。

机器学习十大算法

机器学习是人工智能的一个重要分支,传统上机器学习十大算法分别是:

(1)线性回归(Linear Regression),设计一个直线方程与数据拟合来表示数据到方程的最小误差拟合,并使用此线来预测未来的值。

(2)逻辑回归(Logistic Regression),设计一个非线性的S型函数建立从自变量到输出变量的概率分布,其值为0到1范围,适合用于分类任务。

(3)决策树(Decision Trees),通过学习基于树表示的决策规则来学习预测目标变量的值。其中,树是由具有相应属性的节点组成的,在每个节点上,根据可用的特征询问有关数据划分的问题,左右分支代表可能的答案,最终节点(即叶节点)对应于一个预测值。每个特征的重要性是通过自顶向下方法确定的。节点越高,其属性就越重要。

(4)朴素贝叶斯分类(Naive Bayes),基于贝叶斯定理计算一组预测变量的后验概率,已知每个类的条件概率。

(5)支持向量机(Support Vector Machine,SVM),定义不同类别数据之间的分隔超平面,并通过训练模型求取最优超参数,这个最优超平面具有最大的边界,可以对点进行分类,从而使最近的数据点与这两个类之间的距离最大化。

(6)K-近邻算法(K-Nearest Neighbors,KNN),在整个训练集中搜索 K 个最相似的数据点,并为所有K个数据点分配一个公共输出变量,来对对象进行分类。常用的相似性的距离度量有欧几里得距离(Euclidean distance)、曼哈顿距离(Manhattan distance)或明氏距离(Minkowski distance)。其中,欧几里得距离使用最为频繁。

(7)K-均值(K-means),根据预定义的K个聚类中心,将其与每个数据点进行相似性计算,将新的数据点添加到具有最近距离的聚类中心。这个过程一直持续到聚类中心不再变化为止。

(8)随机森林(Random Forest),是一种非常流行的集成机器学习算法,该算法的基本思想是众人的意见要好于个人意见。在随机森林中,使用决策树算法进行集成表决。

(9)数据降维(Dimensionality Reduction),在不丢失最重要信息的情况下,通过将特定的特征组合成更高层次的特征来解决这个问题。主成分分析(Principal Component Analysis,PCA)是最流行的降维技术。通过将数据集压缩到低维线或超平面 / 子空间来降低数据集的维数。这尽可能地保留了原始数据的显著特征。

(10)人工神经网络(Artificial Neural Networks,ANN),本质上是一组带有权值的边和节点组成的相互连接的层,称为神经元。组成ANN的结构是一个输入层、两个隐藏层和一个输出层,中间还可以插入多个隐藏层。其工作原理与人类大脑的结构类似,一组神经元被赋予一个随机权重,以确定神经元如何处理输入数据。通过对输入数据训练人工神经网络来学习输入和输出之间的关系。

机器学习是从数据通往智能的技术与途径,机器学习是数据科学的核心,是现代人工智能的本质,它可以从数据中挖掘出有价值、有规律的信息,其通用的框架为数据、模型、优化和求解。但机器学习还不是深度学习,前者适用于小样本下通过适度的训练,追求精度和效率。而深度学习更像一个黑盒子,适合在大数据集上进行端到端的训练,产生简单而通用的结果。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

本文链接:https://www.chinaai.com/zixun/271.html

评论