当前位置:首页 > 资讯 > 正文

陈凤仙:人工智能发展水平测度方法研究进展

陈凤仙:人工智能发展水平测度方法研究进展  第1张

摘要:人工智能发展水平测度问题已经成为各国学者和研究机构高度重视的热点问题。本文旨在从经济学视角对人工智能发展水平测度相关文献进行全面梳理,在清晰界定人工智能概念内涵的基础上,归纳总结人工智能综合发展水平、人工智能渗透率、人工智能对经济各领域影响程度等方面的测度方法。特别是,本文梳理了现有合理可操作的测度指标体系、数据处理方法,力求为人工智能发展水平的测度提供有价值的经验借鉴和理论参考。

关键词:人工智能 综合发展水平 渗透率 经济影响 测度方法

一、引言

伴随新一轮科技革命深入推进,5G、大数据、云计算等新一代信息技术正在蓬勃兴起。人工智能发展尤为强劲,并在经济社会发展各个领域得到广泛应用。人工智能正在深刻影响经济增长、全球贸易、收入分配、产业结构等经济生活各领域,同时也对企业、居民等微观主体产生广泛影响。全球主要经济体都把人工智能作为未来国际竞争的战略重点,制定出台多个政策和规划文件,力求在未来国际竞争中占据主导地位。早在2016年10月,美国国家安全与技术理事会(NSTC)即发布《为人工智能的未来做准备》《国家人工智能研究与发展战略规划》,美国国防部2019年2月发布《2018年国防部人工智能战略摘要——利用人工智能促进安全与繁荣》,美国国家标准与技术研究院(NIST)2021年3月发布《人工智能技术和道德标准的指导意见》,不断深化人工智能研究,全方位提出人工智能发展战略。2019年以来,欧盟接踵出台《人工智能协调计划》《可信赖的人工智能伦理准则》和《可信赖的人工智能政策与投资建议》等文件,有力地指导着人工智能发展。就中国而言,党中央国务院高度重视人工智能发展,力图抓住机遇打造人工智能成长的先发优势。2017年,我国发布《新一代人工智能发展规划》,从国家战略层面对人工智能做出全面部署;2020年7月国家标准化管理委员会、中央网信办、国家发展改革委、科技部、工业和信息化部五部门联合印发《国家新一代人工智能标准体系建设指南》,提出到2023年初步建立人工智能标准体系,为人工智能发展明确了方向。

当前,人工智能正在深刻影响着各国经济社会发展,各国 ********* 、研究机构和国内外学者都给予高度关注。如何衡量和测度人工智能发展水平,已经成为一个影响人工智能发展的重要问题。尽管研究人工智能的文献很多,但是纵观国内外相关文献,多数研究都是围绕人工智能产业、人工智能应用、人工智能影响及人工智能技术等某个领域展开。特别是梳理大量文献发现,仅“人工智能”这一概念的内涵,不同国家、不同机构、不同学者都有不同的界定,这说明关于人工智能的研究仍然不够深入,一些基本问题尚未达成共识。本文聚焦人工智能发展水平的衡量和测度,以经济学的视角,对人工智能概念界定、测度指标、测度方法以及人工智能的影响等领域文献进行全面梳理和探讨,力求为人工智能研究、政策措施制定提供参考和借鉴。

二、人工智能综合发展水平的概念内涵

(一)人工智能的概念界定

要精确测度人工智能的发展水平,必须首先对人工智能这一概念有一个清晰的界定。实际上,早在20世纪四五十年代,人工智能已经开始引起学界关注。1956年,人工智能之父约翰·麦卡锡(John McCarthy)等人发起达特茅斯会议,首次提出人工智能概念(artificial intelligence,简称AI),由此开创了人工智能研究的先河(Moor,2006)。虽然人工智能研究起步较早,但由于人工智能发展迅速,特别是由于技术创新不断推进,人工智能的概念内涵也在不断变化,因此准确界定人工智能的内涵并不容易,时至今日这一概念也未能在理论界达成共识(OECD,2021)。归纳起来,各国机构和学者对人工智能的定义包含三层含义:

1.将人工智能回归到它的“机器”属性。经济合作与发展组织 (OECD,2019)认为,人工智能系统是一种基于机器的系统,它可以针对一组给定的由人类定义的目标做出预测、建议或影响现实或虚拟环境的决定。欧盟统计局(2019)认为,人工智能是指利用文本挖掘、计算机视觉、语音识别、自然语言生成、机器学习、深度学习等技术,收集或使用数据来预测、推荐或决定实现特定目标的最佳行动,人工智能是具有不同程度自主性的系统。例如,基于自然语言处理的聊天机器人、基于计算机视觉或语音识别系统的人脸识别系统等,都属于人工智能的范畴。丹麦统计局(2019)则把人工智能定义为一系列计算机软件,这些软件以数据为起点“思考”、分析、解决问题,并在图形(例如图像、音频和文本)中形成联系。它包括计算机生成的年度报告、聊天机器人或自动营销等。由此可见,人工智能概念首先应该体现它作为机器、技术或软件的本质属性。

2.更加关注人工智能的现实能力和实际用途。McKinsey(2019)认为,人工智能是机器执行与人类思维相关联的认知功能,以及使用认知功能执行物理任务的能力。Gillham(2018)和Rao & Verweij(2017)指出,人工智能是指能够感知环境、进行思考的计算机功能,某些情况下还具备学习的能力,并对它们所感知的事物和目标采取行动。McKinsey(2017)则认为,人工智能是一种自动化,目前人们所做的工作中,几乎50%有潜力实现这种自动化。加拿大统计局(2019)的定义为,人工智能是指通过分析环境并采取行动来实现特定目标,从而显示智能行为的系统。实际上,人工智能的第二层含义体现了对第一层含义的延伸,即虽然人工智能是一种“机器”,但归根到底还是要为人所用,而且必须具备超越人的感知、认知、思考、执行乃至学习等诸种能力。

3.着重强调由人工智能发出的某种高品质活动。Kurzweil(2000)认为,人工智能是需要人的智能才能完成的任务和工作。Nilsson(2010)指出,人工智能是一种致力于使机器智能化的活动,而智能是一种品质,使一个实体能够在其环境中适当地、有远见地运行。Nilsson对人工智能的认识又上升到一个新的高度,而以色列中央统计局(2019)直接引用Nilsson教授的观点作为以色列官方对人工智能的定义。日本总务省(2017)将人工智能定义为,通过数据分析进行执行、学习、推断、识别、判断等。这个定义既阐述了人工智能的实现手段,也表达了人工智能的用途。人工智能的第三层含义又进一步拓展了人工智能的概念内涵,让人工智能具备了某种人性化、情感化的特点,有利于人工智能进一步向高层次突破发展。

由上可见,人工智能定义中应该包含一组层层递进的关键词,共同界定了人工智能的概念内涵:首先是主体,即人工智能的主体是由人类研发制造出来的机器、技术或软件等实体;其次是能力,即该主体具备超过于人的感知、认知、思考、执行乃至学习等诸种能力;再次是活动,即由此主体发出某种活动或行动;最后是品质,在未来发展中,人工智能的“思考”或活动应该越来越趋向于高品质、高质量,人工智能有可能越来越人性化。

(二)人工智能综合发展水平测度的主要内容

人工智能综合发展水平并非只是反映人工智能技术、产业等某个方面的发展程度,而是对人工智能各个方面发展水平的全方位综合考量。纵观各国机构和学者的研究文献可以发现,人工智能综合发展水平的测度实际上包含两个大的层面,体现着测度的“全方位”特征:

1.对人工智能自身发展水平的测度。在深入探索人工智能测度的多个维度的基础上,国内外学者、研究机构和各国 ********* 开始尝试综合运用多个指标测度人工智能发展水平,测度指标也逐渐从单个指标向综合指标体系转变。斯坦福大学从2017年开始一直致力于人工智能发展水平的测度,并连续数年形成人工智能指数报告,已经形成世界范围的影响力。斯坦福大学的指数报告评价的显然是人工智能的综合发展水平,主要从研发水平、技术性能、产业发展、经济影响、开源软件及人工智能多样性等多个维度衡量全球范围内的人工智能发展情况。联合国世界知识产权组织 (WIPO,2019)发布《技术趋势2019:人工智能》,在阐述人工智能发展趋势之前,评价并归纳总结了世界主要国家和地区人工智能技术发展特点。这一报告的评价方法则是使用与人工智能发明相关的专利数据和科学出版物数据,通过分析这些数据在时间、区域、产业及前沿企业层面的变化,进而对相应国家的人工智能发展水平进行综合判断。

与此同时,我国研究机构也在探索构建评价人工智能综合发展水平的指标体系。国家工业信息安全发展研究中心(2020)发布《中国人工智能产业发展指数》,从基础支撑、创新能力、融合应用、产业运行、环境保障5个维度评价人工智能产业发展情况。清华大学中国科技政策研究中心(2018)主要从科技产出与人才投入、产业发展与市场应用、发展战略与政策环境、社会认知与综合影响4个维度评价人工智能发展水平。中国信息通信研究院和Gartner(2018)则是从发展环境、技术环境、全球人工智能企业情况、全球投融资情况和产业发展情况5个维度评价人工智能发展情况。武汉大学和长江商学院(2019)发布的《2018中国人工智能指数》借鉴了斯坦福大学的评价指标体系,从学术、人才、产业、开源软件、公众认知及媒体报道五个维度评价了我国人工智能发展现状。

2.对人工智能应用水平的测度。该方法着重测度人工智能影响和渗透于经济社会发展的程度。近年来,伴随人工智能迅猛发展,其影响已经深刻植入人类生活的各个领域。Muro & Liu(2021)在布鲁金斯学会发布的研究报告中指出,人工智能已经无处不在,人工智能系统正在创造人们日常生活中的无数应用。Barefoot et al(2018)则直接将测算重点放在新技术对具体经济和社会活动的影响上。由此而来,测度人工智能综合发展水平决不仅限于测度人工智能本身的发展水平,还必须高度关注、深刻把握、定量测度人工智能对经济社会发展各领域的渗透和影响程度。近年来,不少学者研究了人工智能对经济、就业、收入分配等经济社会各领域的深刻影响。另外,有一些测算数字经济影响的研究成果在人工智能测算领域也很有参考价值。Barefoot et al(2018)在阐述美国国家经济分析局(BEA)对数字经济发展水平的测算方法时指出,数字化已经渗透到许多活动中,BEA除直接对数字产品发展水平进行测算外,还测算了信息技术在商业模式和产品中的广泛新应用,体现出数字经济改变经济的程度和与经济社会的互动程度。

三、人工智能综合发展水平的测度

(一)人工智能发展水平的测度维度

人工智能发展水平差距首先表现为技术差距。围绕如何衡量技术差距,各国学者、研究机构及国际组织进行了多方探讨。Posner(1961)就提出将技术作为生产要素的观点,以及可测量性、可操作性的要求。由于技术差距并非直观地表现在某个显性指标上,不具有可直接测量的可行性,因此各国学者寻求各种可量化的显性指标来衡量技术差距。其后,Schmookler(1966)即开始尝试用专利数量来代表技术差距,Bosworth et al(2001)等专门撰文,倡导用专利代表技术差距,特别是使用专利数据来衡量人工智能领域的核心技术水平,进而由此明确人工智能的技术来源、技术创新和技术扩散情况。国内学者在研究成果中多支持这一观点,认为将专利作为衡量指标,可以比较准确地反映技术差距。另外,不少专业机构也在研究报告中提出测度技术差距的核心指标,世界经济论坛的《全球竞争力报告》(1996)、世界知识产权组织的“全球创新指数”(2018)、欧盟的“创新记分牌”(2018)、中国科学技术发展战略研究院的“国家创新指数”(2019),均使用知识产权来衡量技术差距,也一度引起广泛关注。

技术差距是衡量人工智能发展水平的核心要素。各国学者在讨论测度指标的基础上,进而就如何缩小技术差距展开深入讨论,形成了模仿跟从、模仿赶超两种主张。“模仿跟从”观点主要体现在后发优势理论上,格申克龙(2009)认为,模仿技术的优势在于可以节省技术创新成本,但他忽视了模仿可能产生依赖性的弊端;而Felipe et al(2012)提出的“陷阱”论则分析了模仿依赖可能产生丧失创新思维的不良后果,但并没有关注到最佳模仿程度和危险临界。“模仿赶超”理论则由克鲁格曼(2002)和Acemoglu et al(2006)提出,他们主张先模仿再赶超,但也不能确定最佳模仿临界值。实际上,如何缩小人工智能的技术差距,各国情况不同,技术路线选择与发展也有不同实践,并非既定。

由于人工智能与各个领域交织在一起,涵盖范围非常广泛,因此,不少研究成果使用技术差距以外的其他变量来衡量人工智能的发展水平。一是使用可以反映人工智能技术水平的参数作为代理变量。经济合作与发展组织(2018)使用最常引用科学出版物、发明专利家族数据等指标,测度人工智能的技术水平和差距,具有较强的前沿导向性。Castellacci & Natera(2013)用生产效率差距或人均GDP差异来代替技术差距。二是使用反映人工智能产业发展水平的参数作为代理变量。Wuzhen Institute(2017,2018,2019)连年发布《全球人工智能发展报告》,选取产业发展、技术水平、应用场景3个维度测度人工智能发展水平,涉及论文、专利、企业数量、投融资等多个具体指标。三是使用反映人工智能相关商业活动情况的参数作为代理变量。Muro & Liu(2021)在布鲁金斯学会发布的研究报告中,从“描述人工智能研发活动情况”和“衡量人工智能商业化活动情况”两个维度,设置了7项具体指标来测度人工智能发展水平。基于此,该报告测度了384个城市的人工智能发展水平并进行了比较分析。四是综合使用上述多个维度指标来衡量人工智能发展水平。

总体来看,虽然近年来国内外学者、专业机构都从不同维度深入分析评价人工智能发展情况,涌现出不少有价值的研究成果,国内外人工智能计量统计、数据收集等工作已在逐渐开展,特别是美国、欧洲等发达国家都给予高度重视,但测度维度并未形成统一共识,也缺乏反映人工智能综合发展水平的测度指标和动态评价机制。归纳诸多学者与机构的研究成果可以发现,评价人工智能发展水平的维度可以归结为产业发展水平、技术创新水平、企业发展水平、发展环境水平、投融资水平、国际影响力6个大方面,每个维度又可以由若干细分具体指标支撑(如表1所示)。

表1 人工智能发展水平测度指标体系

资料来源:作者整理。

(二)人工智能指标数据的处理方法

数据处理方法并非本文的讨论重点,因为虽然人工智能的概念内涵和评价指标体系并未形成共识,但是大量文献显示,一旦确定指标体系之后,运用统计学方法处理指标数据的测算方法都大同小异。但是,作为完整的测算方法的一部分,有必要对历年来数据处理方法的研究成果做一个简要梳理。

数据测算首先关注数据来源,虽然不同机构和学者测算方式不同,但是测算所需数据主要来源于五个方面:一是官方统计数据。各国官方统计部门发布的统计数据往往在官方网站或统计年鉴上能够查到。二是问卷调查数据。测算机构向样本人群发放调查问卷,经测算得到的数据。三是实地调研数据。就人工智能自身发展及其对经济社会的影响情况,向 ********* 部门、企业和居民开展实地调研,由此得到一手调研数据。四是开放型数据库数据。主要使用美国国家科学基金会(NSF)、欧盟地平线2020计划(CORDIS)、英国国家科研与创新署(UKRI)和英国工程与自然研究理事会(EPSRC) 等开放型数据库作为数据来源。其他数据库数据,如斯坦福大学(2021)大量选取同行评议文献数据库Elsevier/Scopus数据、微软开放学术图谱数据集(OAG)进行测算。五是网站指标数据。Fenner(2013)主要搜集阅读量、书签、下载量等社交网络中产生的客观指标数据来反映人工智能的某方面影响力。

有关科学评价方法和数据处理的研究,目前常用的评价方法可以分为专家评价法、经济分析法、运筹学和其他数学方法,这些方法在一些具有较强国际影响力的评估报告中得到广泛应用。综合来看,指标体系确定之后,数据处理方面有三点需要加以说明:一是确保指标数据的可获得性以及数据的可靠性和真实性。二是指标数据的无量纲化处理。不同领域指标单位不同,必须进行标准化才能使得数据间可以比较、叠加。无量纲化的常用方法有概率单位法、线性插值法、指数法、秩次法等。通常是在线性插值法的基础上,采用改进的功效系数法来进行指标的无量纲化。三是指标权重的确定。明确各种指标在指标体系中的地位是确保测算方法有效的又一个重点环节。通常综合使用以专家打分为主的主观赋权法、以均方差法为主的客观赋权法,并将两种不同赋权方法的结果组合归并,得到一个组合赋权法的权数值。组合赋权公式为:

(i=1,2,…m, j=1,2,…n),其中,xij为第i种赋权法给第j个指标所赋的归一化权数,λi为第i种赋权法的权数,wj为组合赋权法对第j个指标所赋的权数,m为赋权法的个数,若仅有主观赋权法、客观赋权法两种,则m=2。

(三)各国人工智能发展水平的测度比较

综合各国学者和研究机构的测度情况可以发现,虽然研究人工智能发展水平测度的文献并不少见,但是多数文献侧重于提出人工智能测度的主要维度和适用指标,或者就人工智能的某个指标采集数据、测算结果、各国排名,而对人工智能测算的每个指标都采集数据、赋予权重并进行综合测算的文献并不多见。比较典型的综合测度是Schmid(2021)在美国兰德公司报告中的测算和比较。Schmid选取高影响力出版物、协作网络密度、专利和科技组织能力四项指标,对中国、法国、德国、印度、日本、韩国、俄罗斯、英国和美国等9个国家的人工智能发展水平进行测算评估并汇总出测算排名。测算结果显示,美国在四项指标中有三项排名第一,综合来看美国仍是人工智能领域的引领者,中国除协作网络密度1项排名第5外,其余3项指标处于前两名的位置,俄罗斯人工智能发展水平相对滞后(如下表2所示)。斯坦福大学(2021)在《人工智能指数报告》中虽然提出一系列人工智能评价指标,但并未对各项指标进行综合加权测算排名。斯坦福大学主要是对部分指标进行了单独测算排名,除出版物、专利等主要指标与Schmid的测算情况基本一致外,各国人工智能“私人投资”排名也突出反映各国人工智能的发展水平。从对2020年的测算结果看,美国仍然是人工智能领域私人投资的主要流向地,2020年的私人投资金额超过了236亿美元;其次是中国,为99亿美元,显示出较强的人工智能竞争力;再次是欧盟20.4亿美元和英国19亿美元。

表2 各国人工智能发展情况排名

四、人工智能渗透率的测度方法

(一)人工智能渗透率的概念及测度指标选取

1.渗透率概念界定。Brynjolfsson & Mcafee(2017)指出,人工智能具有巨大的潜力成为“我们这个时代最重要的通用技术”。中国信息通信研究院(2021)则鲜明地指出,近年来人工智能正在以空前的广度与深度影响着经济社会发展,加速产业结构升级进程。一方面,人工智能正在明显加快优化全产业链结构,牵引产业向高附加值的产品与服务转变。另一方面,人工智能已全面覆盖社会运行的基本要素,加速影响日常生活、科学研究、商业创新和国家安全等各个领域,内生化地提升经济社会整体运转效率。因此,对人工智能发展水平的测度不能仅仅停留在对人工智能自身发展水平的测度上,还应包括人工智能对经济社会的总体影响水平,各国机构和企业使用人工智能的程度。人工智能渗透率正是衡量人工智能在一个国家、一个行业的使用率的指标。测度人工智能渗透率能够反映使用人工智能的普遍性,恰恰能够体现人工智能对经济社会的影响程度。

2.测度数据的获得。由于人工智能应用范围广、涉及领域多,因此如何选取和获取合适的数据来衡量渗透率是个关键问题。Dauth & Findeisen(2017)选取部分微观企业数据来衡量渗透率,例如使用企业年报中关于智能化发展水平的词频数来测度人工智能在企业运行各方面的影响程度。Fujii & Managi(2018)则通过问卷调查获得企业在生产、运营各个环节是否使用人工智能的基础数据,然后转化为0和1逻辑变量,测度企业各个环节的人工智能渗透率。Gofman & Jin(2020)运用北美各高等院校人工智能人才流失和教师离职的数据来测算人工智能的吸引力,从而以这种负面影响反证人工智能的影响力和渗透率。

经济合作与发展组织(2021)使用调查问卷收集数据,进而测度人工智能渗透率。调查问卷涉及领域尤为广泛,包括创新调查、信息通用技术使用情况调查、一般商业调查等。OECD通过调查问卷收集企业人工智能使用情况的统计数据,对7个OECD国家和1个机构的人工智能发展情况进行比较,从而衡量人工智能对经济社会各领域的渗透和影响程度。虽然调查问卷获取数据较为直观,涉及问题针对性也比较强,但这一测度方法也存在明显缺陷:调查结果存在较大不确定性。原因在于:一是调查对象存在差异。例如,在OECD的同一项调查中,韩国的调查对象主要是机构,而不是企业;日本的调查对象则主要是企业,这必然导致两国的调查结果有所差异。二是问卷结构有所区别。虽然问卷设计尽量相同,但是各国对人工智能的理解、内涵和外延都有所区别,因此问卷结构也有所差别。三是技术水平有所不同。人工智能只是企业数字化转型的一部分,通常与大数据、物联网和云计算等其他技术结合使用。这些互补技术的发展和应用程度都可能对调查结果产生影响。

(二)斯坦福大学测度人工智能渗透率的TF-IDF法

斯坦福大学(2021)等都把TF-IDF法作为测算人工智能渗透率的典型方法。TF-IDF是指词频逆文档频率,该方法目的在于测算某一术语在语料库文档中的重要性。t表示术语,d表示文档,D表示语料库,|D|表示所述语料库中的文件总数。TF(t,d)表示术语频率,是指术语在文档中出现的次数;DF(t,D)表示文档频率,是包含术语的文档在语料库中出现的次数。为测算方便,将DF(t,D)表示为逆文档频率IDF(t,D),其计算公式为:IDF(t,D)=

。TF-IDF或TFIDF则是TF和IDF的乘积:TFIDF(t,d,D)=TF(t,d)·IDF(t,D)。通俗理解TF-IDF就是:TF刻画了词语t对某篇文档的重要性,IDF刻画了词语t对整个文档集的重要性。如果某个词或短语在一篇文章中出现的频率高(即TF高),并且在其他文章中很少出现(即IDF高),则认为此词或者短语具有很好的类别区分能力,适用于分类。TF-IDF的值会随着单词在文档中出现次数的增加而增大,也会随着单词在语料库中出现次数的增多而减小。由逆文档频率IDF(t,D)的计算公式可见,如果一个术语出现在所有文档中,则其IDF值将变为0,此时TF-IDF也为0,说明该术语不能起到类别区分作用。

斯坦福大学(2021)在《人工智能指数报告》中即是运用这一方法测度人工智能对各国的综合渗透率,以及对教育、金融、硬件和网络、制造业、软件和IT等领域的渗透率,比较客观地反映了人工智能对经济社会发展的深刻影响。该报告首先利用LinkedIn招聘平台上的招聘率和技能普及率数据,以及Burning Glass Tech nologies人工智能招聘信息,分析了全球人工智能人才的相关信息,然后由此“人才信息”分析人工智能对就业、投资和企业活动等各领域的渗透率,以及人工智能与全球经济之间的交织关系。该报告对“人才信息”的分析是全方位的。例如,该报告在计算人工智能在工程师中的渗透率时,是通过计算2015-2020年给定经济实体(即LinkedIn工程师群体)所有自我添加技能的频率来测度的。

斯坦福大学的测度方法是,首先构建TF-IDF模型获取LinkedIn工程师群体中自我添加的最具代表性的前50项技能,这50项技能构成了该实体的“技能基因组”。如果工程师拥有的这些技能中有4项属于人工智能技能组,那么该指标表明人工智能技能在工程师中的渗透率估计为8%(即4/50)。为了能够对渗透率进行跨国比较,斯坦福大学确定了技能基因组的基准。基准是通过汇集样本中所有国家的LinkedIn工程师群体并平均其人工智能渗透率来构建的,因此基准值并不是对所有国家渗透率的平均值再进行平均而得到的。在此基础上,斯坦福大学在一个国家和基准的人工智能渗透率之间建立一个比率,即相对人工智能渗透率。例如,一个国家的相对人工智能渗透率为1.5,这表明该国人工智能渗透率是基准渗透率数值的1.5倍。

斯坦福大学运用上述方法使用2015—2020年LinkedIn上的各领域人才信息数据,测算了不同国家、不同行业的人工智能渗透率。测算结果显示,印度人工智能渗透率最高,达到全球平均水平的2.83倍;其次是美国,达到全球平均水平的1.99倍,中国为全球平均水平的1.40倍、德国为全球平均水平的1.27倍,加拿大达到全球平均水平的1.13倍。而在教育、金融、硬件和网络、制造业、软件和IT等领域,印度人工智能渗透率依然遥遥领先,美国均居第二位。在软件和IT领域,中国人工智能渗透率居第三位,在硬件和网络领域居第四位,在教育、制造业领域居第七位,在金融领域则未进入前七位。

使用TF-IDF法测度人工智能渗透率虽然简单、快捷,但是这一方法也存在一些缺陷。例如,仅以LinkedIn“人才信息”中的人工智能词频来衡量人工智能的渗透率,衡量标准比较单一,如果还能使用其他领域的人工智能词频信息,则测算结果将更有说服力。再如,过于侧重以“词频”度量词的重要性,后续构成文档的特征值序列,词之间各自独立,无法反映序列信息。再如,没有考虑类内、类间分布偏差等。TF-IDF法虽然有诸多缺陷,但是不失为测度人工智能渗透率的一种有效办法。

五、人工智能的经济影响程度测度

(一)人工智能对经济增长影响程度的测度

普遍的认识是,人工智能是通过影响技术创新和生产效率来影响经济增长的。但影响程度如何、影响路径如何,研究结论与研究者使用的测度方法有较大关系,以至于这一问题在学术界并未形成共识,争论持续不断。在测算方法上,体现典型做法的文献主要有:

Solow(1987)提出的“Solow悖论”是通过构建模型进行分析测算,然后用模型测算结果与数据统计测算结果进行对比而发现的。Solow模型深刻阐述了技术进步与经济增长的数量关系,按照Solow模型,在长期内,技术进步才是经济增长的来源。虽然该模型看似是测算技术进步对经济增长影响的理想方法,但是Solow(1987)在以信息技术为核心的新一轮技术革命大背景下重新审视技术进步与经济增长的关系,将1974-1987年发达国家经济增速数据与计算机带来的技术进步数据进行了测算对比,却发现以信息处理、信息通信技术和互联网为核心的技术进步似乎并没有提高整个经济的生产率。其后,虽经Carson & Cowen(2012)等诸多学者多次探索,但始终没有找到产生“Solow悖论”的答案。

Aghion et al(2017)依托新古典经济增长模型,分领域测算了人工智能对不同经济部门带来的影响。他们将“Baumol成本病”引入Zeira的自动化模型中,在关注人工智能加速自动化进程并获取数据进行测算的同时,进一步分析了人工智能可能带来的“Baumol成本病”,即人工智能在让自动化部门资本回报增加的同时,却让非自动化部门成本上升、回报下降。他实际上比较全面地测算了“人工智能革命”带来的双重效应,即自动化效应和 “Baumol成本病”。他们的解释是,人工智能的飞速发展可以为市场创新注入新动力,但是伴随经济发展水平提高,经济落后部门对经济发展的影响将会变得更为重要,“Baumol成本病”影响的恰恰就是这些“落后部门”,其作用更加需要引起注意。虽然“Baumol成本病”由Baumol(1967)首次提出,但真正用于人工智能分析,Aghion et al(2017)尚属首次。

诸多机构和学者对人工智能的经济影响做了定量测算,总体来看,测算方法主要有两个入手处:一方面,构建指标体系,直接从实际经济生活中获取数据,对人工智能的影响进行测算。另一方面,模型分析,然后再依托模型中经济增长和技术创新的变量关系获取数据进行测算。从测算结果看,相关文献多是测算和阐述了人工智能对经济增长的正面促进作用,而人工智能对经济增长可能带来的冲击作用则研究文献较少。目前只有Solow(1987)等对过去年份数据进行了归纳,测算结果只是对过去几年影响的一个描述,缺少系统性的理论阐述和深层机理的分析。而Aghion et al(2017)对人工智能带来的“Baumol成本病”的测算,更多停留在理论分析上,而在他的测算中,如何清晰界定自动化部门和非自动化部门,并分别从两部门获取数据,都是测算的主要难点。相较而言,斯坦福大学(2021)对人工智能发展水平及其影响的测算具有较强的可操作性,参考价值较高。

从测算结果来看,由于测算方法不同、选取的数据来源不同,测算得出的结论也存在较大的差异。一方面,不少学者旗帜鲜明地认为人工智能、互联网等新技术毫无疑问是提高了生产效率,促进了经济增长。Zeira(1998)则指出,技术进步通过两种方式提高生产效率:一是直接提高了生产效率,二是通过自动化来实现生产方式的改变。因自动化水平的提高,减少了劳动力的使用,改变了生产方式,进一步提高了生产效率。另一方面,也有不少人提出相反观点,认为人工智能并没有显著提高生产效率,甚至对经济增长没有太大改变。甚至还有些学者将“奇点”(singularity)这一数学概念类比到人工智能的发展上,讨论了人工智能发展中“奇点”存在的可能性及其可能的测算方式,但是并没有得出各方一致认可的研究结论。

(二)人工智能对劳动力就业影响程度的测度

进入20世纪以来,伴随技术进步的加快推进,各国学者和机构普遍关心人工智能给劳动力就业带来的巨大影响。正如Lempert(2019)所说,新技术正在改变就业格局,人工智能最大的争议就是可能使人类丧失工作机会。布鲁金斯学会(2019)则指出,人工智能将会创造更多工作机会。对于上述观点,欧盟委员会(2021)曾指出,“我们需要超越传统的风险和机遇辩证关系,来更好地理解人工智能及其影响。”多年来,关于人工智能对劳动力就业影响的测算始终是学界的一个热门话题,有关这一测算的研究主要集中在三个方面:

1.测度人工智能对劳动力就业带来的总体影响。总体影响主要集中在“挤出效应”和“创造效应”两个方面,测算的依据主要是人工智能技术进步与劳动力市场数据变化的关系。Acemoglu & Restrepo(2017)测算1990-2007年美国劳动力市场数据发现,机器人的确对劳动力有替代作用。BCG咨询公司和Faethm公司(2021)研究了人工智能对美国、德国和澳大利亚三个国家就业的潜在影响,结果表明,人工智能的日益普及让人类在经济中的作用大幅萎缩,数百万个工作岗位即将消失。特别是新冠肺炎疫情加速了数字化进程,甚至可能导致某些领域永久性地数字化。人工智能对工人的比例每增加 1‰,就会有0.18%~0.34%的就业岗位相应减少。Frey & Osborne(2013)使用美国O*NET数据库数据进行测算的研究结果表明,美国47%的就业岗位存在被人工智能替代的风险。与此相反,Thomas(2017)等分别运用EU KLEMS的数据、OECD中15个国家的数据进行测算则发现,信息通信技术投资将会促进就业,机器人技术的应用将会对就业产生温和的正影响。Schmid(2021)的研究表明,人工智能对就业影响的数据显示,就业岗位的减少和增加是喜忧参半的,人工智能新技术的应用本身就会带来新的就业岗位。布鲁金斯学会(2019)援引美国联邦贸易委员会专员布伦丹·卡尔(Brendan Carr)的数据指出,5G部署将在美国创造27000个就业机会,而将5G技术引入更广泛的经济领域则可以创造220万个就业机会。虽然5G与人工智能有一定差别,但对劳动力就业的影响却是大同小异,5G、人工智能等新技术正在一定程度上创造新的就业岗位。

2.测度人工智能给劳动力市场带来的结构性变化。一方面,测度人工智能对劳动力市场不同部门的结构性影响。Autor et al(2003)测算了美国1960—1998年长达39年的劳动力市场数据,首先发现计算机的应用给劳动力市场带来的“极化效应”:企业对程式化工作的需求大幅下降,对非程式化工作的需求却是增加的。实际上,反映出程式化工作正在逐渐被计算机所取代。此后,Goos & Manning(2007)等分别对英国、欧洲劳动力市场数据进行分析,同样发现这种“极化效应”。另一方面,测度人工智能对劳动力市场影响的动态变化。Chui et al(2015)测算被人工智能取代的工作岗位变化情况发现,以现有人工智能水平看,美国45%的人类工作活动可以为人工智能所取代,而一旦人工智能达到人类中等水平,则该数字将增至58%。

3.关于测度方法的建设性意见。虽然有些研究没有直接测度人工智能对劳动力市场的影响情况,但对测度方法提出了颇具深远意义的思考。例如,Goolsbee(2018)指出,测算人工智能对就业影响时不能单纯考虑人工智能这一个因素,还必须考虑价格因素、影响时间等,否则这种测算的现实意义将大打折扣。再如,Gordon(2014)认为,研究人工智能对劳动力市场的影响不能仅仅局限于研究此次以信息技术为核心的技术进步带来的影响,还必须把眼界放得更加长远。他的研究横跨第一次工业革命以来的历次重大技术进步,从大量数据中发现,近250年来并没有哪次技术进步曾经引起大规模失业,原因在于技术进步在让一些岗位消失的同时也在创造新的就业岗位。同样,人工智能作为新一轮技术革命中崛起的新技术,也不会对工作岗位造成剧烈冲击。

(三)人工智能对其他领域影响程度的测度

人工智能发展带来的技术进步正在深刻改变着传统的产业组织方式,深刻影响着企业行为,进而影响到传统规制和经济政策。定量测度人工智能对其他各领域的影响也是当前各国学者研究的重点领域之一。但目前来看,各国机构和学者的研究并不均衡,有关人工智能对收入分配影响的定量测度研究文献较多,但是对个人隐私保护影响的定量研究则非常少。可能的原因是,人工智能对收入分配的影响更为直观,便于在人工智能应用和收入之间建立函数关系,而对个人隐私保护的影响更多在于定性分析,适合用于测度的量化指标很难找到。

1.有关人工智能对收入分配影响的测度。DeCanio(2016)基于Houthakker模型中劳动、机器和普通资本的变量关系来测度人工智能对工资的影响,从而发现人工智能的发展可能会降低工资,进而增加不平等。Deshpande et al(2021)则是通过对不同收入人群发放调查问卷和开展访谈,基于问卷调查和访谈数据分析人工智能对收入分配的影响。这种测度方式虽然没有从理论上构建完善的测度方法,但受访者能够直观讨论人工智能对收入分配影响的感受,例如有受访者认为,人工智能对低薪工作的收入影响并非是不可避免的,只要有低收入的人类劳动力从事低薪工作,而且使用机器没有明显的成本优势,自动化就不是必然的发展趋势。

有关人工智能对收入分配影响的测度也通过多个视角展开。Wisskirchen et al(2017)测算不同国别的收入水平变化情况发现,人工智能对不同收入水平经济体的影响也不同,高收入经济体将比中低收入经济体更能适应人工智能主导的自动化所需的变革。例如Wisskirchen et al(2017)指出,在人工智能作用下,新加坡、中国香港、中国台湾和韩国等高收入的亚洲经济体将实现经济繁荣,而中南美洲国家和北非国家等中低收入国家可能没有能力应对自动化带来的挑战。Schmid(2021)指出,尽管认为人工智能将对职场造成大规模破坏的观点存在局限性,但人工智能将取代大量低技能和低工资的工作。还有一些学者虽未直接测算人工智能对收入水平的影响,但从理论上做出了推测。例如,Bloom(2009)曾经指出,伴随新技术“入侵”,新机器可能让劳动者变得多余而且收入下降。Autor(2015)等则认为,人工智能在提高效率的同时,也让劳动与资本份额占比下降,减少了劳动报酬份额,从而使得工资降低。

2.关于人工智能对个人隐私保护影响的测度。虽然目前这方面研究文献很少,但各国学者和机构的研究为这一领域的测度提供了很好的启发。一方面,他们提出了人工智能影响个人隐私保护的路径和原因,为今后的测度研究提供了可能的方向。Pagallo(2013)等指出,消费者信息被收集起来之后会带来很多问题。商家可以利用这些信息进行价格歧视、过度推销,甚至在某些时候会威胁到消费者安全。Tucker(2017)、Jin(2018)则进一步指出,人工智能背景下的隐私权问题来自三个方面:由于商家收集消费者信息的情况非常普遍,即使消费者信息被利用,并且伤害到消费者权益,消费者也难以知道是哪个商家所为;由于侵权的惩罚非常困难,所以即使消费者知道商家侵犯了自身权益,也很难对商家进行惩罚;由于人工智能设备可能收集比预期更多的数据,雇主实际上是在不透明的算法中使用数据。另一方面,他们提出了人工智能影响个人隐私保护的风险等级,为今后分类分级测度这一影响构建了一个初步框架。欧盟(2021)发布的人工智能监管草案成为全球首个应对人工智能风险的法律框架,该草案将人工智能带来的风险分为完全不可接受风险、高风险和低风险三类,其中有三种应用被完全禁止:第一种是在不知不觉中对人类意识进行操控,影响其决定或扭曲其行为,进而对人类造成身体或心理的伤害;第二种是利用儿童或残疾人的脆弱性对其造成伤害;第三种则是基于人工智能系统构建的社会信用体系,因为在这种信用体系下,个人或特定群体的权益可能受到损害。各国学者和机构的努力,为今后测度人工智能对个人隐私保护的影响程度奠定了基础。

六、结论与启示

近年来,人工智能已经开始广泛深入地影响人类的发展进步。全球主要经济体都把人工智能作为未来国际竞争的战略重点,如何衡量和测度人工智能发展水平已经成为各国学者和研究机构高度重视的热点问题。总结近年来的学术文献可以发现,从经济学视角测度人工智能发展水平的研究主要集中在四个方面:

1.人工智能的概念界定是测度人工智能发展水平的基础和前提。经济合作与发展组织(2019)、欧盟统计局(2019)、丹麦统计局(2019)等官方机构,还是比较保守地将人工智能回归到它的“机器”属性。McKinsey(2019)等机构和学者对人工智能的内涵进一步扩展和升华,他们更加关注人工智能的现实能力和实际用途。Kurzweil(2000)等学者则进一步拓展了人工智能的概念内涵,让人工智能具备了某种人性化、情感化的特点,有利于人工智能进一步向更高层次突破发展。人工智能的概念界定直接决定了人工智能测度的范围和尺度。

2.人工智能自身发展水平的测度是以经济学视角测度人工智能的关键所在。核心是衡量指标的确定,进而构建指标体系。Schmookler(1966)等主张用技术差距来衡量人工智能发展水平,在无法直接获得技术差距的情况下,则主张用专利数量来替代技术差距。世界经济论坛的《全球竞争力报告》(1996)、世界知识产权组织的“全球创新指数”(2018)、欧盟的“创新记分牌”(2018)、中国科学技术发展战略研究院的“国家创新指数”(2019)等一批有国际影响力的评估报告也是使用与此类似的知识产权来衡量技术差距。同时,也有不少机构和学者用其他变量来衡量人工智能的发展水平,其中包括发表论文和著作数量、生产效率差距、人均GDP 差距等。

经过多年演变和发展,人工智能测度已从着重用某项指标测度发展为多维度综合测度。虽然各国学者和机构在测度维度上并未达成一致,但向多维度综合测度的发展方向逐渐清晰。Wuzhen Institute(2017,2018,2019)、斯坦福大学(2019,2020,2021,2022)、国家工业信息安全发展研究中心(2020)、清华大学中国科技政策研究中心(2018)等机构则已尝试构建多维度指标体系,基于数据测算形成人工智能测度报告。归纳各国学者和机构的研究文献,人工智能发展水平可以从产业发展水平、技术创新水平、企业发展水平、发展环境水平、投融资水平、国际影响力等维度进行评价,每个维度又可细分为若干具体指标,由此形成测度人工智能发展水平的指标体系。

3.人工智能对经济社会总体影响水平的测度——人工智能渗透率。Dauth & Findeisen(2017)等选取部分企业、高校等微观主体数据来衡量渗透率。Fujii & Managi (2018)、经济合作与发展组织(2021)则使用调查问卷收集数据,进而测度人工智能渗透率。Beel et al(2015)等都把TF-IDF法作为测算人工智能渗透率的典型方法。斯坦福大学(2021)的《人工智能指数报告》即是运用这一方法测度人工智能对各国的综合渗透率以及对教育、金融、硬件和网络、制造业、软件和IT等领域的渗透率,比较客观地反映了人工智能对经济社会发展的影响。结果显示,印度人工智能渗透率最高,达到全球平均水平的2.83倍;其次是美国达到全球平均水平的1.99倍、中国为全球平均水平的1.40倍、德国为全球平均水平的1.27倍、加拿大为全球平均水平的1.13倍。

4.人工智能对各领域影响程度的测度是以经济学视角测度人工智能的必要延伸。因为人工智能已经深刻植入人类生活的各个领域,仅仅测度人工智能自身的发展水平已不足以全面衡量人工智能的综合发展水平,定量测度人工智能对经济社会发展的影响程度势在必行。

人工智能对经济增长影响的测度主要有两种方法:一是构建指标体系,直接从实际经济生活中获取数据,对人工智能的影响进行测算,斯坦福大学(2021)的《人工智能指数报告》就是这种测算方法的典型。二是首先进行模型分析,然后再依托模型中经济增长和技术创新的变量关系获取相关数据进行测算。比较典型的测算过程,例如Solow(1987)在构建Solow模型阐述技术进步与经济增长的数量关系之后,又于1987年通过数据测算发现,技术进步似乎并没有提高整个经济的生产率,这与他的模型推导结论并不相符,形成“Solow悖论”。Aghion et al(2017)则依托新古典经济增长模型,比较全面地测算了“人工智能革命”带来的两个效应,即自动化效应和 “Baumol成本病”。

人工智能对劳动力就业影响的测度主要是从总体上测度人工智能对劳动力就业带来的影响,从结构上测度人工智能给劳动力市场带来的变化。Autor et al(2003)等的测度结果表明,人工智能确实对劳动力就业存在替代效应,但这种替代是结构性的,即所谓“极化效应”。Pissarides(2000)等则指出,人工智能对劳动力并非只有“挤出效应”,也能创造更多新的就业岗位,产生所谓“创造效应”。也有不少学者虽然没有直接测度人工智能对劳动力市场的影响情况,但对测度方法提出了颇具深远意义的建设性意见。例如,Goolsbee(2018)提出,为了更加准确地进行测算,定量测算时还应考虑价格因素、影响时间等。

另外,人工智能对收入分配格局、个人隐私权等领域的影响及其测度也越来越受到关注。对收入分配影响的定量测度较多,但对个人隐私保护影响的定量研究则非常少。DeCanio(2016)等主要使用内生增长模型、Houthakker模型进行定量测算,并通过对被调查者进行访谈、发放调查问等形式获取数据。

总体来看,对人工智能发展水平进行测度已经迫在眉睫,这是摸清底数、有的放矢地采取措施推动人工智能发展的重要举措。基于对研究文献的梳理和总结,我们可以得到三点启示:一是高度重视人工智能测度,集中国家技术力量来研究这个问题,形成权威的人工智能测度数据。美国、欧洲、日本等都已对人工智能的范围有了官方界定,而我国人工智能的概念内涵和外延至今仍然模糊,更谈不上精确测度,不利于人工智能发展。二是牢牢抓住产业发展测度、创新能力测度这两个关键环节,打造具有中国特色的人工智能测度指标体系和权威测度结论。产业发展和技术创新才是提升人工智能综合实力的关键所在,我们应该把人工智能测度的重点更多地放在这两个领域,精准测度、精准施策,助力我国人工智能在国际竞争中立于不败之地。三是跟踪研究西方国家人工智能发展情况,及时汲取最先进的人工智能测度理念和方法。伴随人工智能发展,人工智能测度方法也在不断创新,我国的人工智能测度必须在方法上紧盯前沿、创新发展,在策略上立足本国特点、摸清对手弱点,找准未来发展的赶超点,形成中国特色的人工智能测度理论和实践,引领全球人工智能发展。

(注和参考文献略)

作者:陈凤仙,国家工业信息安全发展研究中心信息政策所

原载《经济学动态》2022年第2期