张钹:探索第三代人工智能,需要勇闯无人区的人才
7月3-4日,由CSDN主办的第三届AI开发者大会(AI ProCon 2020)在线上举行。本次大会有超万人报名参与,参与人群覆盖 50+ 领域、4000 家企业。其中有来自行业内 70+ 顶尖企业、开源社区与科研高校的近 100 位行业领袖、技术大咖与研究学者。
他们用更新鲜、更有趣、更年轻的方式,聚焦智能时代 AI 技术的发展曲线以及 AI 与社会各行业结合的最新应用进展,深入解析热门 AI 技术在行业中的实践与落地经验,揭示技术与行业发展面临的机遇与挑战。
在7月3日的主论坛上,清华大学人工智能研究院院长、中国科学院院士张钹带来了《人工智能的发展现状与人才培养》的主题演讲。
核心观点:人工智能经历了两种发展范式:符号主义和连接主义,我们分别称之为第一代和第二代人工智能,这两种范式发展至今都遇到瓶颈,从而触及天花板。今后发展的方向是第三代人工智能,这是一条前人没有走过,需要大家去探索的道路,将对科学研究、产业化和人才培养产生重大影响。
以下内容为演讲实录:
我是清华大学人工智能研究院的张钹。大家知道,人工智能的发展历经两种发展方式,一个是符号主义,另一个是连接主义,我们把符号主义叫做第一代人工智能,把连接主义叫做第二代人工智能。但是这两种发展模式/发展方式今天都遇到了瓶颈,触及了天花板。今后发展的方向是第三代人工智能,而这是一条前人没有走过的,需要大家去探索的道路。
第三代人工智能的发展将对科学研究产业化和人才培养有什么影响呢?下面我们来具体说明。
第一代人工智能-符号主义
第一代人工智能就是大家所说的符号主义,实际上它是建立了一个知识和推理的模型,来模拟人类的理性的智能。在具体应用上,就是利用了知识和推理,构造化学结构分析系统、计算机硬件组合系统、血液传染病诊断处方等系统。
我们回过头来看,会发现建立MYCIN医疗诊断专家系统,其实就是把传染病专家的知识和经验放在知识库中,把医生看病的过程,如何从症状推断疾病,再推理出处方的推理机制放在计算机中。这样,内科医生通过与计算机的交互,就可以通过计算机帮助他/她来诊断血液传染病。
这种用知识和推理建立的模型,主要是用来模拟人类的理性智能,它的代表性成果是国际象棋。国际象棋是完全信息博弈,实际上与决策、规划、诊断、设计和调度等,都属于理性智能/理性分析。这个系统打败了人类国际象棋冠军卡斯帕诺夫,这就说明这样的系统在一定的条件下能够超过人类的水平。
这种系统成功的秘诀在什么地方?也就是说第一代人工智能成功的秘诀,主要有下面三个因素:
一是依靠知识和经验。以IBM深蓝为例,它分析了70万盘象棋大师下过的棋,还有全部5~6个棋子的残局。根据这些残局和大师下过的棋,总结出来下棋的规则。同时又通过大师和机器的对弈,对有8000个参数的评价函数进行调整,这样就可以把大师的经验也放到程序里。
第二个因素是算法。当时深蓝主要常用采用的是α-β剪枝算法。
最后一个是算力,当时深蓝使用的是IBM RS 6000 SP2,大体上每秒钟可以分析2亿步,平均来讲是每分钟能够搜索8-12步。
第一代人工智能的优势
我们看一下第一代人工智能的优点。它可以模仿人类的理性智能。首先,它可以解释,可以和人类一样基于知识进行推理,我们不仅可以用来作为理性分析的模型,同时基于知识也可以用来进行机器学习。
这种基于知识的符号学习,可以克服基于数据驱动机器学习方法的缺陷,也就是深度学习方法的那些缺陷,比如不可解释性,推广能力很弱,需要大量的数据等。
第一代人工智能的局限性
但是,第一代人工智能最主要的局限性,体现在它不能随机应变,即基本上只能解决完全信息和结构化环境下的确定性问题。比如下国际象棋就是一个完全信息的,并按照一定规律演化过程。
另外,无论是IBM的深蓝,还是MYCIN医疗诊断系统,所有的知识都是用人工来编制的,所以在知识自动获取和表示上目前还有一些困难。此外,还有一个局限性是涉及到不确定性的知识与推理,第一代人工智能还没有很好的解决办法,导致其应用的范围有限。
第二代AI——深度学习
第二代人工智能,也就是我们现在非常熟悉的深度学习,有时也被称为亚符号模型,或者连接主义方法。
它实际上是通过模拟人类的神经元、神经系统的机制来模拟人类的感性智能/感知(主要),其基本方法如图左所示,把图像/语音直接输入到人工神经网络中。所谓人工神经网络实际上就是一个算法,对输入的信息进行分类,比如这个图像究竟是马还是牛。
因此,深度学习在模式识别上,就是将原始输入数据进行分类,其重要特点是不需要领域知识。过去我们要识别一幅图像,必须人工选择合适的特征。有了深度学习以后,把原始图像的像素输进去就可以识别。
这说明在深度学习中,我们不需要图像相关的知识和语音知识,直接把图像和语音的原始信号输进去就可以,这就使得使用门槛降低,没有专业知识的人也可以使用深度学习。
第二代人工智能的第二个优点是,因为深度学习是使用多层神经网络,这就赋予其强大的学习能力,因此能够处理大数据。
最后,深度学习第二代人工智能主要依靠三个要素:数据、算力,还有算法。使用深度学习以后可以解决很多实际问题,比如图像识别、语音识别的识别率有了大幅提升,2011年在IBM和微软在ImageNet上的图像误识率为50%,4年之后使用深度学习后误识率降到3.57%,实际上超过人类的水平。
第二代人工智能的局限性
但是第二代人工智能也有很大的局限性,最重要的是不能举一反三。
首先,它不可解释,也就是说它可以分辨牛或马,但是我们不知道它的根据,因为这是根据多层神经网络计算得出的结果。第二点是不安全,非常容易受攻击。第三是不易推广,最后一点是需要大量样本来学习。在视觉领域的安全性尤其令人担忧。
比如左边第一张图是一个停止的交通信号,我们只要在交通指示牌上加入一点噪声,图中是加上了几个白块和黑块,它却识别为限速45公里。再比如在图中最左边的坦克侧面涂上一些颜色,机器就将其误识别为校车。这说明,利用深度学习来构造的图像识别系统非常不安全,非常容易受攻击。
人工智能产业现状:大部分不盈利、应用场景有限
利用第一代人工智能技术和第二代人工智能技术构造的系统有什么问题?用这些技术来进行产业化目前的现状是怎样的?
我们可以看到,目前人工智能在很多领域得以应用,包括交通、医疗、安保、智慧城市、家庭服务、智能制造、金融等,同时可以看到这些领域中的人工智能企业数量很多,但是规模很小,大多数是几十人到几百人的规模,千人以上的大企业很少。
人工智能产业的第二个特点是大部分没有盈利。原因就在于第一代人工智能和第二代人工智能技术的局限性,主要表现在两个方面,一方面是现有技术的应用场景有限,只能应用到那些结构化、静态的环境中,比如把现有的第一代和第二代人工智能技术应用到自动驾驶场景中时,如果交通状况比较复杂,就很难应用。
第二是技术本身有局限性。所以,为了使得人工智能的研究工作有进展,特别是为了让企业做大做强,我们必须要发展第三代人工智能的理论和技术。
迈向第三代人工智能需要突破一些理论、方法与关键技术
第三代人工智能理论和关键技术主要为以下三点:
第一,我们必须要探索出可解释和鲁棒的人工智能理论。换句话讲,现在的第一代和第二代人工智能都不够好用怎么办?第二个就是要发展安全、可信、可靠和可扩展的人工智能技术,从而推动人工智能的创新应用。
第三代人工智能的优点有哪些?
如前所述,第一代人工智能符号主义的模型依靠的是知识、算法和算力。第二代人工智能,即亚符号模型/连接主义模型主要依靠的是数据、算法和算力。我们现在发展第三代人工智能,最主要的措施就是把第一代人工智能知识驱动的方法和第二代人工智能数据驱动的方法结合起来,这就可以使我们充分地利用4个要素——知识、数据、算法和算力,特别是算法,即如何去研究新的理论和方法。
下面介绍一下这方面的工作。
在第一代人工智能中,我们做过的一些专家系统,但这些专家系统的规模都比较小,实用性较差。那么我们现在介绍一下在这个方向上做的努力,最典型的代表是美国的沃森系统。
大家知道沃森系统是一个很成功的人工智能系统,它在全美的电视智力竞赛中打败两个全美冠军。它与第一代人工智能相比不同之处在哪里?
当时要建立专家系统,主要的知识和经验来自于专家,比如MYCIN系统传染病的诊断系统,它的知识主要来自于传染病专家。而专家知识是非常昂贵和稀缺的,而且要把专家的知识表示在计算机中,非常耗时耗力,即使是规模不大的MYCIN系统也需要三年才能做出来。主要的挑战是如何扩大人工智能的规模,使其更加实用化,最重要的方法是引进大量的数据。
网络上有大量的非结构化的数据,我们如何自动地把这些非结构化的数据变成计算机可用的语料库,这个问题在沃森系统里得到很好地解决。
有了大量的语料库后,沃森可以利用多种推理机制来解决“问答”的问题,经过对“问题”进行分析与分解,从语料库中找出候选答案,对候选答案进行评分和排序,最后输出问题的答案。
人工智能改变医疗行业
人工智能应用中另一个大的问题是如何使人工智能技术更加可靠、可信。以医疗系统为例。“医疗”主要有三个要素——医务人员、病人和医疗设备和医疗技术。随着医疗技术的发展,医生可以利用先进的设备和技术对病人进行更加高效、准确的诊断。
即使设备和技术有巨大的变化,医务人员和病人的关系始终没有变,也就是说医务人员利用设备和技术为病人治病,所有责任都在医务人员身上,所以病人去看病,主要取决于对医务人员的信任。
设备技术智能化会对医务人员和病人关系起到什么作用呢?由于智能化的设备和技术也参与到诊断过程和疾病的分析过程,这样就产生一个问题,病人和医务人员是否信任设备和技术做出的诊断和决策。所以,当设备智能化以后,我们需要建立一套互信、可靠、高效运行的新医疗系统。
目前的技术,包括人工智能技术,还不足以建立起医生、患者和机器三者之间的信任关系。以医学图像识别为例,假如计算机分析 x光片,诊断出病人患有肺癌,但是目前用深度学习方法做出的诊断是不可解释的,医生也无法信任这个结果。所以,只有解决了深度学习图像识别不可解释的问题,才可以建立起病人对诊断结果的信任。
换句话讲,我们要想让这些人工智能技术在医学诊断中发挥更大的作用,就必须提高它的可信度、可靠性和可解释性等。
另外,机器人在服务行业、制造业中有大量应用,比如手术机器人。可以看到,这些机器人的应用场景基本上是结构化的环境,即环境基本上是固定不变的,服务机器人目前在这个领域的应用较多。但是像自动驾驶工作在非结构化环境下,应用就困难得多。所以,我们要想让机器人在更多的领域中应用,也必须解决随机应变等鲁棒性等问题。
我们需要勇闯无人区的创新人才
以上是人工智能的发展现状,从发展现状出发,我们来分析一下未来对人工智能人才培养的要求。
首先,目前发展到第一代和第二代人工智能,我们遇到了瓶颈,需要发展新的第三代人工智能,大家都在探索一条前人都没有走过的道路,因此,无论是对科学研究、开发还是产业来说,都需要有从0~1的创新,因为我们没有办法沿着前人已经走过的路走,所以,技术人员、开发人员和企业家要有一种精神,敢于闯无人区,这是一个很重要的要求。
第二,技术人员,包括管理人员不仅要能够解决问题,更重要的是能提出问题和发现问题。在大学和研究生培养计划下,我们的重点都是在培养解决问题的能力,而在发现问题和提出问题上有所不足。因此,对这样的人才培养必须是提出问题和解决问题的能力并重。
第三,能够理论与实际结合,技术和产业结合。
最后,人才不限于科技人才,还包括管理人才,人工智能企业要想做大做强,必须很好地把资本市场和技术结合起来。因此,我们不仅要培养科技人才,也需要各种各样的管理人才,但不管是管理人才和技术科技人员,创新是最主要的要求。
热门文章
- CVIC SE Enters the Jamaican Expressway Market with the Strat
- Huawei and Haier Sign the Strategic Cooperation Agreement
- Sunyard and Chouzhou Commercial Bank Develop the Internet Fi
- To Build the Cloud Ecology, Taiji and Huawei Sign a Strategi
- 截止到2006年底通过CMM评估的企业(不完全统计)
- 2004年独立软件开发企业 最大规模前30家企业名单
- 2005年“中国500最具价值品牌”
- 2005全球银行按市值排名前25家银行