人类从经验中学习知识。经验越丰富,可以学到的知识越多。在人工智能 (AI) 学科的深度学习领域,这一原理也相通,由人工智能软硬件提供动力支持的机器从海量经验中汲取知识。机器所能学习的经验范畴,完全由其采集到的数据所界定,而数据的数量与质量,则直接决定了其能够汲取的知识广度与深度。
深度学习是机器学习的一个分支。众多传统机器学习算法受限于其有限的学习能力,即便数据量不断攀升,也难以实现知识总量的持续扩增。相比之下,深度学习系统能够借由海量数据不断提升自身性能,成为“经验累积无上限”的机器典范。当这些机器通过深度学习积累了足够丰富的经验后,它们便能应对各种特定任务,包括但不限于自动驾驶汽车、精准识别农田中的杂草、辅助医疗诊断疾病,以及高效检测机器故障等。
深度学习网络通过发现经验数据中错综复杂的结构进行学习。通过构建包含多个处理层的计算模型,深度学习网络可以创建多个抽象层级来表示数据。
例如,卷积神经网络深度学习模型可以使用大量(如几百万个)图像进行训练,比如这些猫的图像。这种类型的神经网络通常从所采集图像的像素信息中汲取知识。它能够对图像中代表猫咪特征(如爪子、耳朵和眼睛)的像素群组进行分组,从而显示出图像中猫咪的具体形态。
深度学习与传统机器学习存在根本上的差异。在此示例中,为了识别并提取出能够表示猫咪的特征元素,领域专家需要花费相当长的时间构建一个传统机器学习系统。而对于深度学习,只需要向系统提供大量的猫图像,系统便可以自主学习和提炼出猫咪的各类身体特征。
对于许多任务(例如,计算机视觉、语音识别(也称为自然语言处理)、机器翻译和机器人)来说,深度学习系统展现出了远超传统机器学习系统的卓越性能。这并不是说,构建深度学习系统比构建传统机器学习系统相对简便。尽管深度学习能够自主进行特征识别,但我们仍需要调整上千个超参数(按钮),才能确保深度学习模型发挥出高效能。
我们生活的时代充满前所未有的机遇,深度学习技术能够助力我们实现新的突破。深度学习在探索系外行星、开发新型药物、诊断疾病以及检测亚原子粒子等领域的应用中,发挥了至关重要的作用。它能够从根本上重塑我们对生物学各领域(包括基因组学、蛋白质组学、代谢组学、免疫组学等)的认知边界。
我们生活的时代同时也面临着严峻的挑战。面对气候变化对粮食生产的威胁,以及未来资源稀缺可能引发的社会动荡乃至冲突,加之全球人口预计将在 2050 年激增至 90 亿的严峻现实,环境变化的挑战将因此进一步加剧。这些跨领域、大规模的全球性挑战,亟需借助深度学习技术将人类智能推向前所未有的高度,以寻求解决方案。
回溯至约 5.4 亿年前的寒武纪生命大爆发,视觉能力的进化赋予了动物竞争优势,并迅速成为推动生物界进化进程的关键力量之一。随着生物神经网络处理视觉信息能力的不断提升,视觉为动物提供了对周围环境的认知地图,增强了它们对外界的感知能力。
如今,作为人工眼的摄像头与能够处理这些视觉信息的神经网络相结合,触发了一场由数据驱动的人工智能应用的大爆发。正如视觉在地球生命进化中所扮演的关键角色那样,深度学习和神经网络也将显著增强机器人的能力,使其能够更好地理解周围环境,做出自主决策,与人类协作,共同推动人类能力的新一轮飞跃。
机器人
机器人领域的诸多最新突破都得益于人工智能和深度学习的发展进步。例如,人工智能使机器人能够感知并响应其周围环境。从昔日单调地沿预设路径穿梭于仓库各层,到如今能够灵巧地分拣、搬运各类大小不一、易碎或混杂的物体,机器人的功能范畴实现了质的飞跃。即便是对于人类而言微不足道的任务,如轻轻拾起一颗草莓,也曾是机器人难以逾越的难关。然而,随着人工智能技术的持续精进,机器人的能力边界不断被突破。
人工智能的发展意味着我们可以期待未来有更多机器人承担起人类助手的角色。未来机器人将不仅仅像目前的某些机器人一样,只是理解和回答问题,而是能够对语音命令和手势做出回应,甚至能够预料工作人员的下一个动作。如今,协作式机器人已经与人类肩并肩工作,各自执行最能发挥其优势的独立任务。
农业
人工智能具有革新农业的潜力。如今,深度学习技术使得农民能够配备先进的智能设备,这些设备可以识别并区分作物与杂草。这一功能使除草机能够避开农作物,仅针对杂草区域进行精准而高效的除草剂喷洒。利用由深度学习支持的计算机视觉技术,农业机械还能通过精准喷洒除草剂、肥料、杀菌剂、杀虫剂和生物制剂来优化每一株植物的生长。除了减少除草剂的使用量和提高农场产量之外,深度学习的应用还可以进一步拓展到诸如施肥、灌溉和收割等其他农业生产活动中。
医学成像和医疗保健
由于能够使用高质量的数据并通过卷积神经网络进行图像分类,深度学习在医疗成像领域取得了显著成效。例如,在皮肤癌分类方面,深度学习的表现媲美甚至超越了皮肤科医生。目前,已有几家供应商获得了 FDA 的批准,将深度学习算法应用于包括肿瘤学和视网膜疾病在内的诊断图像分析。此外,通过从电子病历数据中预测医疗事件,深度学习在提升医疗保健质量方面也取得了重要进展。
深度学习的未来
现今已经有了各种针对特定类型的输入和任务进行优化的神经网络架构。例如,卷积神经网络在图像分类任务上表现出色;另一种深度学习架构——循环神经网络,则擅长处理序列数据。卷积神经网络和循环神经网络这两种模型都采用了监督学习的方式,这意味着它们需要大量数据来进行训练和学习。将来,更精密类型的人工智能将采用无监督学习。无监督和半监督学习技术正在吸引大量的研发投资。
与深度学习相比,强化学习是一种略微不同的范式,在这种模式下,智能体通过在一个模拟环境中进行试错学习,并根据奖励或惩罚来调整其行为。深度学习扩展到这一领域后,称为深度强化学习 (Deep Reinforcement Learning, DRL)。这一领域已经取得相当大的进展,例如,深度强化学习程序在一场围棋游戏中击败了人类选手。
设计用于解决问题的神经网络架构本身就是一个艰巨的任务,这不仅涉及众多需要调校的超参数,还有多种需选择以进行优化的损失函数。如何自主地学习良好的神经网络架构,目前这方面已经有相当多的研究活动。学会如何学习,也称作元学习或 AutoML,正在稳步向前发展。
当前的人工神经网络,其根基可追溯至 20 世纪 50 年代对于人类大脑信息处理机制的初步理解。然而,随着神经科学的飞速进步,深度学习模型在此基础上日益复杂与精妙,呈现出类似于生物神经大脑中用于导航的网格细胞等复杂结构。神经科学和深度学习可以从相互交流中彼此受益,并且两个领域极有可能在未来某个时点深度融合,合二为一。
我们已经不再使用机械计算机,而在未来的某个时刻,我们或许也将不再依赖传统的数字计算机,转而使用新一代的量子计算机。近年来,量子计算领域已经取得了多项突破,其提供的巨大计算能力令人瞩目,学习算法无疑将从中获益。而且,使用学习算法来理解概率量子计算机的输出也很有可能成为现实。量子机器学习现已成为机器学习领域中一个非常活跃的研究分支。随着首届国际量子机器学习大会于 2018 年的召开,量子机器学习迎来了一个崭新的起点。
消除 AI 基础架构障碍,从而实现更高效的数据收集、加速的 AI 工作负载和更流畅的云集成。