如今,人工智能(AI)正处于一个日前流行的趋势中,企业对于一种名为“深度学习”的人工智能形式越来越感兴趣。
根据调研机构Gartner的统计,2018年人工智能可能为企业创造1.2万亿美元的商业价值,将比去年增加70%。“由于计算能力、数量、速度和数据的多样性,以及深度神经网络(DNNs)的进步,人工智能在未来10年内有望将成为最具颠覆性的技术类别。”Gartner公司研究副总裁John-David Lovelock说。
这些深度神经网络用于深度学习,大多数企业认为这对他们的组织很重要。 O'Reilly公司在2018年发表的题为“企业如何通过深度学习让人工智能工作”的报告表明,接受调查的企业中只有28%在使用深度学习。然而,92%的受访者认为深度学习将在未来的项目中发挥作用,54%的受访者认为这种角色将是重要的或是必不可少的。
尽管深度学习似乎具有巨大的好处,但这种人工智能形式仍然还不成熟。如果深度学习技术要实现其早期的期望,研究人员和企业需要克服许多障碍。
什么是深度学习
要理解什么是深度学习,人们首先需要理解它是更广泛的人工智能领域的一部分。简而言之,人工智能涉及教计算机思考人类的思维方式,其中包括各种不同的应用,例如计算机视觉、自然语言处理和机器学习。
机器学习是人工智能的一个子集,它使计算机在没有明确编程的情况下能够更好地完成任务。企业使用机器学习来进行欺骗欺诈检测、推荐引擎、流分析、需求预测和许多其他类型的应用。这些工具随着时间的推移而不断改进,因为它们摄取更多的数据,并在数据中找到相关性和模式。
深度学习是一种特殊的机器学习,在2012年,几位计算机科学家就这个主题发表论文时表明机器学习将变得更加流行,其见解是“深刻的”,因为它通过许多不同的层来处理数据。例如,正在接受计算机视觉培训的深度学习系统可能会首先学会识别出现在图像中的物体边缘。这些信息被传送到下一层,可能会学习识别角落或其他特征。它一遍又一遍地经历同样的过程,直到系统最终开发识别物体甚至识别人脸的能力。
大多数深度学习系统都依赖于称为深度神经网络(DNN)的一种计算机体系结构。这些都是仿生的大脑生物模型,并使用所谓的“神经元”的互连节点来处理他们的工作。
深度学习用例
目前很多行业厂商正在使用深度学习来为许多不同类型的应用程序提供支持。一些最常见的包括:
•游戏:2015年,许多人开始对深度学习有所认识,当时AlphaGo公司的深度学习系统成为第一种在棋盘游戏AlphaGo中击败人类的人工智能系统,并且多次重复这种壮举。据AlphaGo网站称,“人工智能系统的表现非常令人吃惊,颠覆了人类数百年来的棋盘游戏智慧,并且已经被各级玩家广泛检验。在获胜的过程中,AlphaGo以某种方式向世人传授了新的知识,也许是历史上最需要研究和思考的游戏。”
•图像识别:如前所述,深度学习对计算机视觉应用特别有用。微软、谷歌、Facebook、IBM等已成功地使用深度学习来训练计算机识别图像内容和/或识别人脸。
•语音处理:深度学习也有助于识别人类语言,将文本翻译成语音并处理自然语言。它可以帮助从他们的场景中识别单词的含义,并且使像Siri和Cortana这样的聊天机器人和语音助理能够与用户进行对话。
•翻译:训练深度学习系统以理解一种语言之后的下一个逻辑步骤是教会它理解多种语言并进行翻译。几家供应商已经做到了,现在提供具有深入的基于学习的翻译功能的API。
•推荐引擎:用户已经习惯于像亚马逊这样的网站和Netflix等服务,根据他们以前的活动提供推荐。这些推荐引擎中的很多都是通过深度学习提供支持,这使得他们能够更好地随着时间的推移进行推荐,并使他们能够找到程序人员可能错过的偏好中的隐藏关联。
•文本挖掘:文本挖掘是对文本进行分析的过程。例如,它可以使人们确定撰写文本的人员的感受和情绪,或者可以从文档中提取主要想法,甚至撰写摘要。
•分析:大数据分析已成为大多数企业开展业务的一个组成部分。机器学习(特别是深度学习)有望使预测性和前瞻性分析甚至比现有的更好。
•预测:分析最常见的用途之一是预测即将发生的事件。企业正在使用深度学习来预测客户需求、供应链问题、未来收益等等。
•医疗:深度学习在医疗领域也有着无数的潜在用途。例如,它可能比放射科医师阅读扫描影像更好,并且可以为诊断引擎提供动力,从而增强人类医生的能力。
在O'Reilly公司的调查中,受访者表示他们最感兴趣的是将深度学习用于计算机视觉、文本挖掘和分析。预计随着研究人员找到应用该技术的新方法时,其潜在的用例列表将会增长。
深度学习挑战
虽然深度学习具有令人印象深刻的能力,但是一些障碍正在阻碍其广泛采用。它们包括以下内容:
•技能短缺:当O'Reilly公司的调查询问是什么阻碍人们采用深度学习时,受访者的第一个反应就是缺乏熟练的员工。2018年全球人工智能人才报告表明,“全世界大约有22,000名获得博士学位的研究人员可以从事人工智能研究和应用工作,目前只有3074名候选人正在寻找这样的工作。”企业正试图通过培训现有的IT人员来弥补这一缺口,但这一过程很慢。
•计算能力:深度神经网络(DNN)需要高度先进的计算机基础设施,通常是具有大量图形处理单元(GPU)的高性能计算(HPC)系统,这些系统尤其擅长深度学习所需的计算类型。在过去,这种水平的硬件对于大多数组织来说成本费用太高。然而,基于云计算的机器学习服务的增长意味着组织可以在没有高昂的前期基础设施成本的情况下访问具有深度学习功能的系统。
•数据挑战:深度学习也会受到妨碍其他大数据项目的数据质量和数据治理挑战的阻碍。用不良数据训练深度学习模型会引发创建具有内在偏见和不正确或令人反感的结果的系统的真实可能性。数据科学家需要注意他们用来训练模型的数据一定尽可能地准确和公正。
•批评者:有人认为深度学习本质上是危险的,因为它会放大创建系统的人的内在偏见。其他人则表示,虽然深度学习可以解决一些问题,但是该技术具有其根本的局限性,将会阻碍它在许多应用中发挥作用。虽然这些反对的声音不太可能阻止人们采用深度学习,但它们确实似乎在一定程度上放缓了这一过程。
开源深度学习工具
许多最常见的深度学习和人工智能工具都可以通过开源许可证获得。一些最受欢迎的工具包括以下内容:
•在O'Reilly公司对TensorFlow的调查中,61%的受访者表示他们使用的是TensorFlow,它很容易成为当今最流行的深度学习框架。它由谷歌公司创建,是许多深度学习云计算服务的基础。
•Keras这是O'Reilly公司研究中第二个最受欢迎的深度学习工具。这是一个基于Python的神经网络API,与TensorFlow、Theano和Microsoft Cognitive Toolkit集成。
•O'Reilly公司对PyTorch Number 3的调查中,PyTorch是一个基于Python的深度神经网络框架,它融合了Torch张量库,它提供GPU加速、灵活性和速度等性能。
•Caffe由Berkeley AI Research(BAIR)创建,Caffe是一个开源的深度学习框架,拥有富有表现力的架构、可扩展的代码、速度和强大的社区。据其网站称,它每天可以用一个NVIDIA K40 GPU处理超过6000万个图像。
•Caffe2由Facebook公司开发,Caffe2建立在原来的Caffe上,并承诺具有高度的可扩展性。它是轻量级和模块化的,网站上有大量预先训练好的模型,可加速应用程序的开发和部署。
•MXNet这个Apache孵化项目旨在加快计算速度,尤其是深度学习期间DNN执行的计算。它拥有高性能、干净的代码,可以访问高级API和低级控制。
•Gluon项目由AWS公司和Microsoft公司提供,为MXNet提供接口。预计它也将包含在未来的Microsoft Cognitive Toolkit版本中。
•微软认知工具包(Microsoft Cognitive Toolkit)这个项目以前称为CNTK,是一种免费、易用、开源、商业级的工具包,可以训练深度学习算法,以便像人脑一样学习。它支持Python、C ++、BrainScript编程语言,以及强化学习、生成对抗网络、有监督和无监督学习。
•H2O被诸如ADP、CapitalOne、思科、Progressive、Comcast、PayPal和Macy's等公司所使用,H2O声称它是面向企业的第一个开源机器学习平台,它提供了高级算法和内存处理以实现快速性能拥有大量的数据集,该公司提供基于开源项目的商业产品。
•Theano这个Python库已被许多深度学习和人工智能应用程序使用。它提供了与NumPy的紧密集成、GPU的透明使用、高效的符号差异化等功能。
•DeepDetect这款开源深度学习服务器基于Caffe,TensorFlow和DMLC XGBoost。其知名用户包括空客和微软。
云端人工智能/深度学习服务
供应商 | 深度/人工智能学习工具 | 说明 |
Amazon Web Services | AWS Deep Learning AMIs | 预先安装了深度学习框架的EC2实例;支持TensorFlow、MXNet、Microsoft Cognitive Toolkit、Caffe、Caffe2、Theano、Torch、PyTorch、Chainer和Keras |
AWS SageMaker | 完全托管的基于云计算的TensorFlow服务 | |
AWS DeepLens | 为学习者开发的深度学习型摄像机 | |
谷歌云平台 | Cloud Machine Learning Engine | 支持多种机器学习框架的托管云服务,其中包括TensorFlow和Keras |
微软Azure | Machine Learning Services | 作为云服务提供的超级优化深度神经网络 |
IBM | Watson Studio Deep Learning | 为数据科学家设计的深度学习服务 |
Deep Cognition | Deep Learning Studio-Cloud | 通过拖放界面和预先训练好的模型深入学习 |