深度学习技术发展趋势浅析_深度学习方法、模型的发展趋势-程序员宅基地

技术标签: 深度学习  人工智能  

https://mp.weixin.qq.com/s/FtIhKiENv483iHE053RPkg

 

当前,人工智能发展借助深度学习技术突破得到了全面关注和助力推动,各国政府高度重视、资本热潮仍在加码,各界对其成为发展热点也达成了共识。本文旨在分析深度学习技术现状,研判深度学习发展趋势,并针对我国的技术水平提出发展建议。

 

一、深度学习技术现状

深度学习是本轮人工智能爆发的关键技术。人工智能技术在计算机视觉和自然语言处理等领域取得的突破性进展,使得人工智能迎来新一轮爆发式发展。而深度学习是实现这些突破性进展的关键技术。其中,基于深度卷积网络的图像分类技术已超过人眼的准确率,基于深度神经网络的语音识别技术已达到95%的准确率,基于深度神经网络的机器翻译技术已接近人类的平均翻译水平。准确率的大幅提升使得计算机视觉和自然语言处理进入产业化阶段,带来新产业的兴起。

 

深度学习是大数据时代的算法利器,成为近几年的研究热点。和传统的机器学习算法相比,深度学习技术有着两方面的优势。一是深度学习技术可随着数据规模的增加不断提升其性能,而传统机器学习算法难以利用海量数据持续提升其性能。二是深度学习技术可以从数据中直接提取特征,削减了对每一个问题设计特征提取器的工作,而传统机器学习算法需要人工提取特征。因此,深度学习成为大数据时代的热点技术,学术界和产业界都对深度学习展开了大量的研究和实践工作。

 

深度学习各类模型全面赋能基础应用。卷积神经网络和循环神经网络是两类获得广泛应用的深度神经网络模型。计算机视觉和自然语言处理是人工智能两大基础应用。卷积神经网络广泛应用于计算机视觉领域,在图像分类、目标检测、语义分割等任务上的表现大大超越传统方法。循环神经网络适合解决序列信息相关问题,已广泛应用于自然语言处理领域,如语音识别、机器翻译、对话系统等。

 

深度学习技术仍不完美,有待于进一步提升。一是深度神经网络的模型复杂度高,巨量的参数导致模型尺寸大,难以部署到移动终端设备。二是模型训练所需的数据量大,而训练数据样本获取、标注成本高,有些场景样本难以获取。三是应用门槛高,算法建模及调参过程复杂繁琐、算法设计周期长、系统实施维护困难。四是缺乏因果推理能力,图灵奖得主、贝叶斯网络之父Judea Pearl指出当前的深度学习不过只是“曲线拟合”。五是存在可解释性问题,由于内部的参数共享和复杂的特征抽取与组合,很难解释模型到底学习到了什么,但出于安全性考虑以及伦理和法律的需要,算法的可解释性又是十分必要的。因此,深度学习仍需解决以上问题。

 

二、深度学习发展趋势

深度神经网络呈现层数越来越深,结构越来越复杂的发展趋势。为了不断提升深度神经网络的性能,业界从网络深度和网络结构两方面持续进行探索。神经网络的层数已扩展到上百层甚至上千层,随着网络层数的不断加深,其学习效果也越来越好,2015年微软提出的ResNet以152层的网络深度在图像分类任务上准确率首次超过人眼。新的网络设计结构不断被提出,使得神经网络的结构越来越复杂。如:2014年谷歌提出了Inception网络结构、2015年微软提出了残差网络结构、2016年黄高等人提出了密集连接网络结构,这些网络结构设计不断提升了深度神经网络的性能。

 

深度神经网络节点功能不断丰富。为了克服目前神经网络存在的局限性,业界探索并提出了新型神经网络节点,使得神经网络的功能越来越丰富。2017年,杰弗里•辛顿提出了胶囊网络的概念,采用胶囊作为网络节点,理论上更接近人脑的行为,旨在克服卷积神经网络没有空间分层和推理能力等局限性。2018年,DeepMind、谷歌大脑、MIT的学者联合提出了图网络的概念,定义了一类新的模块,具有关系归纳偏置功能,旨在赋予深度学习因果推理的能力。

 

深度神经网络工程化应用技术不断深化。深度神经网络模型大都具有上亿的参数量和数百兆的占用空间,运算量大,难以部署到智能手机、摄像头和可穿戴设备等性能和资源受限的终端类设备。为了解决这个问题,业界采用模型压缩技术降低模型参数量和尺寸,减少运算量。目前采用的模型压缩方法包括对已训练好的模型做修剪(如剪枝、权值共享和量化等)和设计更精细的模型(如MobileNet等)两类。深度学习算法建模及调参过程繁琐,应用门槛高。为了降低深度学习的应用门槛,业界提出了自动化机器学习(AutoML)技术,可实现深度神经网络的自动化设计,简化使用流程。

 

深度学习与多种机器学习技术不断融合发展。深度学习与强化学习融合发展诞生的深度强化学习技术,结合了深度学习的感知能力和强化学习的决策能力,克服了强化学习只适用于状态为离散且低维的缺陷,可直接从高维原始数据学习控制策略。为了降低深度神经网络模型训练所需的数据量,业界引入了迁移学习的思想,从而诞生了深度迁移学习技术。迁移学习是指利用数据、任务或模型之间的相似性,将在旧领域学习过的模型,应用于新领域的一种学习过程。通过将训练好的模型迁移到类似场景,实现只需少量的训练数据就可以达到较好的效果。

 

三、未来发展建议

加强图网络、深度强化学习以及生成式对抗网络等前沿技术研究。由于我国在深度学习领域缺乏重大原创性研究成果,基础理论研究贡献不足,如胶囊网络、图网络等创新性、原创性概念是由美国专家提出,我国研究贡献不足。在深度强化学习方面,目前最新的研究成果大都是由DeepMind和OpenAI等国外公司的研究人员提出,我国尚没有突破性研究成果。近几年的研究热点生成式对抗网络(GAN)是由美国的研究人员Goodfellow提出,并且谷歌、facebook、twitter和苹果等公司纷纷提出了各种改进和应用模型,有力推动了GAN技术的发展,而我国在这方面取得的研究成果较少。因此,应鼓励科研院所及企业加强深度神经网络与因果推理模型结合、生成式对抗网络以及深度强化学习等前沿技术的研究,提出更多原创性研究成果,增强全球学术研究影响力。

 

加快自动化机器学习、模型压缩等深度学习应用技术研究。依托国内的市场优势和企业的成长优势,针对具有我国特色的个性化应用需求,加快对深度学习应用技术的研究。加强对自动化机器学习、模型压缩等技术的研究,加快深度学习的工程化落地应用。加强深度学习在计算机视觉领域应用研究,进一步提升目标识别等视觉任务的准确率,以及在实际应用场景中的性能。加强深度学习在自然语言处理领域的应用研究,提出性能更优的算法模型,提升机器翻译、对话系统等应用的性能。

 

 

作者简介

赵强,工学硕士,高级工程师,现就职于中国信息通信研究院云计算与大数据研究所人工智能部。主要对人工智能的技术、应用与产业开展研究,并进行相关系统软件的设计与研发。研究成果获批国家发明专利4项,软件著作权5项。

联系方式:[email protected]

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_42137700/article/details/89132022

智能推荐

RunTimeError:element 0 of tensors does not require grad and does not have a grad_fn_runtimeerror: element 0 of tensors does not requir-程序员宅基地

文章浏览阅读2.3k次。这个错误源于Pytorch对Tensor进行 backward() 自动求导时,该Tensor的requires_grad为False,requires_grad参数指定是否记录对Tensor的操作以便计算梯度。在创建Tensor时该参数默认为False,需要手动设置如下。也可以通过loss.requires_grad_(True)设置。_runtimeerror: element 0 of tensors does not require grad and does not have a

探索TensorFlow实现的DCGAN图像补全:一个创新的深度学习项目-程序员宅基地

文章浏览阅读709次,点赞17次,收藏10次。探索TensorFlow实现的DCGAN图像补全:一个创新的深度学习项目项目地址:https://gitcode.com/bamos/dcgan-completion.tensorflow在这个数字时代,图像处理和生成技术已经成为了一个炙手可热的研究领域。DCGAN-Completion.TensorFlow是一个由Bamos开发的项目,它利用了深度卷积生成对抗网络(DCGAN)来实现图像的..._defussion模型图像补全

selenium分布式部署-程序员宅基地

文章浏览阅读399次。一、下载jar包:selenium-server-standalone-3.9.1.jar,放到和chromedriver同级目录二、cmd切换到selenium-server-standalone包所在目录,执行java-jarselenium-server-standalone-3.9.1.jar-rolehub,开启hub集线器,hub可以理解为一个中转点,管理各个节点的注册和状..._selenium-server-standalone-3.9.1.jar

Android OkHttp3 上传多张图片_android okhttp3 多图上传-程序员宅基地

文章浏览阅读1.7w次,点赞10次,收藏20次。经过实践,android与php交互,已经成功搞定!一、Android 端 /** * 上传文件及参数 */ private void sendMultipart(){ File sdcache = getExternalCacheDir(); int cacheSize = 10 * 1024 * 1024; /_android okhttp3 多图上传

tensorflow学习笔记(八):LSTM手写体(MNIST)识别_mnist lstm-程序员宅基地

文章浏览阅读1.4k次,点赞2次,收藏8次。本文简单讲解了LSTM网络,然后针对MNIST数据集,讲解了LSTM进行数据集分类常用到的函数,最后给出了实战代码。_mnist lstm

10个CSS3动画工具,值得你收藏!-程序员宅基地

文章浏览阅读409次。关注公众号前端开发博客,回复“加群”加入我们一起学习,天天进步转之公众号:web前端开发人类对于运动的食物往往会投入更多的关注,因此巧妙的使用动画能够极大地提升网站的用户体验,快速唤起..._magic animations

随便推点

SD卡启动详解_量产卡 启动卡-程序员宅基地

文章浏览阅读2.5k次。一、存储设备的介绍1、主流的外部存储器介绍内存和外存的区别:RAM可以随机访问,以字节为单位,可以操作每一个地址。但是ROM就不可以了,只能以块为单位进行访问。RAM掉电数据丢失,而ROM则不会,掉电后数据是保存的。2、磁盘、CD、软盘、硬盘、光盘的区别与联系存储原理为磁存储,缺点是读写速度、可靠性等问题,优点是技术成熟、加个便宜,广泛使用在桌面电脑中,在嵌入式设备中几乎不使用。..._量产卡 启动卡

J2ME好网址-程序员宅基地

文章浏览阅读544次。http://www.j2medev.com/index.htmlhttp://www.j2medev.com/bbs/index.asp?boardid=1http://www.webstudy8.com/web/jsp/403/069316073210831.html http://lib131451.ku.8844.com/ 手机数据库http://www.pcppc.c

mybatis控制台打印Sql的两种方式_mybatis 打印sql-程序员宅基地

文章浏览阅读6.2k次,点赞2次,收藏3次。第一种方式maven工程下pom.xml 添加 log4j日志<!-- 日志 --> <dependency> <groupId>log4j</groupId> <artifactId>log4j</artifactId> <version>1.2.17</version> </dependency>在resou_mybatis 打印sql

数据库迁移从access到mysql_图文详解2种将ACCESS数据库迁移到SQLSERVER数据库的方法...-程序员宅基地

文章浏览阅读631次。数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,简单来说数据库它本身可视化成电子化的文件柜,也就是能够存储电子化文件的处所,用户可以对文件中的数据进行新增、截取、更新、以及删除等等操作。更进一步来说,数据库中的数据是以一定方式存储在一起、能为多个用户共享,且具有可能小的冗余度,以及能与应用程序彼此独立。那本文主要是介绍Access数据库迁移到SQLSERVER数据库的两种方法..._access数据库迁移数据到mysql

rdf3x-0.3.7使用入门_rdf windows c++-程序员宅基地

文章浏览阅读2.4k次。最近在做rdf的数据存储与推理,rdf3x是一个比较火的方案。在github上早就放出了源代码,基于C++开发的,而且是给了Makefile文件的方式,但是如果不熟悉C++开发的同学可能不知道如何入手。我也是自己摸索,这篇算是一个总结,对于C++大牛来说应该是皮毛中的皮毛。写下此篇的目的是搜索了很多,没有对应的解决方案。进入正题。一、资源下载1、rdf3x https:_rdf windows c++

phpstorm的安装及解释器配置和使用_安装phpstorm后安装解释器-程序员宅基地

文章浏览阅读1.1w次,点赞8次,收藏31次。phpstorm的安装及解释器配置和使用1、安装链接:https://pan.baidu.com/s/1tpvTslv-ZFpr6lqfR26F2w提取码:60vr下载后安装,点击exe文件,建议不要安装在c盘生成快捷方式和添加环境变量然后一路默认安装即可一路打开,可以先不安装开始的那些插件然后是婆劫https://www.cnblogs.com/ningjiabing/p/12972486.html2、使用创建一个项目放在你想要的地方,然后新建一个php文件,这个时候,右下角会提示_安装phpstorm后安装解释器

推荐文章

热门文章

相关标签