深度学习发展概述_深度学习 猫狗识别 发展历史-程序员宅基地

技术标签: 深度学习发展概述  人工智能发展综述  研究综述  深度学习  深度学习研究概述  

目录

什么是深度学习

深度学习如何工作

什么是深度学习神经网络?

深度学习方法 

深度学习应用示例

深度学习有什么用?

局限与挑战

深度学习与机器学习

深度学习发展历史

什么是深度学习

深度学习是机器学习(ML)和人工智能(AI)的一种,它模仿人类获得某些类型的知识的方式。深度学习是数据科学的重要元素,其中包括统计和预测模型。对于负责收集,分析和解释大量数据的数据科学家而言,这是极为有益的。深度学习使此过程变得更快,更容易。
最简单的说,深度学习可以被视为自动化预测分析的一种方式。尽管传统的机器学习算法是线性的,但深度学习算法却以越来越复杂和抽象的层次结构堆叠在一起。

要了解深度学习,请想象一个第一个单词是dog的小孩。幼儿通过指向物体并说出“ 狗 ”一词来了解狗是什么—不是狗。父母说:“是,那是狗”,或者:“否,那不是狗”。随着幼儿继续指向物体,他逐渐意识到所有狗所具有的特征。幼儿在不知情的情况下通过建立一个层次结构来阐明复杂的抽象概念(狗的概念),在该层次结构中,每个抽象层次都是使用从层次结构的上一层获得的知识来创建的。

深度学习如何工作


使用深度学习的计算机程序所经历的过程与蹒跚学步的学习来识别狗的过程几乎相同。层次结构中的每个算法都对其输入应用非线性变换,并使用其学习的知识来创建统计模型作为输出。迭代一直持续到输出达到可接受的精度水平为止。数据必须经过的处理层数才是促使标签产生深刻影响的原因。

在传统的机器学习中,学习过程是受监督的,并且程序员在告诉计算机应确定什么样的事物以决定图像包含一只狗还是不包含一只狗时必须非常具体。这是一个费力的过程,称为特征提取,计算机的成功率完全取决于程序员为“狗”准确定义特征集的能力。深度学习的优势是程序无需监督即可自行构建功能集。无监督学习不仅更快,而且通常更准确。

最初,可能会向计算机程序提供训练数据-一组图像,人类已经使用meta标签将图像标记为“狗”或“非狗”。该程序使用从训练数据中接收到的信息来创建“狗”的功能集并建立预测模型。在这种情况下,计算机首先创建的模型可能会预测图像中具有四只腿和一条尾巴的任何物体都应标记为“狗”。当然,该程序不知道标签“四腿”或“尾巴”。它将仅查找数字数据中的像素模式。每次迭代,预测模型都会变得更加复杂和准确。

与需要花费数周甚至数月才能了解“狗”概念的幼儿不同,可以向使用深度学习算法几分钟让计算机程序学习一个训练集,并对数百万张图像进行分类,以准确识别其中包含狗的图像。

为了达到可接受的精度水平,深度学习程序需要访问大量的培训数据和处理能力,在大数据和云计算时代之前,程序员都无法轻松获得这两种数据。因为深度学习编程可以直接从其自己的迭代输出中创建复杂的统计模型,所以它能够从大量未标记,未结构化的数据中创建准确的预测模型。这一点很重要,因为物联网(IoT)继续变得越来越普及,因为人类和机器创建的大多数数据都是非结构化的,并且没有标签。

什么是深度学习神经网络?


一种先进的机器学习算法,称为人工神经网络,是大多数深度学习模型的基础。结果,深度学习有时可能被称为深度神经学习或深度神经网络。

神经网络有几种不同的形式,包括递归神经网络,卷积神经网络,人工神经网络和前馈神经网络-每种对特定用例都有好处。但是,它们都以某种相似的方式起作用,通过输入数据并让模型自己确定模型是否对给定的数据元素做出了正确的解释或决策。

神经网络涉及反复试验的过程,因此它们需要大量的数据进行训练。仅在大多数企业接受大数据分析并积累大量数据存储之后,神经网络才流行起来,这并不是巧合。由于模型的前几次迭代涉及对图像或语音部分内容的某种程度的猜测,因此必须标记训练阶段使用的数据,以便模型可以查看其猜测是否准确。这意味着,尽管许多使用大数据的企业拥有大量数据,但非结构化数据的帮助较小。非结构化数据只有经过训练并达到可接受的准确性水平,才能通过深度学习模型进行分析,但是深度学习模型无法对非结构化数据进行训练。

深度学习方法 

可以使用各种不同的方法来创建强大的深度学习模型。这些技术包括学习率,迁移学习,从头开始和dropout训练。

学习率。学习速率是一个超参数-一个在学习过程之前定义系统或为其操作设置条件的因素-每次更改模型权重时,响应于估计的误差,它控制模型经历多少变化。太高的学习率可能会导致不稳定的训练过程或学习不太理想的权重。学习率太低可能会导致冗长的培训过程,从而有可能被卡住。

学习速率衰减方法-也称为学习速率退火或自适应学习速率-是调整学习速率以提高性能并减少训练时间的过程。训练期间最简单,最常见的学习率调整包括随着时间的推移降低学习率的技术。

转移学习。这个过程涉及完善先前训练过的模型;它需要一个到现有网络内部接口。首先,用户向现有网络提供包含以前未知分类的新数据。一旦对网络进行了调整,就可以使用更具体的分类功能执行新任务。这种方法的优点是比其他方法需要更少的数据,从而将计算时间减少到数分钟或数小时。

从头开始培训。此方法要求开发人员收集大标签的数据集并配置可以学习功能和模型的网络体系结构。此技术对于新应用程序以及具有大量输出类别的应用程序特别有用。但是,总的来说,这是一种不太常用的方法,因为它需要大量的数据,导致培训需要几天或几周的时间。

dropout。该方法试图通过在训练过程中从神经网络中随机删除单元及其连接,来解决具有大量参数的网络过拟合的问题。已经证明,dropout方法可以改善神经网络在语音识别,文档分类和计算生物学等领域的监督学习任务中的性能。

深度学习应用示例

由于深度学习模型以类似于人脑的方式处理信息,因此它们可以应用于人们执行的许多任务。目前,深度学习已用于大多数常见的图像识别工具,自然语言处理和语音识别软件中。这些工具开始在自动驾驶汽车和语言翻译服务等各种应用程序中出现。

深度学习有什么用?

如今,深度学习的用例包括所有类型的大数据分析应用程序,尤其是那些侧重于自然语言处理,语言翻译,医学诊断,股市交易信号,网络安全和图像识别的应用程序。

当前正在使用深度学习的特定领域包括:

客户体验。深度学习模型已经用于聊天机器人。并且,随着其不断成熟,有望在各种企业中实施深度学习,以改善客户体验并提高客户满意度。
文字生成。正在教机器文本的语法和样式,然后使用该模型自动创建与原始文本的正确拼写,语法和样式匹配的全新文本。
航空航天和军事。深度学习被用于从卫星中检测物体,以识别感兴趣的区域以及部队的安全区域或不安全区域。
工业自动化。深度学习通过提供自动检测工人或物体何时离机器太近的服务,正在改善工厂和仓库等环境中的工人安全。
添加颜色。可以使用深度学习模型将颜色添加到黑白照片和视频中。过去,这是一个非常耗时的手动过程。
医学研究。癌症研究人员已开始在其实践中实施深度学习,以自动检测癌细胞。
计算机视觉。深度学习极大地增强了计算机视觉,为计算机提供了极高的精度,可进行对象检测以及图像分类,恢复和分割。

局限与挑战

深度学习模型的最大局限性在于它们通过观察来学习。这意味着他们只知道他们所训练的数据中包含的内容。如果用户的数据量很少或来自某个特定来源(不一定代表更广泛的功能区域),则模型将无法以可推广的方式学习。

偏差问题也是深度学习模型的主要问题。如果模型训练包含偏差的数据,则该模型将在其预测中重现这些偏差。对于深度学习程序员而言,这是一个令人头疼的问题,因为模型会根据数据元素的细微变化来学习区分。通常,程序员无法明确确定其确定的重要因素。这意味着,例如,面部识别模型可能在不了解程序员的情况下,根据种族或性别等因素来确定人的性格。

学习率也可能成为深度学习模型的主要挑战。如果速率太高,则模型将收敛太快,从而产生次优解。如果速率太低,则该过程可能会卡住,甚至很难找到解决方案。

深度学习模型的硬件要求也会造成限制。需要多核高性能图形处理单元(GPU)和其他类似的处理单元,以确保提高效率和减少时间消耗。然而,这些单元很昂贵并且消耗大量能量。其他硬件要求包括随机存取存储器(RAM)和硬盘驱动器或基于RAM的固态驱动器(SSD)。

其他限制和挑战包括:

深度学习需要大量数据。此外,功能更强大,更准确的模型将需要更多参数,从而需要更多数据。
训练后,深度学习模型将变得僵化,无法处理多任务。他们可以提供有效而准确的解决方案,但只能解决一个特定问题。即使解决类似的问题,也需要重新培训系统。
任何需要推理的应用程序-例如编程或应用科学方法-长期计划和类似算法的数据操作都完全超出了当前的深度学习技术所能实现的范围,即使是使用大数据也是如此。

深度学习与机器学习

深度学习是机器学习的一个子集,它通过解决问题的方式与众不同。机器学习需要领域专家来识别大多数应用功能。另一方面,深度学习会逐步学习特征,从而消除了对领域专业知识的需求。这使得深度学习算法的训练时间比机器学习算法要长得多,机器学习算法只需要几秒钟到几小时。但是,在测试期间反之亦然。深度学习算法运行测试所需的时间比机器学习算法要少得多,后者的测试时间随数据量的增加而增加。

此外,机器学习不需要像深度学习那样昂贵的高端机器和高性能GPU。

最后,由于其卓越的可解释性或理解解决方案的能力,许多数据科学家选择传统的机器学习而非深度学习。当数据较小时,机器学习算法也是首选。

深度学习变得可取的情况包括大量数据,缺乏对特征自省的领域理解或复杂问题(例如语音识别和自然语言处理)的情况。

深度学习发展历史

深度学习的历史可以追溯到1943年,当时Warren McCulloch和Walter Pitts使用数学和算法为神经网络创建了一个计算模型。但是,直到2000年代中期才出现“深度学习”一词。在Geoffrey Hinton和Ruslan Salakhutdinov发表论文之后,它得到了普及,该论文显示了如何一次训练多层神经网络。

2012年,Google的算法显示了识别猫的能力,从而在深度学习方面给人留下了深刻的印象。两年后,2014年,谷歌从英国收购了人工智能初创公司DeepMind。两年后,2016年,谷歌DeepMind的算法AlphaGo掌握了复杂的棋盘游戏Go,在汉城的一场比赛中击败了职业玩家Lee Sedol。

最近,深度学习模型已在人工智能领域取得了大多数进步。深度强化学习已经成为一种将AI与复杂的应用程序集成的方式,例如机器人技术,视频游戏和自动驾驶汽车。深度学习与强化学习之间的主要区别在于,深度学习是从训练集中学习,然后将学到的知识应用于新的数据集,而深度强化学习则通过使用连续反馈调整动作来动态学习,以优化奖励。

增强型学习代理具有对生成的对抗网络(GAN)进行快速而强大的控制的能力。对抗阈值神经计算机(ATNC)将深度强化学习与GAN结合在一起,以设计具有特定的所需药理学性质的有机小分子。

GAN还被用于生成用于机器学习任务的人工训练数据,可用于数据集不平衡的情况或数据包含敏感信息的情况。

这是深度学习程序如何工作的非常简单的说明。LuLu Art Group的这段视频显示了在使用原始运动捕捉数据进行初始训练后的深度学习程序的输出。该程序可以预测“舞蹈”的抽象概念。

视频链接:https://www.youtube.com/watch?time_continue=12&v=QnaKyc1Mpmo&feature=emb_logo

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_40651515/article/details/105925646

智能推荐

java方法的返回值储存到数组_java方法能返回数组么-程序员宅基地

文章浏览阅读1.3k次。这次要讲的是数组作为方法返回值的使用。一个方法可以有多个参数,可是只能有一个返回值,不可以有多个返回值。如果希望一个方法当中产生多个数据结果进行返回,那么就需要数组来作为返回值。数组作为方法返回值数组作为方法的返回值,返回的是数组的内存地址public static void main(String[] args) {//调用方法,接收数组的返回值//接收到的是数组的内存地址int[] arr2 ..._方法返回的值赋给数组元素

什么是CSDN_csdn是什么-程序员宅基地

文章浏览阅读760次。如题。是http://blog.csdn.net/Aaron25/category/183631.aspx把我吸引来的。谢谢他。 _csdn是什么

三方通话(二)_a=rtpmap:101 telephone-event-程序员宅基地

文章浏览阅读2k次。话机上三方通话建立过程如下消息:(1) 用户3315呼叫用户3305,终端发送INVITE消息给IPBX.INVITE sip:[email protected] SIP/2.0Via: SIP/2.0/UDP 192.168.50.119:31682;branch=z9hG4bK1791327125;rportFrom: "3315" ;tag=107903851_a=rtpmap:101 telephone-event

机器人学|手机玻璃加工全自动化——AGV+机器人+视觉解决方案(含双目三维视觉SLAM建图、MATLAB的AGV路径规划导航避障、六轴机械手臂建模与路径规划仿真,附带源代码)_agv路径规划与避障系统matlab-程序员宅基地

文章浏览阅读1k次,点赞22次,收藏30次。目标:某企业为3C部件精密加工企业,其加工的零件为手机玻璃,要求加工精度为±0.01mm,目前为人工运输至加工中心加工,由人工采用千分表在大理石平台上逐个测量实现。企业为减少人工成本,提高生产效率,要求采用自动化生产线方式实现。试调研国内外移动操作机器人现状,并作出自动化解决方案,列出主要部件BOM清单,并列出AGV+机器人+视觉形成的解决方案,列出技术点,并尝试计算采用自动化方案与采用人工方案相比,何时收回自动化生产线改造成本。_agv路径规划与避障系统matlab

【毕业设计教程】单片机发送短信消息(GMS模块) - 物联网 嵌入式 stm32_simcom 短信发送开发-程序员宅基地

文章浏览阅读7.2k次,点赞6次,收藏102次。Hi,大家好,这里是丹成学长,今天向大家介绍如何使用GMS模块,达到单片机发送短信的效果,应用场景非常广泛** 单片机发送短信消息(GMS模块)**大家可用于 课程设计 或 毕业设计单片机-嵌入式毕设选题大全及项目分享:https://blog.csdn.net/m0_71572576/article/details/125409052GSM模块使用上海SIMcom公司的SIM900高精度无线GSM/GPRS完全四频芯片,使用SMT封装且融 合了高性能的ARM926EJ-S内核。可以适应小型设备的高性价比_simcom 短信发送开发

Mybatis二级缓存的缺陷_mybatis二级缓存的缺点-程序员宅基地

文章浏览阅读1w次,点赞7次,收藏17次。Mybatis二级缓存的缺陷_mybatis二级缓存的缺点

随便推点

C汇编语言是符号化的机器语言,汇编语言-程序员宅基地

文章浏览阅读3.4k次。汇编语言(Assembler Language)[编辑]什么是汇编语言汇编语言是指能反映指令功能的助记符表达的计算机语言,它是符号化的机器语言。用汇编语言写出的程序是汇编语言源程序,机器无法执行。必须用计算机配置好的汇编程序把它翻译成机器语言目标程序,机器才能执行。这个翻译过程就是汇编过程。汇编语言比机器语言在编写、修改、阅读方面均有很大改进,运行速度也快,但掌握起来比较困难。[编辑]汇编语言的特..._汇编语言是符号化的机器语言

python调用c动态库函数_python调用C/C++动态库-程序员宅基地

文章浏览阅读803次。本文以windows环境下的.dll动态链接库为背景展开,有关linux下的.so动态链接库的相关用法会在另外一篇文章中展开讲解。1. 背景知识一直以来python都被称为胶水语言,能够轻易地操作其他程序,轻易地包装使用其他语言编写的库。下面简单介绍下如何使用python来调用C/C++编写的动态库。首先了解下动态链接库及C/C++动态库的区别。1.1 动态链接库使用VS2017创建动态链接库Dl..._python调用c语言动态库函数有unsigned char*inbuf参数类型

pads单位切换的快捷键_PADS快捷键和技巧大全-程序员宅基地

文章浏览阅读1.9k次,点赞2次,收藏7次。发一些最基本常用的几个快捷键:设置通孔显示模式:D+O设置铜只显示外框形式:P+O改变当前层:L(如改当前层为第二层,为L2)测量:从当前位置开始测量:Q改变线宽:W设置栅格:G对找元件管脚或元件:S寻找绝对坐标点:S(n)(n)改变走线角度:AA任意角,AD斜角,AO直角取消当前操作:UN,如UN(1)为取消前一个操作重复多次操作:RE设计规则检查:打开: DRP,关闭:DRO,忽略设计规则:D..._pads单位切换快捷键

React Native开发坑之null is not an object (evaluating 'inst.componentWillReceiveProps')_react native nativeevent 为什么是null-程序员宅基地

文章浏览阅读5k次。最近写react native发现一个坑,出现这个错误:null is not an object (evaluating 'inst.componentWillReceiveProps')坑的是完全没有提示是哪个类出错了。后面发现在render函数里面使用了//进行注释代码~真的是醉了,JSX中是不能使用//做注释,如果一定_react native nativeevent 为什么是null

力扣java刷题学习(代码随想录学习)2_代码随想录java版本代码-程序员宅基地

文章浏览阅读405次。【代码】力扣java刷题学习(代码随想录学习)2。_代码随想录java版本代码

简单爬取京东商品名称、价格(仅供学习)_爬京东价格-程序员宅基地

文章浏览阅读3.9k次。以下内容是原创,仅供初学者学习用,京东能够开放给我们学习实在不容易,请模拟人类的行为学习爬取。一 爬取的Python源码#爬取的代码import requestsimport reimport timegoods='书包' #搜索关键字depth = 1 #搜索深度为2,即爬取第1页,第2页start_url = 'https://search.jd.com/Search?k..._爬京东价格