1. 首页
  2. > 海外移民投资 >

加权移动平均法matlab(广义高斯分布曲线画法matlab)


监督学习:所有输入数据都有确定的对应输出数据,在各种网络架构中,输入数据和输出数据的节点层都位于网络的两端,训练过程就是不断地调整它们之间的网络连接权重。


左上:logistic 回归主要用于二分类问题,如图中所示,logistic 回归可以求解一张图像是不是猫的问题,其中图像是输入(x),猫(1)或非猫(0)是输出。我们可以将 logistic 回归看成将两组数据点分离的问题,如果仅有线性回归(激活函数为线性),则对于非线性边界的数据点(例如,一组数据点被另一组包围)是无法有效分离的,因此在这里需要用非线性激活函数替换线性激活函数。在这个案例中,我们使用的是 sigmoid 激活函数,它是值域为(0, 1)的平滑函数,可以使神经网络的输出得到连续、归一(概率值)的结果,例如当输出节点为(0.2, 0.8)时,判定该图像是非猫(0)。


左上:浅层网络即隐藏层数较少,如图所示,这里仅有一个隐藏层。


左上:神经网络的参数化容量随层数增加而指数式地增长,即某些深度神经网络能解决的问题,浅层神经网络需要相对的指数量级的计算才能解决。


如上所示,经典机器学习和深度学习模型所需要的样本数有非常大的差别,深度学习的样本数是经典 ML 的成千上万倍。因此训练集、开发集和测试集的分配也有很大的区别,当然我们假设这些不同的数据集都服从同分布。


如上图左列所示,L1 和 L2 正则化也是是机器学习中使用最广泛的正则化方法。L1 正则化向目标函数添加正则化项,以减少参数的绝对值总和;而 L2 正则化中,添加正则化项的目的在于减少参数平方的总和。根据之前的研究,L1 正则化中的很多参数向量是稀疏向量,因为很多模型导致参数趋近于 0,因此它常用于特征选择设置中。此外,参数范数惩罚 L2 正则化能让深度学习算法「感知」到具有较高方差的输入 x,因此与输出目标的协方差较小(相对增加方差)的特征权重将会收缩。


以上展示了最优化常常出现的问题和所需要的操作。首先在执行最优化前,我们需要归一化输入数据,而且开发集与测试集归一化的常数(均值与方差)与训练集是相同的。上图也展示了归一化的原因,因为如果特征之间的量级相差太大,那么损失函数的表面就是一张狭长的椭圆形,而梯度下降或最速下降法会因为「锯齿」现象而很难收敛,因此归一化为圆形有助于减少下降方向的震荡。


小批量随机梯度下降(通常 SGD 指的就是这种)使用一个批量的数据更新参数,因此大大降低了一次迭代所需的计算量。这种方法降低了更新参数的方差,使得收敛过程更为稳定;它也能利用流行深度学习框架中高度优化的矩阵运算器,从而高效地求出每个小批数据的梯度。通常一个小批数据含有的样本数量在 50 至 256 之间,但对于不同的用途也会有所变化。


众所周知学习率、神经网络隐藏单元数、批量大小、层级数和正则化系数等超参数可以直接影响模型的性能,而怎么调就显得非常重要。目前最常见的还是手动调参,开发者会根据自身建模经验选择「合理」的超参数,然后再根据模型性能做一些小的调整。而自动化调参如随机过程或贝叶斯优化等仍需要非常大的计算量,且效率比较低。不过近来关于使用强化学习、遗传算法和神经网络等方法搜索超参数有很大的进步,研究者都在寻找一种高效而准确的方法。


我们需要按过程或结构来设定我们的机器学习系统,首先需要设定模型要达到的目标,例如它的预期性能是多少、度量方法是什么等。然后分割训练、开发和测试集,并预期可能到达的优化水平。随后再构建模型并训练,在开发集和测试集完成验证后就可以用于推断了。


在完成训练后,我们可以分析误差的来源而改进性能,包括发现错误的标注、不正确的损失函数等。


上图展示了三个分割数据集及其表现所需要注意的地方,也就是说如果它们间有不同的正确率,那么我们该如何修正这些「差别」。例如训练集的正确率明显高于验证集与测试集表明模型过拟合,三个数据集的正确率都明显低于可接受水平可能是因为欠拟合。


机器学习和深度学习当然不止监督学习方法,还有如迁移学习、多任务学习和端到端的学习等。


计算机视觉任务涉及的数据体量是特别大的,一张图像就有上千个数据点,更别提高分辨率图像和视频了。这时用全连接网络的话,参数数量太大,因而改用卷积神经网络(CNN),参数数量可以极大地减小。CNN 的工作原理就像用检测特定特征的过滤器扫描整张图像,进行特征提取,并逐层组合成越来越复杂的特征。这种「扫描」的工作方式使其有很好的参数共享特性,从而能检测不同位置的相同目标(平移对称)。


padding:直接的卷积运算会使得到的特征图越来越小,padding 操作会在图像周围添加 0 像素值的边缘,使卷积后得到的特征图大小和原图像(长宽,不包括通道数)相同。


深度卷积神经网络的架构主要以卷积层、池化层的多级堆叠,最后是全连接层执行分类。池化层的主要作用是减少特征图尺寸,进而减少参数数量,加速运算,使其目标检测表现更加鲁棒。


LeNet·5:手写识别分类网络,这是第一个卷积神经网络,由 Yann LeCun 提出。


ResNet:引入残差连接,缓解梯度消失和梯度爆炸问题,可以训练非常深的网络。


使用开源实现:从零开始实现时非常困难的,利用别人的实现可以快速探索更复杂有趣的任务。


目标检测即使用边界框检测图像中物体的位置,Faster R-CNN、R-FCN 和 SSD 是三种目前最优且应用最广泛的目标检测模型,上图也展示了 YOLO 的基本过程。


人脸识别有两大类应用:人脸验证(二分分类)和人脸识别(多人分类)。


风格迁移是一个热门话题,它会在视觉上给人耳目一新的感觉。例如你有一副图,然后将另一幅图的风格特征应用到这幅图上,比如用一位著名画家或某一副名画的风格来修改你的图像,因此我们可以获得独特风格的作品。


循环神经网络在语言建模等序列问题上有非常强大的力量,但同时它也存在很严重的梯度消失问题。因此像 LSTM 和 GRU 等基于门控的 RNN 有非常大的潜力,它们使用门控机制保留或遗忘前面时间步的信息,并形成记忆以提供给当前的计算过程。


词嵌入在自然语言处理中非常重要,因为不论执行怎样的任务,将词表征出来都是必须的。上图展示了词嵌入的方法,我们可以将词汇库映射到一个 200 或 300 维的向量,从而大大减少表征词的空间。此外,这种词表征的方法还能表示词的语义,因为词义相近的词在嵌入空间中距离相近。


GloVe 词向量是很常见的词向量学习方法,它学到的词表征可进一步用于语句分类等任务。


序列到序列的方法使用最多的就是编码器解码器框架,其它还有束搜索等模块的介绍。


以上是所有关于吴恩达深度学习专项课程的信息图,由于它们包含的信息较多,我们只介绍了一部分,还有很多内容只是简单的一笔带过。所以各位读者最好可以下载该信息图,并在后面的学习过程中慢慢理解与优化。


https://blog.csdn.net/sophia_11/article/details/103005821


版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至123456@qq.com 举报,一经查实,本站将立刻删除。

联系我们

工作日:9:30-18:30,节假日休息