神经网络优化算法：Dropout、梯度消失 _ 爆炸、Adam 优化算法，一篇就够了！

发表于 2019-11-08 更新于 2019-11-19 分类于深度学习

训练误差和泛化误差

机器学习模型在训练数据集和测试数据集上的表现。如果你改变过实验中的模型结构或者超参数，你也许发现了：当模型在训练数据集上更准确时，它在测试数据集上却不⼀定更准确。这是为什么呢？

因为存在着训练误差和泛化误差：

训练误差： 模型在训练数据集上表现出的误差。
泛化误差： 模型在任意⼀个测试数据样本上表现出的误差的期望，并常常通过测试数据集上的误差来近似。

阅读全文 »

强化学习 (Reinforcement Learning) 中的 Q-Learning、DQN，面试看这篇就够了！

发表于 2019-11-08 更新于 2019-11-19 分类于深度学习

什么是强化学习

其他许多机器学习算法中学习器都是学得怎样做，而强化学习（Reinforcement Learning, RL）是在尝试的过程中学习到在特定的情境下选择哪种行动可以得到最大的回报。在很多场景中，当前的行动不仅会影响当前的 rewards，还会影响之后的状态和一系列的 rewards。RL 最重要的 3 个特定在于：

阅读全文 »

迁移学习 (Transfer)，面试看这些就够了！(附代码)

发表于 2019-11-08 更新于 2019-11-19 分类于深度学习

什么是迁移学习

迁移学习 (Transfer Learning) 是一种机器学习方法，就是把为任务 A 开发的模型作为初始点，重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务，虽然大多数机器学习算法都是为了解决单个任务而设计的，但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。迁移学习对人类来说很常见，例如，我们可能会发现学习识别苹果可能有助于识别梨，或者学习弹奏电子琴可能有助于学习钢琴。

阅读全文 »

白话 -- 长短期记忆 (LSTM) 的几个步骤，附代码！

发表于 2019-11-08 更新于 2019-11-19 分类于深度学习

什么是 LSTM

在你阅读这篇文章时候，你都是基于自己已经拥有的对先前所见词的理解来推断当前词的真实含义。我们不会将所有的东西都全部丢弃，然后用空白的大脑进行思考。我们的思想拥有持久性。LSTM 就是具备了这一特性。

这篇将介绍另⼀种常⽤的⻔控循环神经⽹络： ⻓短期记忆（long short-term memory，LSTM）[1]。 它⽐⻔控循环单元的结构稍微复杂⼀点，也是为了解决在 RNN 网络中梯度衰减的问题，是 GRU 的一种扩展。

阅读全文 »

三步理解 -- 门控循环单元 (GRU)，TensorFlow 实现

发表于 2019-11-08 更新于 2019-11-19 分类于深度学习

什么是 GRU

在循环神经⽹络中的梯度计算⽅法中，我们发现，当时间步数较⼤或者时间步较小时， 循环神经⽹络的梯度较容易出现衰减或爆炸。虽然裁剪梯度可以应对梯度爆炸，但⽆法解决梯度衰减的问题。 通常由于这个原因，循环神经⽹络在实际中较难捕捉时间序列中时间步距离较⼤的依赖关系。

门控循环神经⽹络（gated recurrent neural network）的提出，正是为了更好地捕捉时间序列中时间步距离较⼤的依赖关系。 它通过可以学习的⻔来控制信息的流动。其中，门控循环单元（gatedrecurrent unit，GRU）是⼀种常⽤的门控循环神经⽹络。

阅读全文 »

通俗易懂 -- 循环神经网络 (RNN) 的网络结构！(TensorFlow 实现)

发表于 2019-11-08 更新于 2019-11-19 分类于深度学习

什么是 RNN

循环神经网络（Recurrent Neural Network, RNN）是一类以序列（sequence）数据为输入，在序列的演进方向进行递归（recursion）且所有节点（循环单元）按链式连接的递归神经网络（recursive neural network）

1.1 RNN 的应用

阅读全文 »

CNN-- 卷积神经网络从 R-CNN 到 Faster R-CNN 的理解 (CIFAR10 分类代码)

发表于 2019-11-08 更新于 2019-11-19 分类于深度学习

什么是 CNN

卷积神经网络（Convolutional Neural Networks, CNN）是一类包含卷积计算且具有深度结构的前馈神经网络（Feedforward Neural Networks），是深度学习（deep learning）的代表算法之一。

我们先来看卷积神经网络各个层级结构图：

阅读全文 »

一看就懂的 K 近邻算法 (KNN)，K-D 树，并实现手写数字识别！

发表于 2019-11-08 更新于 2019-11-19 分类于深度学习

什么是 KNN

1.1 KNN 的通俗解释

何谓 K 近邻算法，即 K-Nearest Neighbor algorithm，简称 KNN 算法，单从名字来猜想，可以简单粗暴的认为是：K 个最近的邻居，当 K=1 时，算法便成了最近邻算法，即寻找最近的那个邻居。

用官方的话来说，所谓 K 近邻算法，即是给定一个训练数据集，对新的输入实例，在训练数据集中找到与该实例最邻近的 K 个实例（也就是上面所说的 K 个邻居），这 K 个实例的多数属于某个类，就把该输入实例分类到这个类中。

阅读全文 »

K-Means(K 均值)、GMM(高斯混合模型)，通俗易懂，先收藏了！

发表于 2019-11-08 更新于 2019-11-19 分类于深度学习

聚类算法都是无监督学习吗?

什么是聚类算法？聚类是一种机器学习技术，它涉及到数据点的分组。给定一组数据点，我们可以使用聚类算法将每个数据点划分为一个特定的组。理论上，同一组中的数据点应该具有相似的属性和 / 或特征，而不同组中的数据点应该具有高度不同的属性和 / 或特征。聚类是一种无监督学习的方法，是许多领域中常用的统计数据分析技术。

阅读全文 »