本文作者:qweasjd

机器学习 算法总结,

qweasjd 05-08 2
机器学习  算法总结,摘要: 大家好,今天小编关注到一个比较有意思的话题,就是关于机器学习 算法总结的问题,于是小编就整理了3个相关介绍机器学习 算法总结的解答,让我们一起看看吧。有哪些好的提升机器学习算法的方...

大家好,今天小编关注到一个比较意思的话题,就是关于机器学习 算法总结的问题,于是小编就整理了3个相关介绍机器学习 算法总结的解答,让我们一起看看吧。

  1. 有哪些好的提升机器学习算法的方法?
  2. 如何看待机器学习算法入门?
  3. 数据挖掘,机器学习与深度学习中聚类、关联、决策跟分类是什么?

哪些好的提升机器学习算法的方法

要提升算法,首先要从算法缺陷着手.

第一步快速构建算法图

机器学习  算法总结,
图片来源网络,侵删)

第二步查看训练测试集损失图,这一步可以区分出目前你的算法是处在高方差还是高偏差.

根据是偏差还是方差来决定算法的优化方式

我来简单地提供几个常用的方法


机器学习  算法总结,
(图片来源网络,侵删)

如果是高偏差,你可以增加迭代次数或增加训练集,如果偏差还是很高!那就不要浪费时间了,直接考虑更换算法实现.这说明你的模型本身出现了问题.可以检查是否是特征数据不够可以增加神经元数目

如果是高方差的情况,那就可以考虑增加训练数据,如果训练集的损失已经很低了但是还是高方差的话,这时候就考虑调整模型,增加dropout或者增加惩罚来减少模型过拟合.总之就是不断调整个中超参数来达到低方差低偏差

数据,数据,数据,重要的事情说三遍。

机器学习  算法总结,
(图片来源网络,侵删)

算法模型只是提升机器学习效果的一部分。很多时候依赖数据样本的分布和特征的选取,就拿LR来说,模型很简单,但是选取不同的样本和特征最后效果完全不一样。当然,在同样数据的情况下,模型提升的空间有限。

如何看待机器学习算法入门

我***设这个问题想问的是“机器学习算法”怎么入门。

1. 机器学习可以认为是计算机的进阶课程。 所以要想入门机器学习,要先在概率统计,微积分,线性代数编程的门里。 这些“基础课”是学习机器学习与数据挖掘这样“专业课”的基础。

2. 所以无论是理工科还是学经管,大家一定要先把基础打好。即使以后是决心要做VC,也还是要掌握一些基本的定量的概念。一不能人云亦云,二不能天天看自媒体补课。

3. 有了数学和编程的基础,如果英文还可以,就可以看我推荐的入门书籍

***s://***.wukong***/question/6471062370604024078/

如果英文不好,也可以看最后两本中文版的书。

下面有几个关于机器学习的点,大家可以从学习中体会一个General Picture.

4. 机器学习如果是一门科学的话,它是关于算法的科学。 它与我们人类科学发现过程是类似的。首先通过我们的感官来得到证据(Evidence),之后构建很多***设(Hypothesis)试图来解释这些证据。能够印证数据或证据的***设就是理论,如果不能解释,就不断的修正参数来调整***设,直到我们找到一个最合适的***设。 我们的科学发现过程如此,机器学习亦是如此。

5. 在上面提到的***设,在机器学习中主要就是一些函数-关于输入和输出的函数。 输入输出是我们从真实世界收集到的真实数据,我们要通过我们的经验(educated guesses)用某一类函数作为模型,并通过调整参数来拟合数据。

6. 还有一类模型更复杂,更广泛,比如深度神经网络,随着它复杂度的增加,其实对模型的偏好(Bias)的影响在变少,反而是数据本事的作用更大,减少了人类先验***设的影响。应为可以毕竟任何一种函数,属于“无招胜有招”。如果《笑傲江湖》里面的独孤九剑一样,不是真的无招, 是招数太过复杂,可以几乎包含了任何招数。 深度网络不是无参数模型,是参数太多太复杂。

数据挖掘,机器学习与深度学习中聚类、关联、决策分类什么

大数据的挖掘常用的方法有分类、回归分析、聚类、关联规则、神经网络方法、Web 数据挖掘等。这些方法从不同的角度对数据进行挖掘。

所以总体可以认为深度学习跟机器学习都属于数据挖掘的方法。

(1)分类

分类是找出数据库中的一组数据对象的共同特点并按照分类模式将其划分为不同的类。

比如我们在电商平台上的各类产品,肯定要按照产品属性进行分类,对应的数据挖掘的分类,就是利用属性去寻找有共同特点的数据对象,归到一个大***。

(2)回归分析

回归分析反映了数据库中数据的属性值的特性,通过函数表达数据映射的关系来发现属性值之间的依赖关系。

比如,我们有了过去三年的销售数据,我们就可以抽象出影响销售的因素,对未来的销售数据做出预测

(3)聚类。聚类类似于分类,但与分类的目的不同,是针对数据的相似性和差异性将一组数据分为几个类别。

(4)关联规则

数据挖掘,机器学习与深度学习其实都是属于人工智能下的机器学习范畴。机器学习算法按功能主要分为有监督学习算法、无监督学习(也叫聚类)算法、半监督算法和强化学习算法。顾名思义,有监督学习算法就是在训练模型的时候,每条样本都有明确的类标;无监督学习算法在训练的时候完全没有类标;半监督学习算法就是有一部分存在类标,另一部分样本没有类标;强化学习就是在训练的过程中,通过现实环境反馈机制对模型进行矫正的方式来达到训练的目的。而训练好的模型,遇到未知样本的时候,我们就可以对其结果进行预测,也就是题中所说的决策。关联其实是一类算法,比如说推荐算法中的关联分析

到此,以上就是小编对于机器学习 算法总结的问题就介绍到这了,希望介绍关于机器学习 算法总结的3点解答对大家有用。

阅读
分享