1.  > 书评

数据挖掘十大算法书评,数据挖掘领域十大经典算法

数据挖掘十大算法书评,数据挖掘领域十大经典算法

大家好,今天小编关注到一个比较有意思的话题,就是关于数据挖掘十大算法书评的问题,于是小编就整理了3个相关介绍数据挖掘十大算法书评的解答,让我们一起看看吧。

  1. 数据挖掘十大经典算法及各自优势
  2. 数据挖掘十大经典算法(1)——朴素贝叶斯(Naive Bayes)
  3. 数据挖掘十大算法-

1、数据挖掘十大经典算法及各自优势

Forgy方法易于使得初始均值点散开,随机划分方法则把均值点都放到靠近数据集中心的地方;随机划分方法一般更适用于k-调和均值和模糊k-均值算法。对于期望-最大化(EM)算法和标准k-means算法,Forgy方法作为初始化方法的表现会更好一些。

另外,还有一个经常有人问起的问题,就是 数据挖掘 和 机器学习 这两个概念的区别,这里一句话阐明我自己的认识:机器学习是基础,数据挖掘是应用。

以下主要是常见的10种数据挖掘的算法,数据挖掘分为:分类(Logistic回归模型、神经网络、支持向量机等)、关联分析、聚类分析、孤立点分析。

决策树算法是一种常见于预测模型的优化算法,它依据将很多数据信息有目地归类,从这当中寻找一些有使用价值的,潜在性的信息。它的要害优势是叙说简易,归类速度更快,十分适宜规模性的数据处理办法。

Adaboost:是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器然后把弱分类器集合起来,构成一个更强的最终分类器。KNN:是一个理论上比较成熟的的方法,也是最简单的机器学习方法之一。

2、数据挖掘十大经典算法(1)——朴素贝叶斯(Naive Bayes)

朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率。(2)对小规模的数据表现很好,能个处理多分类任务,适合增量式训练,尤其是数据量超出内存时,我们可以一批批的去增量训练。

朴素贝叶斯算法(Naive Bayesian algorithm) 是应用最为广泛的分类算法之一。朴素贝叶斯方法是在贝叶斯算法的基础上进行了相应的简化,即假定给定目标值时属性之间相互条件独立。

朴素贝叶斯算法属于分类算法。发源于古典数学理论,对缺失数据不太敏感,有稳定的分类效率,模型所需估计的参数很少,算法比较简单。

k-平均算法(k-means clustering)[5]是源于信号处理中的一种向量量化方法,现在则更多地作为一种聚类分析方法流行于数据挖掘领域。

逻辑回归(logistic regression)逻辑回归是一个分类方法,属于判别式模型,有很多正则化模型的方法(L0,L1,L2),而且不必像在用朴素贝叶斯那样担心特征是否相关。

3、数据挖掘十大算法-

CART算法(Classification And Regression Tree)[4]是一种二分递归的决策树,把当前样本划分为两个子样本,使得生成的每个非叶子结点都有两个分支,因此CART算法生成的决策树是结构简洁的二叉树。

Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。

以下主要是常见的10种数据挖掘的算法,数据挖掘分为:分类(Logistic回归模型、神经网络、支持向量机等)、关联分析、聚类分析、孤立点分析。

SVM:一种监督式学习的方法,广泛运用于统计分类以及回归分析中Apriori :是一种最有影响的挖掘布尔关联规则频繁项集的算法。EM:最大期望值法。pagerank:是google算法的重要内容。

决策树方法。其核心思想是选取具有最高信息增益的属性,即相对于信息熵最高的属性,可参考维基百科中二者的计算公式作为当前节点的分裂属性。人工神经网络。人工神经网络,是对人脑若干基本特性的抽象。

关于数据挖掘十大算法书评和数据挖掘领域十大经典算法的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。 数据挖掘十大算法书评的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于数据挖掘领域十大经典算法、数据挖掘十大算法书评的信息别忘了在本站进行查找喔。

留言与评论(共有 0 条评论)
   
验证码: