智能算法(人工智能常用算法介绍)

人工智能的三大基石——算法、数据和计算能力。算法作为其中之一,非常重要。那么人工智能会涉及哪些算法呢?不同的算法适用于哪些场景?

1.根据模型训练方法的不同,可以分为四类:监督学习、无监督学习、半监督学习和强化学习。

常见的监督学习算法包括以下几类:

(1)人工神经网络:反向传播、玻尔兹曼机、卷积神经网络、Hopfield网络、多层感知器、径向基函数网络、RBFN)、受限玻尔兹曼机、递归神经网络(RNN)、自组织映射(SOM)、脉冲神经网络等。

(2) Bayesin:朴素贝叶斯、高斯朴素贝叶斯、多项式朴素贝叶斯和平均单相关估计(AODE)

贝叶斯信念网络(BBN)、贝叶斯网络(BN)等。

(3)决策树:分类回归树(CART)、迭代二分器3 (ID3)、C4.5算法(C4.5算法)、C5.0算法(C5.0算法)、卡方自动交互检测、CHAID、决策树桩、ID3算法、随机森林、SLIQ(Quest中的监督学习)等。

(4)线性分类器:Fisher线性判别式。

线性回归、逻辑回归、多元逻辑回归、朴素贝叶斯分类器、感知、支持向量机等。

常见的无监督学习算法包括:

(1)人工神经网络:生成拮抗网络(GAN)、前馈神经网络(feed forward neural networks)、逻辑学习机(logic learning machines)、自组织映射等。

(2)关联规则学习:Apriori算法、Eclat算法、FP-Growth算法等。

(3)层次聚类算法:单链聚类、概念聚类等。

(4)聚类分析:BIRCH算法、DBSCAN算法、期望最大化(EM)、模糊聚类、K-均值算法、K-均值聚类、K-中位数聚类、Mean-shift算法、Mean-shift算法。

(5)异常检测:K近邻(KNN)算法、局部离群因子(LOF)算法等。

常见的半监督学习算法包括:生成模型、低密度分离、基于图的方法、协同训练等。

常见的强化学习算法包括:Q-学习、状态-动作-奖励-状态-动作(SARSA)、DQN(深度Q网络)、策略梯度、基于模型的强化学习(基于模型的RL)、时间差异学习(临时)

常见的深度学习算法包括:深度信念机器、深度卷积神经网络、深度递归神经网络、分层时间记忆(HTM)、深度玻尔兹曼机器(DBM)、堆叠自动编码器、生成对抗网络等。

其次,根据要解决的任务不同,大致可以分为五种类型:二类分类算法、多类分类算法、回归算法、聚类算法和异常检测。

1.两级分类

(1)两类支持向量机(两类SVM):适用于数据特征多、模型线性的场景。

(2)二类平均感知器:适用于训练时间短、模型线性的场景。

(3)二类Logistic回归:适用于训练时间短,模型线性的场景。

(4)两类贝叶斯点机器:适用于训练时间短,模型线性的场景。(5)二类决策森林:适用于短时精准的训练场景。

(6)二类提升决策树:适用于训练时间短、准确率高、占用内存大的场景。

(7)二类决策丛林:适用于训练时间短、准确率高、占用内存小的场景。

(8)二类局部深度支持向量机(二类局部深度SVM):适用于数据特征较多的场景。

(9)两类神经网络:适用于精度高、训练时间长的场景。

解决多分类问题通常有三种解决方案:一是从数据集和适用方法入手,用两个分类器解决多分类问题;二是直接使用具有多分类能力的多分类器;第三,把两个分类器改进成多分类器,解决今天的多分类问题。

常用算法:

(1)多类Logistic回归:适用于训练时间短、模型线性的场景。

(2)多类神经网络:适用于精度高、训练时间长的场景。

(3)多类决策森林:适用于准确率高、训练时间短的场景。

(4)多类决策丛林:适用于准确率高、占用内存小的场景。

(5)“一对多”多类:取决于两个分类器的效果。

返回

回归问题通常用于预测特定值,而不是分类。其他方法类似于分类问题,只是返回的结果不同。我们称之为定量输出,或连续变量预测,回归;定性输出,或对离散变量的预测,称为分类。长毛巾的算法是:

(1)有序回归:适用于整理数据的场景。

(2)泊松回归:适用于预测事件数量的场景。

(3)快速森林分位数回归:适用于预测分布的场景。

(4)线性回归:适用于训练时间短,模型线性的场景。

(5)贝叶斯线性回归:适用于线性模型和训练数据较少的场景。

(6)神经网络回归:适用于精度高、训练时间长的场景。

(7)决策森林回归:适用于准确率高、训练时间短的场景。

(8)助推决策树回归:适用于准确率高、训练时间短、内存占用大的场景。

聚类的目标是发现数据的潜在规律和结构。聚类通常用于描述和度量不同数据源之间的相似性,并将数据源划分到不同的簇中。

(1)层次聚类:适用于训练时间短、数据量大的场景。

(2)K-means算法:适用于准确率高、训练时间短的场景。

(3)模糊C均值(FCM):适用于精度高、训练时间短的场景。

(4)自组织特征映射(SOM):适用于运行时间较长的场景。

异常检测

异常检测是指检测和标记数据中的异常或非典型分裂,有时也称为偏差检测。

异常检测看起来很像监督学习问题,两者都是分类问题。两者都是对样本的标签进行预测和判断,但实际上两者的区别是很大的,因为异常检测中的正样本(异常值)是很小的。常用的算法有:

(1)一类支持向量机(一类SVM):适用于数据特征较多的场景。

(2)基于PCA的异常检测:适用于训练时间较短的场景。

常见的迁移学习算法包括归纳迁移学习、直接迁移学习、无监督迁移学习、直推式迁移学习等。

算法的适用场景:

需要考虑的因素有:

(1)数据的大小、质量和特征。

(2)机器学习要解决的具体业务场景中的问题本质是什么?

(3)什么是可接受的计算时间?

(4)算法的精度要求有多高?

有了算法和训练好的数据(预处理过的数据),经过多次训练(考验计算能力的时候到了),经过算法人员的模型评估和调整,得到训练模型。当新的数据输入后,我们的训练模型就会给出结果。即使实现了业务所需的最基本的功能。

产品在互联网上自动运维是趋势,因为互联网需要快速响应的特性,决定了我们要快速响应,快速修复问题。人工智能产品也不例外。AI+自动运维是如何工作的?

发表评论

后才能评论