两个实例出现在
Posted: Wed Jan 15, 2025 8:49 am
但无监督学习可以分为三个主要任务:
团体
协会规则
降维。
让我们深入研究其中每一个:
团体
从理论的角度来看,同一组的实例往往具有相似的属性。您可以在元 加拿大数据 素周期表上观察到这种现象。同一族的成员,被十八列分开,在其原子的最外层电子层中具有相同数量的电子,并形成相同类型的键。
这就是聚类算法中发挥作用的思想;聚类方法涉及根据未标记数据的相似性和差异对它们进行分组。当不同的组中时,我们可以推断它们具有不同的属性。
聚类是一种流行的无监督学习方法。您甚至可以将其进一步细分为不同类型的分组;例如:
独占聚类:数据被分组,使得单个数据点只属于一个聚类。
重叠聚类——一种软聚类,其中单个数据点可以属于具有不同隶属程度的多个聚类。
分层集群– 一种集群类型,在这种集群中创建组,以便相似的实例位于同一组中,不同的对象位于其他组中。
概率聚类——使用概率分布创建聚类。
关联规则挖掘
这种类型的无监督机器学习采用基于规则的方法来发现给定数据集中特征之间的有趣关系。它的工作原理是使用兴趣度量来识别数据集中发现的强规则。
通常,关联规则挖掘用于购物篮分析:它是零售商用来根据多种产品之间的关系更好地了解客户购买模式的数据挖掘技术。
学习关联规则最广泛使用的算法是Apriori算法。然而,其他算法也用于这种类型的无监督学习,例如 Eclat 和 FP-growth 算法。
降维
最常用的降维算法包括主成分分析 (PCA)和奇异值分解 (SVD)。这些算法试图将数据从高维空间转换到低维空间,而不损害原始数据的有意义的属性。这些技术通常应用于探索性数据分析 (EDA) 或数据处理过程中,为建模准备数据。
在 AED 过程中降低数据集的维度有助于可视化数据:这是因为在三个以上维度上可视化数据很困难。从数据处理的角度来看,降低数据的维度简化了建模问题。
当模型中引入更多的输入特征时,它必须学习更复杂的近似函数。这种现象可以用“维度诅咒”来概括。
无监督学习的应用
大多数高管在识别监督机器学习任务的用例时都没有问题;对于无监督学习则不能这么说。
团体
协会规则
降维。
让我们深入研究其中每一个:
团体
从理论的角度来看,同一组的实例往往具有相似的属性。您可以在元 加拿大数据 素周期表上观察到这种现象。同一族的成员,被十八列分开,在其原子的最外层电子层中具有相同数量的电子,并形成相同类型的键。
这就是聚类算法中发挥作用的思想;聚类方法涉及根据未标记数据的相似性和差异对它们进行分组。当不同的组中时,我们可以推断它们具有不同的属性。
聚类是一种流行的无监督学习方法。您甚至可以将其进一步细分为不同类型的分组;例如:
独占聚类:数据被分组,使得单个数据点只属于一个聚类。
重叠聚类——一种软聚类,其中单个数据点可以属于具有不同隶属程度的多个聚类。
分层集群– 一种集群类型,在这种集群中创建组,以便相似的实例位于同一组中,不同的对象位于其他组中。
概率聚类——使用概率分布创建聚类。
关联规则挖掘
这种类型的无监督机器学习采用基于规则的方法来发现给定数据集中特征之间的有趣关系。它的工作原理是使用兴趣度量来识别数据集中发现的强规则。
通常,关联规则挖掘用于购物篮分析:它是零售商用来根据多种产品之间的关系更好地了解客户购买模式的数据挖掘技术。
学习关联规则最广泛使用的算法是Apriori算法。然而,其他算法也用于这种类型的无监督学习,例如 Eclat 和 FP-growth 算法。
降维
最常用的降维算法包括主成分分析 (PCA)和奇异值分解 (SVD)。这些算法试图将数据从高维空间转换到低维空间,而不损害原始数据的有意义的属性。这些技术通常应用于探索性数据分析 (EDA) 或数据处理过程中,为建模准备数据。
在 AED 过程中降低数据集的维度有助于可视化数据:这是因为在三个以上维度上可视化数据很困难。从数据处理的角度来看,降低数据的维度简化了建模问题。
当模型中引入更多的输入特征时,它必须学习更复杂的近似函数。这种现象可以用“维度诅咒”来概括。
无监督学习的应用
大多数高管在识别监督机器学习任务的用例时都没有问题;对于无监督学习则不能这么说。