- Home
- Blog
  - category
  - tag
  - archive
  - note
  - report
- Life
  - Dear MyFriend
  - views
- About Me
- 黑暗降临！

基于密度的聚类算法：DBSCAN

Kytolly

发布于：2025年5月1日

字数：399 字

时长：1 分钟

基于密度的聚类算法：DBSCAN

只要一个区域中的点的密度大于某个阈值，就把它加到与之相近的聚类中去。

对于一个类中的每个对象，在其给定半径的领域中包含的对象不能少于某一给定的最小数目；

概念：

设置半径阈值,数量阈值;

核心对象的-邻域至少包个对象；

从核心对象出发，对任何邻域内的点直接密度可达；

如果存在一个对象链，对，是从关于直接密度可达的，则对象是从对象相互密度可达的。

如果存在一个对象，使得对象和是从关于密度可达的，那么对象和是密度相连的。

一个基于密度的簇是基于密度可达性的最大的密度相连对象的集合 ;

连接性：密度相连；
最大性：由密度可达，

DBSCAN算法先任选数据集中的一个核心对象为“种子” ,再由此出发确定相应的聚类簇;

算法类似于BFS搜索，维护一个队列；

优点：

能克服基于距离的算法只能发现“类圆形”的聚类的缺点，可发现任意形状的聚类；
对噪声数据不敏感；

缺点：

计算复杂度大，需要建立空间索引来降低计算量；
数据维数的伸缩性较差；
对参数非常敏感；
如果数据库比较大的时候要进行大量的I/O 开销;
很难找到不同密度的簇;

更新于：2025年5月1日

基于层次的聚类算法：AGNES, DIANA

基于层次的办法层次聚类方法对给定的数据集进行层次的分解，直到某种条件满足为止。凝聚的层次聚类：一种自底向上的策略，首先将每个对象作为一个簇，然后合并这些原子簇为越来越大的簇，直到某个...

基于划分的聚类算法：K-means

基于划分的聚类算法：K-means 基于划分的办法算法初始化一个划分，之后通过迭代的办法优化这个划分方式；如何定义优化？我们需要一个聚类目标函数作为指标：簇对象到簇中心平方误差对于算法，...

评论

查看上一篇
查看下一篇

粘贴文本
全选文本
剪切文本
复制文本
站内搜索
必应搜索
谷歌搜索
新标签页打开
复制链接地址
复制图片
谷歌识图
常见问题
示例博客
加入社区

本站源码
主题源码

暗黑模式
打印页面
阅读模式

<