抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

Apriori算法

input.txt

  • 每一个事务都是由不到150的单项组成,用字符串表示;
  • 总共100个事务;

output.txt

  • 一共挖掘出约4500个频繁项集;
  • 最长的项集长度为10;

基本参数

  • 最小支持度:0.2
  • 最小置信度:0.3

相关笔记

  • 数据预处理

    1. 找到全体频繁1-项集
    2. 按照支持度降序给每个事务重新排序
  • 递归连接

    1. 假设生成全体频繁k项集,对于每一个可连接的,
      • 称频繁k项集a,b可连接,如果它们前k-1项相同但是最后一项不同
    2. 加入
  • 剪枝

    • 扫描刚刚生成的,剪去那些非频繁的项集
  • 对于某一个频繁项集,其自动满足关联规则的支持度规则,因此划分称两个部分

    • 如果满足置信度规则,那么这个关联规则就是强规则

评论




博客内容遵循 [署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0) 协议](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh)
本站使用 Volantis 作为主题 字数统计:318.5k
<