💬个人网站:【芒果个人日志】 💬原文地址:数据库——最小支持度&最小置信度 - 芒果个人日志 (wyz-math.cn)
💂作者简介: THUNDER王,一名热爱财税和SAP ABAP编程以及热爱分享的博主。目前于江西师范大学会计学专业大二本科在读,同时任汉硕云(广东)科技有限公司ABAP开发顾问。在学习工作中,我通常使用偏后端的开发语言ABAP,SQL进行任务的完成,对SAP企业管理系统,SAP ABAP开发和数据库具有较深入的研究。
💅文章概要:本篇文章主要讲述了数据库中最小支持度和最小置信度的问题,采用的是案例讲解法,没有公式,浅显易懂
🤟每日一言:能让你精致的,除了化妆品,最厉害的是知识、努力和爱。
目录
案例分析
最小支持度
最小置信度
案例分析
以下是某商场的购物记录集合,每个购物篮中包含若干商品。现在要基于该数据集进行关联规则挖掘,如果设置最小支持度为60%,最小置信度为80%,则在以下列出的关联规则中,符合条件的是(D)
购物篮编号 | 商品 |
---|---|
1 | A,B |
2 | A,B,C,D |
3 | A,C,D |
4 | B,C |
5 | B,C,D |
- A)A→B
- B)B→C
- C)C→B
- D)D→C
最小支持度
- 这种类型的题目通常采用的是逐个分析法,首先观察A选项,那么最小支持度就是A在5个购物篮编号中出现的频率,可以看到A在1,2,3号购物篮均出现了,因为总共有5个购物篮,那么A选项A→B的最小支持度就是3/5,也就是60%
- 其次观察B选项,B在5个篮子中的1,2,4,5都出现了,那么B选项B→C的最小支持度就是4/5,也就是80%
- 同理可得C选项的最小支持度是80%,D选项的最小支持度是60%
最小置信度
- 上述分析完了最小支持度,再来看最小置信度,首先是A选项,那么A选项的最小置信度就是B在A出现过的情况中出现过的频率,可以看到,B在1,2,4,5号购物篮中均出现过,但是A仅在1,2,3号购物篮中出现过,它们共同只出现在了1,2号购物篮,所以A选项A→B的最小置信度为2/3,也就是66.6%
- 其次观察B选项B→C,B在5个篮子中的1,2,4,5都出现了,但是C只在2,3,4,5号购物篮中出现了,它们共同只出现在了2,4,5号购物篮,所以最小置信度为3/4,也就是75%
- 同理可得C选项的最小置信度是100%,D选项的最小支持度是100%(超过80%满足条件)
综上所述:本题选择D选项