数据库——最小支持度&最小置信度

💬个人网站:【芒果个人日志】​​​​​​ 💬原文地址:数据库——最小支持度&最小置信度 - 芒果个人日志 (wyz-math.cn)

💂作者简介: THUNDER王,一名热爱财税和SAP ABAP编程以及热爱分享的博主。目前于江西师范大学会计学专业大二本科在读,同时任汉硕云(广东)科技有限公司ABAP开发顾问。在学习工作中,我通常使用偏后端的开发语言ABAP,SQL进行任务的完成,对SAP企业管理系统,SAP ABAP开发和数据库具有较深入的研究。

💅文章概要:本篇文章主要讲述了数据库中最小支持度和最小置信度的问题,采用的是案例讲解法,没有公式,浅显易懂

🤟每日一言:能让你精致的,除了化妆品,最厉害的是知识、努力和爱。

目录

案例分析

最小支持度

最小置信度

案例分析

以下是某商场的购物记录集合,每个购物篮中包含若干商品。现在要基于该数据集进行关联规则挖掘,如果设置最小支持度为60%,最小置信度为80%,则在以下列出的关联规则中,符合条件的是(D)

购物篮编号

商品

1

A,B

2

A,B,C,D

3

A,C,D

4

B,C

5

B,C,D

  • A)A→B
  • B)B→C
  • C)C→B
  • D)D→C

最小支持度

  • 这种类型的题目通常采用的是逐个分析法,首先观察A选项,那么最小支持度就是A在5个购物篮编号中出现的频率,可以看到A在1,2,3号购物篮均出现了,因为总共有5个购物篮,那么A选项A→B的最小支持度就是3/5,也就是60%
  • 其次观察B选项,B在5个篮子中的1,2,4,5都出现了,那么B选项B→C的最小支持度就是4/5,也就是80%
  • 同理可得C选项的最小支持度是80%,D选项的最小支持度是60%

最小置信度

  • 上述分析完了最小支持度,再来看最小置信度,首先是A选项,那么A选项的最小置信度就是B在A出现过的情况中出现过的频率,可以看到,B在1,2,4,5号购物篮中均出现过,但是A仅在1,2,3号购物篮中出现过,它们共同只出现在了1,2号购物篮,所以A选项A→B的最小置信度为2/3,也就是66.6%
  • 其次观察B选项B→C,B在5个篮子中的1,2,4,5都出现了,但是C只在2,3,4,5号购物篮中出现了,它们共同只出现在了2,4,5号购物篮,所以最小置信度为3/4,也就是75%
  • 同理可得C选项的最小置信度是100%,D选项的最小支持度是100%(超过80%满足条件)

综上所述:本题选择D选项