简易评论系统设计

需求分析

评论系统是互联网社区网站的重要组成部分,对增强用户参与度、提高网站活跃度等方面都具有重要价值。

一个简易的评论系统(在线社区平台)通常包含以下功能

  1. 用户评论:用户可以对某个产品、主题进行评论,包括文字评论。
  2. 评论展示:所有用户的评论将会在产品或服务页面下方展示,其他用户可以查看。
    1. 评论的展示有多种组织方式,参考《评论系统的几种展示结构和存储设计》,本文主要针对常见的二级嵌套评论的组织形式。
  3. 评论回复:用户可以对其他用户的评论进行回复,形成互动。
  4. 评论审核:为了防止恶意评论或者垃圾信息,系统需要有审核机制,对用户的评论进行审核。
  5. 评论排序:用户可以根据时间、评分等因素对评论进行排序。

设计概要

实体分析

基于前面的需求分析,一个简易的评论系统,一般会包含三个实体:

  • User:自然人,发表主题和评论的人
  • Subject: 主题,用户发表的主题,被评论的对象
  • Comment: 评论或回复,评论和回复需要归属于某个Subject。评论系统中最核心的实体。

模块设计

  • Comment-BFF: BFF层,用于接收和处理来自C端用户的请求(包括读、写评论),并返回结果。 如果是写操作,会通过MQ来进行削峰填谷,由Comment-Service作为MQ消费者,进行真正的写动作。
  • Comment-Service: 评论数据的核心逻辑处理服务,
    • 消费Kafka中用户的写入消息,写入MySQL,并缓存到Redis中,方便用户的快速读取。
    • 当Cache Miss时,处理用户的读请求,从MySQL中读取数据,更新缓存,并返回给用户。
  • Comment-Admin: 评论的管理服务,(置顶、删除、检索等)。

存储设计

仅列出与评论相关的关键字段

用户表t_user

字段名

数据类型

描述

user_id

BIGINT

用户ID,主键

username

VARCHAR

用户名

password

VARCHAR

用户密码

email

VARCHAR

用户邮箱

created_time

DATETIME

创建时间

updated_time

DATETIME

更新时间

deleted_time

DATETIME

删除时间

帖子表t_post

字段名

数据类型

描述

post_id

BIGINT

帖子ID,主键

user_id

BIGINT

发帖用户ID,外键,引用User表的user_id

title

VARCHAR

帖子标题

content

TEXT

帖子内容

post_time

DATETIME

发帖时间

comment_count

INT

评论总数

root_comment_count

INT

根评论总数

status

ENUM

帖子状态,如'NORMAL','PINNED'(置顶),'HIDDEN'(隐藏),'FILTERED'(过滤)等

created_time

DATETIME

创建时间

updated_time

DATETIME

更新时间

deleted_time

DATETIME

删除时间

  • comment_countroot_comment_count 用于记录评论总数和根评论总数,避免每次都需要count(*)

评论表t_comment

字段名

数据类型

描述

comment_id

BIGINT

评论ID,主键

user_id

BIGINT

评论用户ID,外键,引用User表的user_id

post_id

BIGINT

所评论的帖子ID,外键,引用Post表的post_id

parent_comment_id

BIGINT

父评论ID,如果是一级评论,此字段为NULL

reply_to_comment_id

BIGINT

被回复的评论ID,如果是一级评论,此字段为NULL

reply_to_user_id

BIGINT

被回复的用户ID,如果是一级评论,此字段为NULL

content

TEXT

评论内容

comment_time

DATETIME

评论时间

status

ENUM

评论状态,如'NORMAL','HIDDEN'(隐藏),'FILTERED'(过滤)等

created_time

DATETIME

创建时间

updated_time

DATETIME

更新时间

deleted_time

DATETIME

删除时间

  • reply_to_comment_idreply_to_user_id 只有当当前评论是对二级评论的回复是时为非NULL,因为我们的评论系统是二级嵌套结构,因此被回复的评论和当前评论在组织形式上是同级的,而非父子结构。

性能设计

缓存设计

  1. 热门数据缓存:对于访问频率高的数据,如热门帖子的评论,可以将其缓存到内存中,如使用Redis等内存数据库。当用户请求这些数据时,可以直接从缓存中获取,而不需要查询数据库。
  2. 分页缓存:对于评论列表的分页查询,可以将每页的数据缓存到内存中。当用户请求某一页的数据时,可以直接从缓存中获取,而不需要查询数据库。
  3. 延迟写入:对于写操作,如用户发表评论,可以先将数据写入缓存,然后异步地将数据写入数据库。这样可以提高写操作的响应速度。
  4. 缓存预热:在系统启动或者在低峰期,可以预先将可能被访问的数据加载到缓存中,这样在高峰期可以直接从缓存中获取数据。

分库分表

当单表存储的数据量级过大时,会影响查询性能,可以进行一定的分表。

评论通常不会脱离帖子本身存在,因此评论表可以根据post_id哈希值将数据分布到多个表中。

读写分离:

将读操作和写操作分发到不同的数据库服务器上。例如,可以设置一台数据库服务器专门处理写操作,其他服务器处理读操作。这样可以提高系统的并发处理能力。