"万能"的腾讯云小微智能题库

导语:

2021年9月,国家各项“双减”细则也正式开始实施,而双减政策一系列的举措都指向了同一个目标:充分发挥学校教书育人的主体功能,将义务教育重新拉回到一个应有的平衡局面。对于学校面临的作业“减量不减质”的困局,腾讯作业君精准教学方案,通过分析学生“学情”,智能助力老师规划学生合理学习路径,让学生从无效的“题海”作业中解放出来;腾讯英语君口语考试方案,打通GBC三端,通过定制不同教学频段的练习资源,智能化支持教学、评测和训练,有效支持学生提高听说能力。 腾讯智能题库作为作业君和英语君最重要的中台,为了应对其多场景、多终端的业务特性,主动进行了底层的抽象,设计出一套高兼容性的“万能模板”,支持业务实现差异化的场景和交互,并且降低了题的生产成本。随着作业君软硬一体方案的持续交付落地,区域的无纸化作业占比提升,也实现了“碳中和”这样的社会价值。

创新特性名

"万能"的腾讯云小微智能题库

主创团队名

CSIG 腾讯云小微研发团队

创意点的产品功能/使用场景

产品功能:

传统的题库,通过将题型的结构特点整合梳理,抽象出多套模板,进行业务的支持。但这种方案会面临两个挑战:题型种类有成百上千种,

       1)数据标准化程度不足。一方面海量数据总会有不标准的情况出现,另一方面随着中高考改革持续有新题型诞生(如口语考试),因此需要业务和题库持续的配合增加模板来解决。为了兜住长尾场景带来的消耗是不匹配的,因此业务会持续阵痛。

    2)差异化的交互。随着行业的发展和业务的不断探索,我们需要将产品进行多终端的适配,包括PC、Pad、eink电子墨水屏、手机、台灯等。不同终端差异化的交互方式会对底层的结构有所要求,因此,每次适配带来的升级工作也会持续的占据资源。

       腾讯智能题库将所有题的信息和交互模式进行梳理,并实现了元素级抽象,立足于此设计了一个万能模板,并通过自动编码方式对题型结构进行有效适配,实现数据结构的演进与业务迭代解耦,避免了底层的持续升级带来的业务升级成本;同时支撑了跨端的交互差异的需求,提升了业务应用层的用户体验。

使用场景:题加工场景:多端录题

腾讯智能题库的生产线立足于万能模板,实现了AI算法智能拆题打标、自动质检量大核心功能,大大提升加工效率和质量。

题应用场景:多终端交互

传统三大硬件

  • PC:惠普学生本
  • APP:英语君中学版
  • 作业君:作业君Pad端

学习场景化硬件

  • 讲台:希沃白板
  • 课桌:作业君电子墨水屏
  • 书桌:AILA智能台灯

业界影响力

创新点的创新之处的具体描述

为了解决传统题库对题型兼容性差,人力投入大,质量无法保障,应用面窄等难题,智能题库打破常规,做了以下创新:

【通过万能模板和自动质检,兼容性所有题型,实现生产降本增效】

智能题库打破常规对题进行重新定义,提出元素级的题的定义。业界首创将数字化编码应用于题型结构。再结合大数据统计,形成最终题型结构的标准。有了题型结构标准,可以很方便实现万能模板和自动质检。万能模板和自动质检,从生产源头保证了题型结构的统一。传统题库适配一种新题型,从设计模板到服务上线,需要一两周的时间,而我们只需要几分钟配置就能上线。传统题库需要众包几万人审核,智能题库只需要几十人外包团队审核,大大节省了人力成本。

【通过扩展标签,支撑差异化UI交互,适配更多软硬件应用终端】

为了支撑多终端应用在展示和交互上的差异,我们通过扩展标签和多版本存储的方式,自动对同一个元素(如选项)进行多维度、富文本的存储,以支持不同终端展示和交互上的差异化的需求。传统题库新支持一种UI交互,从生产加到终端应用,需要一个月的时间,而智能题库只需要配置标签,无需要升级后台服务和开发协议就能先加工生产,终端适配耗时最多一周就能支持上线。

创意如何产生的

背景

当下做题库的同行,都是采用人海战术,实现录题和审题。经常会遇到特殊题型无法入库的问题。只有case by case的重新发布服务来修复问题,需要持续投入开发人力,导致效能低下。生产出来的题都需要投入大量人力进行审核,而且还无法快速适配新的应用场景。

创新改造

为了从根本地系统解决此类问题,打破常规对题进行元素级抽象,业界首创题型结构编码。首先将题定义为由元素组成。通过AI切题算法将题切成元素,元素自由组合出所有题型;然后再通过元素编码,生成题型结构标准;根据题型和题型结构标准,生成录题万能模板。同时题型结构标准还可用于模板推荐和自动质检,从源头保证题的质量。再通过精加工,增加元素级扩展标签和题的多版本存储,从而满足不同的场景智能应用。

怎么实现的

创新的实现包括以下两个部分:

【实现题库生产的降本增效】

传统题库根据题型加载固定模板进行入题。当遇到异常题型,需要重新定义新的模板,升级服务,兼容性较差。智能题库设计一种能根据题型自动实时地生成的录题模板,即万能模板。

为了实现万能模板,首先要将题转化成一种可描述,可执行的数字化编码,最后根据数字化编码生成实时生成模板。

整体流程:

主要由两部分组成:

离线生成题的数字化编码

先把存量题进行数字化编码,然后按题型进行统计每种编码的占比情况。 将占比为绝对多数的编码设定为有效;其他少量题型编码再经过人工审核,确定编码是否有效,形成最终题型结构标准。

模板入题

在录题时根据题型,从题型结构标准中读出数字化编码。如果遇到新题型,会上报新的题型编码到人工审核,人工审核通过后更新题型结构标准。下次遇到这种题型,可以查到题型结构编码。然后分析编码还出题的组成元素,生成模板。

最后根据数字化编码组成的元素,实时动态的生成入题模板。

脚本入题

对于脚本录的题,首先计算出题型结构的编码,然后根据题型从题型结构标准查找对应的数字化编码。如果查找到质检通过。如果找不到,会记录并跳过。

万能模板优势在于:当遇到异常题型,只需要将新的题型结构进行数字化编码,加入到题型结构标准中,就可以支持该题型录入,无需要更新服务,提高了兼容性。形成的题型结构标准,能快速实现题型结构自动化质检,降少人力投入,实现降本增效。

【支持应用端任何的交互方式】

不同的应用端存在不同的交互和应用场景。为了能支撑不同的交互方式 ,智能题库设计了扩展标签与多版本的存储架构,能根据具体的应用需求,为题动态新增定制化的标签与版本。

扩展标签:采用竖表存储,可以挂载到题,子题和元素上。

比如一道特殊的选择填空题,如下截图:

在传统题库中,题的选项和表格一起被加工到题干里,做为普通的填空题,但这样无法满足电子墨水屏独特的交互需求。为了在墨水屏上实现更好的交互方式,我们给题打上了“选项在表格里”的标签。这样当应用解析到此标签,就展示4个下拉选项,方便用户快速选择答案。

另外,墨水屏为了实现手写和平滑滚动,需要提供图片版本的表格,公式甚至整个题。

对于PC或手机上的普通应用,智能题库下发文本版本的题。对于墨水屏,智能题库需要下发图片版本的题。为了能同时满足PC或手机APP常规应用和特殊硬件终端上应用的需求,我们将题加成不同的版本进行存储。题的多版本之间相互独立,逻辑上完全隔离。业务可根据不同的应用场景,快速检索出指定版本的题。

扩展标签优势在于:无需更新服务,只需简单配置,就能快速支撑新的交互和新的应用场景。

【业界竞品对比】

特性

竞品

元素级智能题库

备注

人力投入

众包的方式管理几万人

2家供应商十来人

智能题库有自动质检和万能模板推荐

兼容性

10+模板

万能模板

智能题库元素能自由组合出各种题型

应用终端

3种(PC、APP和Pad)

6种;包括传统3大件(PC、APP、Pad)和3种学习场景硬件(教室大屏、电子墨水屏、台灯)

智能题库有元素级标签和多版本存储

产品的意义及未来展望

【产品意义】

万能模板的设计创新,除了支撑业务实现产品价值之外,还有两个更重要的意义:

  1. 提升业务利润率。立足于万能模板,我们对题加工产线进行智能化标准化设计,实现了一套工业化和低成本的生产模式,实现46题/小时的加工效率,因此构建一个5万题的区域题库仅一个10人供应商团队半个月即可完成。因此这显著降低我们对大规模教研和众包人员的依赖,做到用小团队供应商即可支撑高质量大规模生产,直接的降低了生产成本,进而提升业务利润率,支撑业务实现更优的业务商业模型。
  2. 构建技术壁垒。通过以万能模板为代表的创新,我们将持续的构造技术壁垒,进而为业务提供独特的人无我有的体验和价值。题库已申请以下专利:
  • 专利一: 一种带扩展属性和标签的题进行元素级抽象实现通用题库的方法(专利号:2021070332CN )
  • 专利二:一种基于题型结构数字化编码和大数据统计智能建立题型结构标准的方法(专利号:2021080191)
  • 专利三:一种通用的多学科试卷或教辅资料题自动抽取方法(专利号:2021060506CN)

【未来展望】

腾讯智能题库通过专注细致的服务行业场景,有效支撑精准教学和口语考试的产品体验设计和大规模落地,为越来越多的师生创造产品价值;随着智能题库中台能力的持续完善,我们将与教育资源的生产机构(如出版集团)合作,用智能化的生产模式与工具反哺行业者,使他们也从中受益。