一篇文章了解腾讯云数据库TencentDB

注:本文摘自2018年11月22日腾讯云数据库CynosDB新品发布会的演讲实录。随着互联网信息的发展,大家也对云这个词汇也不是特别陌生了,作为全球首选的云服务厂商之一的腾讯云,依托腾讯多年的业务积累和技术沉淀,我们推出了高性能、低成本、安全可靠的整体数据服务解决方案。并且随着客户数据日益增长,也做了相关的调研和分析,推出了腾讯云新一代自研数据库。首先,欢迎我们的数据库产品总监祝百万给大家分享腾讯云数据库的前世今生和产品布局。

——————————我是分割线————————

大家下午好!包括线上的朋友,大家下午好!首先,我做一个自我介绍,我是一名互联网老兵,做过七年的研发,有三年的产品经验,所以对数据库这样的技术产品有自己一定的看法和认识,也希望能够通过今天这个机会跟大家分享我的判断。我会分享三个部分:

首先,回顾整个行业发展的历史,包括腾讯云数据库的历史。从行业和腾讯的角度去看一下我们的经历和发展。同时,会发布三个数据库相关的产品,这三个产品在我们一些业务当中已经有应用,但都是最近才开始上线的。最后我会思考一下,我们做了这么多数据库产品,是已经足够了,还是仍然有不断增长的用户需求需要进一步满足,我们做云数据库的初衷是什么?是否有了更好的办法能覆盖到用户的需求?

首先我们来看一下行业整体的发展历史。

在整理发展历史时,我无意中发现了一个规律,每次世界经济出现大转折的时候,未来几年里都发现有一个标志性的数据库事件发生。在地域上、时间上都有这样的巧合,或者是称之为必然。

在1970年代关系型数据库产生之前,我们对那段历史是比较模糊的,知道数据库这种概念的应该还少。1970年代以后,关系型数据库理论出现,后面才有了Oracle这样的商业数据库公司,以及像微软和苹果这样的IT企业,那时候也正好赶上我们称之为“石油危机”的时期。每一次数据库从关系型数据库到后关系型数据库,都有事件与之对应。2000年左右发生了互联网泡沫,那时候正好有Cache文档型数据库,还有混合型的HKP数据库在那个年代产生,同时也有一批大型的IT企业在那个年代相继诞生。

因此,按照时代划分可以分为PC互联时代、互联网时代、移动互联网时代以及现在。现在我们处在转折点上,可以称之为智能时代或者是AI时代的开始。我们CynosDB的诞生,也是跟前面几次不谋而合,我想这也可以称之为历史的必然。

我们把整个腾讯数据库总体的分类称之为TencentDB,这与刚才讲的历史非常相似,一开始我们称之为PC时代,那时候我们用的都是QQ,紧接着我们有web2.0时代,那时候大家比较熟悉的是在网络上大家去偷菜,这样的游戏是当时非常流行的,那时候腾讯云的数据库其实就已经为大家服务了。当时腾讯云已经公开对外推出我们10家以上的行业解决方案和10个以上的数据库产品,当时我们主打的是性能,一直对外给大家的感觉是,腾讯云的数据库在行业是性能第一。

现在我们的数据库已经开始全球化部署,同时私有云和公有云并重,今天我们推出NewSQL数据库,也就是CynosDB。

再看一下产品的分布,包括关系型数据库、非关系型数据库,还有分布式数据库,包括NewSQL,我们今天发布的CynosDB是在NewSQL大分类里的,而其他领域,比如MySQL现在用的是比较多的。数据库服务产品,包括迁移服务,比如说有用户要将数据库迁移到腾讯云上,还有管理服务、数据库备份服务,以及将要发布的数据库智能运维服务。

这么多的服务,在哪里可以买得到呢?我们分布在南北美洲、欧洲、印度、东南亚、日韩及国内东南西北四大区,其实世界上主要的经济体都可以买到。比如你在米兰的街头或者是去巴黎,骑一个中国的单车,你并不会注意到你扫码存的数据是在法兰克福机房,再比如你去美国开会打开QQ音乐听一首歌,你并不会发现这个数据库是在弗吉尼亚的机房。还有,比如你去日本和韩国,可能晚上会宅在家里,你并不会注意到他们的游戏数据其实是存在我们东京的机房。我们在全球32个地区都有数据库产品在售卖,并且在不断地增加,比如最近新开的莫斯科机房,我们以后会在全球遍布越来越广泛,有更多的可用区。

不仅仅是地域上是这样的,在您的生活周边也是如此,比如你去政府办手续、避开拥挤的地铁去骑单车、在超市多次购物、去银行办个贷款、在家里打游戏,您的生活方方面面都离不开我们的数据库产品,从这点可以看出,我们是为千千万万的企业服务,大家平时感觉不到,可是我们在这里面做了很多的努力。

即便我们已经发布了很多数据库产品,但其实用户的需求还在增长,不仅是C端用户的,还包括我们针对B端用户的需求,因此我们需要发布新的数据库产品。

介绍一下要发布的三个新品数据库,首先是腾讯云图。这是一个水域监控图,用于门店的监控,有些是某个地理位置上的比如说人流的监控,能够非常方便地帮助企业展现数据。这个时代我们可以称之为一个看点的时代,在数据领域其实是一样的,如何更好地展现你大量的数据,可以看我们的产品。我们提供40多种丰富的组件,如果你不知道怎么用,可以按照行业提供的模板去组合您的数据。

下面我们再来看一张图,这是某用户我们去掉他们的敏感信息,可以看到这是他们门店的信息,比如说可以看到他在地图里面在什么地方有门店,人力的热力情况,有些店人多,有些店人少,到底是什么商品卖得好,什么品牌卖得好,都可以通过这样的展示去看。

这是一个线上案例,这是永辉超市现场图,什么样的商品卖的好,什么样的地方热,通过大屏展示既可以给用户看,也可以给自己做用户分析用。

第二个产品是时序数据库,大家可能对这样的技术性的产品比较陌生,但大家一定听过工业4.0,也听过中国制造2025,时序数据库其实就是在这些制造业背后可以用来存储数据的一个产品。不管是中国制造2025还是工业4.0,有一个核心的点就是制造的智能化,必然要产生大量的数据,我们需要应用、分析、存储并解码这些数据,这是时序数据库的特点,包括写入性能强、统计方便、支持SQL,以及平行扩展方便。比如说我们线上有业务,已经在我们上面跑了峰值达300万笔每秒,同时写的量非常大,当然它不是事物型的数据库,针对一些监控,针对一些级别设备按时间不断积累的数据,对这个场景是非常合适的。同时,我们支持非常高级的聚合方式,比如按照百分比,后面还会支持SQL语句的查询。

第三块产品是缓存数据库:Redis与CKV+。其实我们日常生活中可能经历不到,可是有些人已经经历过了,就是前几天的双十一,对电商用户来讲,在购物节和假日期间,这个产品是非常有用的。我们发布的第一个功能叫多维度的伸缩。比如说双十一到来之前我们有很多的产品,是要抢购的,这个时候,作为一个B端用户来讲,它的用户量就爆增,因此需要扩展设备,可是双十一过后,流量就下去了,这时候不需要设备了,需要把设备退掉。如果是自己搭建Redis这个服务的话是非常麻烦的,需要快速搭建还要稳定,用完要退掉,而且不要出错,不要把已经用的数据清掉,这是非常危险也非常复杂的。这时候我们的任务是提供快速的多维度的伸缩的能力,要用之前快速地伸,用完之后还可以快速地缩,这是Redis的特点,不仅是可以按照分辨数也可以按照分辨的能力来说,还可以扩展副本数。同时我们可以增加自己自研的proxy,还有另外一款自研的数据库,既支持分布式也支持单机,它的特点是更好地利用了我们机器多核的性能,我们知道开源的Redis是单线程的,我们做了突破,可以做的更高。

我们讲了这么多的产品,这时候心里面会有一个疑问,我们是否能满足用户所有的需求,或者说是否都能很好地满足用户所有的需求?这是一个不同的概念,用户对数据库的需求在不断地增加,这时候我们可能要追问一下,我们一开始做数据库的初心在哪里?云数据库的本质在哪里?可能只需要我们稍微回顾一下就能想到,一开始的时候我们在没有云之前,我们去做建设数据库、关心网络、机器和存储,还有招聘人员,关注周边等,是非常复杂的。自从有了语音之后,就什么都不需要管了,只需要把业务上线,直接使用。如果有什么问题自己解决不了,可以通过7×24小时服务或者是我们的工具解决。这就是IT资源的服务化,我们需要通过服务的方式把以前复杂多变的IT变更和资源当成一个简单的服务来提供给用户,好像水和电一样。现在大家都是打开水龙头自来水就可以用,没有人挖井了,与若干年大不相同,这可以理解为IT资源服务化的比喻。

既然IT资源服务化是云的本质,数据库也是一样的,可以通过服务化的方式给用户提供。我这里抽象了6个点,大家第一次接触这个东西不太好记,如果是技术员可能一下子就明白了。比如看篮球有一个篮球队叫印地安纳步行者队,正好这个单词是一样的,我们叫PACERS理论,只要提供给客户,这个客户基本上就OK了。与此相对应的是CAP理论,就是我们的可靠性、可用性、分区容错最多可以同时满足两条,数据库的PACERS类似的概念,在他的可靠性、可用性、安全性以及成本、易用性和性能上面,也不能同时满足,可能最多满足四条。比如需要更高的可靠性和更高的可用性,通常来讲对性能都会有损失。或者你的成本通常来讲都需要更高,比如你需要更大的安全性,这时候一般来讲也会损失性能。如果你要追求极致的性能,这个时候你的可靠性可能会受到影响。比如我只放一份数据,可靠性会变差。我们的数据库可以更好灵活地调节,这是我们数据库的愿景。

现在的情况是什么样呢?用户的需求,刚才讲的6点,是第一代云数据库并不能很好的满足的,比如一个数据库能够提供很好的性能,但他想非常灵活地调整,今天我要性能,明天我要可用性,非常快速地在线上灵活地直接切换,第一代的数据库并没有这样的能力。

同时传统的分布式的数据库也有问题,硬件能力在不断地提升,用户的需求也在不断地提高,这两个东西好像两座大山一样,挡在了传统的数据库的前面,不管是第一代的云数据库和传统的分布式数据库,或者是一体机(通常来说一体机的价格会非常昂贵),都无法很好地满足用户的需求,也没有很好地利用起这些硬件的能力。这时我们需要一款新的数据库,它需要为云而生,这就是我们的CynosDB。

更多数据库前沿技术可关注 我们公众号:腾讯云数据库CDB。发布会PPT下载请移步腾讯云数据库公众号,见下方二维码,关注后回复“腾讯云新品发布会资料”即可下载