腾讯云大数据荣获“2022技术卓越奖”,深入其背后的原因

随着数字经济的蓬勃发展,产业数字化进程持续推进,数据技术拥有了广泛的端到端应用场景,而借助数据技术可以实现从数据到信息、从信息到知识、从知识到决策的转换,助力实体经济的创新发展。IDC预计,到2026年,全球大数据市场的IT总投资规模将增至4491.1亿美元,实现约15.6%的复合增长率。

具体到技术层面,《IDC聚焦报告:2022年云上产品演进趋势》中指出,实体经济发展离不开数据支持,而与云原生技术相结合的大数据、数据治理、数智融合与隐私计算,在解决大数据技术门槛、运维部署等问题方面的突出作用持续受到关注,企业真正需要的是一套“开箱即用”的云原生产品服务。

腾讯云大数据恰好提供了这样一套产品,它是基于腾讯海量业务打造的世界领先级大数据产品生态体系。截至目前,腾讯云大数据的算力规模已经突破千万核,日实时计算量达百万亿级、日运行容器数超亿级,日计算数据量数百PB,服务的企业客户数超2万家,开源社区代码贡献量超800万行。

前不久,由ITPUB、IT168联合主办的《技术改变世界 创新引领未来——2022技术卓越奖》,评选结果正式揭晓,腾讯云大数据团队凭借领先的技术优势、丰富的用户服务经验、开放的生态理念,斩获了2022年度“技术卓越奖”和“创新产品奖”两项大奖。这也意味着腾讯云大数据的应用创新与建设能力又一次得到了权威认可。

其中,“技术卓越奖”是表彰腾讯云大数据在前沿技术上的不断追求与突破。腾讯云大数据开源了社区顶级项目数据集成Inlong、机器学习Angel等八大项目,在Ceph、JDK、Ozone等项目上的贡献第一,以及在云原生数据湖架构、自适应智能计算、Angel PowerFL隐私计算框架、超大型场景下的智能推荐技术等众多核心自研技术模块都取得了重大突破。

腾讯云大数据云数据仓库CDW则脱颖而出拿下“创新产品奖”。云数据仓库CDW产品线既有自研的MPP数仓引擎,核心模块全部自研,自主可控,符合国家信创要求;也有完全兼容Clickhouse、Doris这类开源组件的实时引擎,CDW在开源组件的能力基础上推出全新的云原生弹性版,采用全新存算分离架构,自研表引擎,天然具备更优雅的弹性能力,大幅提升性能并且能够节省成本。

探索腾讯云大数据的演进之路

追溯腾讯云大数据的发展历程,我们不难发现可以分为四个阶段。从第一代的离线计算,到第二代的实时计算,再到第三代的机器学习,发展到如今以隐私计算、数智融合和云原生为代表的第四代。经过多年的经验积累与技术沉淀,腾讯云大数据逐步建立了独特的差异化竞争优势,实现产品的迭代创新及应用落地。

自2009年起,腾讯云大数据就开始海量大数据处理的探索,第一代大数据平台依托Hadoop生态,围绕着离线计算模式化进行业务场景优化,构建出能够稳定支撑小时/天级别的计算任务数据处理平台。三年时间里,腾讯云实现从关系型数据库到自建大数据平台的全面迁移。

时间来到2012年,PC互联网向移动互联网的进化,对业务计算能力提出更高的要求。基于此,腾讯云通过引入Spark、Storm、Flink等实时计算处理框架,让大数据平台处理性能迈入毫秒级别,可以实时洞察用户行为,提升社交广告点击率,推动平台迭代至以实时计算为特色的第二代。

随着深度学习技术的兴起,腾讯云大数据团队从2015年开始从0到1自研机器学习框架Angel,以及一站式AI开发平台智能钛TI,专攻复杂计算场景,可进行大规模的数据训练,支撑内容推荐、广告推荐等AI应用场景,推动国内大数据处理正式进入机器学习时代。

2019年迄今,腾讯云大数据迈进了以隐私计算、数智融合和云原生为代表的第四代,通过引入批流融合、数据湖、联邦学习等新型技术,围绕安全、智能、统一等能力打造第四代数智融合计算平台,以统一的数据处理引擎更高效地挖掘数据价值,为开发者、企业、以及政府的数字化、智能化升级打下坚实基础。

剖析腾讯云大数据的产品矩阵

腾讯云副总裁黄世飞在首届腾讯云大数据峰会暨Techo TVP开发者峰会上表示,“基于全新的技术架构、数据治理理念,以及产品能力,从底层的大数据基础引擎、中层的一站式大数据开发治理平台,再到上层的智能推荐、隐私计算和BI应用,腾讯云已经构筑了国内领先的大数据产品矩阵。”

▲腾讯云大数据产品矩阵

底层的弹性MapReduce(EMR)、Elasticsearch Service(ES)、云数据仓库CDW、数据湖计算DLC、流计算Oceanus等构成了腾讯云大数据的云原生基础引擎,可为用户快速高效构建企业级数据分析技术架构,提供在海量数据实时分析场景下的极速体验。

中层的一站式大数据开发治理平台 Wedata,基于业内领先的DataOps数据开发模式, 通过协同、效率、一体三大核心优势, 实现了数据集成、数据开发、任务运维的全链路DataOps数据开发能力,以及数据地图、数据质量、数据安全等数据治理和运营能力,帮助企业在数据构建与应用过程中提高数据开发效率,提升数据质量,建立常态化数据运营能力,实现数据价值增长。

上层的数据应用与可视化则是依托腾讯云自身丰富的业务场景所打造的一系列SaaS化数据应用,包括智能推荐平台、隐私计算、腾讯云BI、移动推送、产业分析等,构建应用层数据安全与全链路增长解决方案。无论是基于数据的各类分析,还是智能推荐,它们都是企业数字化转型的最终“落脚点”之一。

腾讯大数据处理套件TBDS则是针对私有云场景,基于腾讯多年海量数据处理经验,整合腾讯内部大数据技术能力,将云端大数据产品能力完全复刻的,面向数据全生命周期的企业级大数据云平台。客户可以借助 TBDS ,根据不同数据处理需求选择合适的大数据分析引擎和相应的数据开发治理工具,构建数据仓库、用户画像、精准推荐、风险管控等大数据应用服务。

揭秘腾讯云大数据的落地实践

所谓,宝刀方从磨砺出,梅花香自苦寒来。如此丰富的腾讯云大数据产品矩阵,还需切实落地到场景中才能看到成效。截至目前,腾讯云大数据产品已经成功应用在政务、金融、能源、地产、工业、互联网、媒体、医疗、教育、出行等多个领域,帮助千行百业的客户实现数字化转型。

在金融行业,腾讯云与中信建投证券联合上线证券行业首个国产化大数据平台。该平台全面基于腾讯大数据套件TBDS,从编译环境搭建、部署适配、功能验证等多维度出发,深度满足用户的国产化需求,加快金融行业实现全面自主可控的进程,高效提升业务服务质量,为金融行业高质量发展打开新思路。

在电力行业,腾讯云大数据TBDS团队基于腾讯内部业务场景优化后的大数据组件,为南方电网提供性能优化参数。深入南方电网的业务场景,协助设计新业务架构,通过构建统一数据湖,将各业务数据统一归集到数据湖底座,数据服务层作为数据中心对外提供服务能力的应用层,有效加速数据应用的融合。

在制造行业,腾讯云基于大数据,助力三一重工数字化转型。三一重工通过与腾讯云的云计算能力相结合,把分布全球的50万台设备接入平台并实时采集运行参数,利用云计算和大数据,远程管理庞大设备群的运行状况,不仅实现了故障维修2小时内到现场、24小时内完成,还大大减轻了备件的库存压力。

在零售行业,腾讯云大数据中台帮助永辉超市实现品种优化和销售预测,通过正确的人才洞察大幅提高店铺经营效率,同时为永辉超市的沉淀会员提供更好的服务。从而更好的支持永辉超市的日常业务决策,实现门店管理成本降低,试点门店的销量实现提升、消费者数字化洞察等,全面拥抱智慧化升级。

写在最后

基于数据进行决策是未来企业的常态,数据也将成为实体经济创新的燃料。《2022年云上产品趋势报告》数据显示,到2026年,全球大数据市场的IT总投资规模将增至4491.1亿美元,实现约15.6%的复合增长率——运用数据帮助企业强化竞争力,是大数据产品的价值所在。

未来,腾讯云大数据还将在以容器化、统一调度、Serverless等前沿技术相结合的云原生大数据产品,以深度完善DataOps敏捷数据开发,构建更加标准与开放的数据治理体系,以破解数据保护与应用矛盾,打造更可靠的“可用不可见”数据安全方案,以大数据与AI融合,为大数据装上“智慧”的大脑,打通数据和业务智能应用的数智融合生态等方向上进一步发力,携手合作伙伴,为客户提供更智能、更安全的大数据产品服务。