11月,图像分析、人脸识别、自然语言处理NLP推出新功能。腾讯云AI团队联合腾讯优图、AILab、微信智聆、微信智言等实验室,帮助合作伙伴和客户高效打造针对性的解决方案,助力各行各业的数字化和智能化转型。
全新功能
图像分析
在上周推送的《一张图片在AI眼里是什么样?》文章中,小编通过大量演示截图展示了图像分析的实际上手体验。目前这个官网体验中心正式对外发布了,无需接入即可快速体验13项图像理解、审核、处理等能力。(点击直达)
人脸识别
腾讯云神图·人脸识别(Face Recognition)是基于腾讯优图世界领先的面部分析技术,提供包括人脸检测与分析、五官定位、人脸搜索、人脸比对、人脸验证、活体检测等多种功能,为开发者和企业提供高性能高可用的人脸识别服务。可应用于智慧零售、智慧社区、智慧楼宇、在线身份认证等多种应用场景,充分满足各行业客户的人脸属性识别及用户身份确认等需求。
11月人脸识别3.0版本正式对外发布,本次更新包括:
1. 新模型整体算法效果提升超过5%; 2. 支持“人员查重”功能,可实现“一人一档”能力; 3. 支持“跨年龄识别”; 4. 单次搜索人脸库从百万提升至三百万; 5. 支持融合特征识别。
应用场景
一人一档:对已有人员库进行人脸查重,避免一个自然人在人员库中存在多个身份。
跨年龄识别:用跨年龄段的照片,比如儿童时期照片与现实相貌进行识别。可以应用于寻人或者娱乐玩法。
人脸融合
人脸融合推出3款新套餐包(次数、QPS、素材额度、素材可更新时间)
授权费套餐 | 资源包 | 固定QPS | 素材额度 | 素材可更新时间 | 费用 |
---|---|---|---|---|---|
套餐一 | 1万次 | 10QPS | 10张 | 30天 | 5,000元 |
套餐二 | 30万次 | 50QPS | 30张 | 365天 | 20,000元 |
套餐三 | 500万次 | 50QPS | 1000张 | 365天 | 80,000元 |
单个活动500次免费额度依然有效哦!同时,开发者在控制台点击素材管理-调节参数,即可同时体验两种融合效果,并且这部分体验不计入免费额度中!
应用场景 多人合影、推广宣传、形象打造、个人形象。
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多种音色选择,支持自定义音量、语速,为企业客户提供个性化音色定制服务,让发音更自然、更专业、更符合场景需求。语音合成广泛应用于语音导航、有声读物、机器人、语音助手、自动新闻播报等场景,提升人机交互体验,提高语音类应用构建效率。
11月产品更新中,语音合成已正式商用。
高拟真度、灵活配置的语音合成产品,打通人机交互的闭环,让应用逼真发声!声音质量优秀,免费额度每月100万字符,超过后0.2元每万字符,物美价廉。
应用场景
机器发声、有声读物制作、语音播报。
腾讯智能对话平台 TBP
腾讯智能对话平台(Tencent Bot Platform,TBP)专注于“对话即服务”的愿景,全面开放腾讯对话系统核心技术,为大型企业客户、开发者和生态合作伙伴提供开发平台和机器人中间件能力,实现便捷、低成本构建人机对话体验和高效、多样化赋能行业。
本次更新具体包括:
1. 新发布双语闲聊机器人
内置闲聊机器人可以支持英文啦,机器人双语切换无压力!
2. 新发布运营标注功能
机器人上线后想让机器人理解力更强?赶快打开运营标注功能,每天5分钟机器人变聪明!
3. 更多快速机器人接入渠道
公众号客服一键扫码,零后端代码H5接入方案,快速接入小程序插件,强力来袭!
TBP提供简单易用的控制台,开发者无需深入自然语言处理原理,只需提供对话语料平台即可快速创建对话机器人。
极简的接入方式,大大降低了TBP的使用门槛,让更多的人享受到腾讯智能对话平台带来的便捷与快乐。
机器翻译
腾讯机器翻译(Tencent Machine Translation)使用纯神经网络翻译,从大规模双语语料库自动学习翻译知识,实现从源语言到目标语言的自动翻译;在WMT2018国际翻译大赛中,夺得中英方向世界第一名;目前支持16个语种、80+语言对的翻译。
11月发布的新能力中,机器翻译支持通过 CAM 创建、管理和销毁用户(组),并使用身份管理和策略管理控制其他用户使用腾讯云机器翻译的权限。
通俗来讲,就是为了支持父子账号功能,父账号对子账号使用机器翻译时进行授权和权限管理。
应用场景
网页翻译、国际办公、视频字幕、智能硬件。
自然语言处理 NLP
1)新增知识图谱相关的三个接口:实体信息查询,实体关系查询,三元组查询。
知识图谱具有丰富的语义表示能力与灵活的结构,可以有效支持百科知识查询及问答。目前腾讯知识图谱数据查询基于千亿级中文互联网通用语料与多个垂直领域的语料,通过领先的自然语言处理与知识图谱构建技术,对海量知识进行了组织和整理,构建了包含51个领域、超过9700万实体和近10亿三元组的超大规模中文知识图谱,并且在动态更新维护中,确保图谱快速融合最新知识。
上述新增的三个接口可以应用于基于海量百科知识图谱做知识的智能搜索、问答和推荐。
2)新增闲聊对话接口:基于200w通用语料,支持闲聊问答
应用场景
智能音箱、智能语音助手、聊天机器人等智能设备,快速响应用户口语化的问句,直接给出客观事实作为答案。
性能提升
混贴票据识别服务升级,支持多张、多类型票据的混合识别,系统自动实现分割、分类和识别,同时支持自选需要识别的票据类型。
支持范围:增值税发票、增值税发票(卷票)、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票。