【中科院计算所】WSDM 2024冠军方案:基于大模型进行多文档问答
会话式多文档问答旨在根据检索到的文档以及上下文对话来回答特定问题。 在本文中,我们介绍了 WSDM Cup 2024 中“对话式多文档 QA”挑战赛的获胜方法,该方法利用了大型语言模型 (LLM) 卓越的自然语言理解和生成能力。
首个国产开源MoE大模型来了!性能媲美Llama 2-7B,计算量降低60%
JP摩根的机器学习工程师Maxime Labonne测试后也表示,DeepSeek MoE的chat版本表现要略胜于微软的“小模型”Phi-2。
【中科院计算所】WSDM 2024冠军方案:基于大模型进行多文档问答
会话式多文档问答旨在根据检索到的文档以及上下文对话来回答特定问题。 在本文中,我们介绍了 WSDM Cup 2024 中“对话式多文档 QA”挑战赛的获胜方法,该方法利用了大型语言模型 (LLM) 卓越的自然语言理解和生成能力。
龙芯3D5000高性能CPU发布:LoongArch指令集,Chiplet技术,32核,支持4路扩展!
4月8日上午,在鹤壁举行的信息技术自主创新高峰论坛上,龙芯中科正式发布了龙芯3D5000处理器,这是龙芯5000家族的最新成员,首次使用芯粒(chiplet)技术将2个龙芯3C5000封装在一起,做到了32核。
计算机网络:关键性能指标与非性能特征解析
比特(bit )来源于 binary digit,意思是一个“二进制数字”,因此一个比特就是二进制数字中的一个1或0。
专注数据基础设施,Alluxio 如何让 AI 和数据价值全面释放?
12 月 9 日,AI 和大数据基础设施方案提供商 Alluxio 联合北京大学计算机学院等单位举办了 2023 全球 AI 前沿科技大会北京站,介绍了最新产品 Alluxio Enterprise AI 与为 Alluixo Enteprise Data 开发的重磅特性 Alluxio Edge。作为数据编排领域的先行者,Alluxio 的最新产品与特性瞄准了市场上最热门的 AI 与大数据主题,希望通过数据编排这一关键工作流环节的技术创新,为企业的相关应用带来显著的加速效果和成本效益提升。
专注数据基础设施,Alluxio 如何让 AI 和数据价值全面释放?
12 月 9 日,AI 和大数据基础设施方案提供商 Alluxio 联合北京大学计算机学院等单位举办了 2023 全球 AI 前沿科技大会北京站,介绍了最新产品 Alluxio Enterprise AI 与为 Alluixo Enteprise Data 开发的重磅特性 Alluxio Edge。作为数据编排领域的先行者,Alluxio 的最新产品与特性瞄准了市场上最热门的 AI 与大数据主题,希望通过数据编排这一关键工作流环节的技术创新,为企业的相关应用带来显著的加速效果和成本效益提升。
POINTNET:利用深度学习对点云进行3D分类和语义分割
这次介绍的是一个比较基础的工作,针对空间点云,进行分类或者语义分割的框架,现在通常也被用作对RGB-D图像进行特征提取的部分。
腾讯云V265/TXAV1直播场景下的编码优化和应用
随着视频直播不断向着超高清、低延时、高码率的方向发展, Apple Vision的出现又进一步拓展了对3D, 8K 120FPS的视频编码需求,视频的编码优化也变得越来越具有挑战性。在LiveVideoStackCon 2023上海站,腾讯云专家工程师姜骜杰老师为我们分享了腾讯云V265/TXAV1直播场景下的编码优化和应用,带领我们探索音视频技术的无限可能性。
POINTNET:利用深度学习对点云进行3D分类和语义分割
这次介绍的是一个比较基础的工作,针对空间点云,进行分类或者语义分割的框架,现在通常也被用作对RGB-D图像进行特征提取的部分。
腾讯云V265/TXAV1直播场景下的编码优化和应用
随着视频直播不断向着超高清、低延时、高码率的方向发展, Apple Vision的出现又进一步拓展了对3D, 8K 120FPS的视频编码需求,视频的编码优化也变得越来越具有挑战性。在LiveVideoStackCon 2023上海站,腾讯云专家工程师姜骜杰老师为我们分享了腾讯云V265/TXAV1直播场景下的编码优化和应用,带领我们探索音视频技术的无限可能性。
激光雷达生成的图像检测关键点用来辅助里程计的方案
文章:LiDAR-Generated Images Derived Keypoints Assisted Point Cloud Registration Scheme in Odometry Estimation
探索未来:集成存储器计算(IMC)与深度神经网络(DNN)的机遇与挑战
在当今数字化时代,人工智能(AI)已经成为科技领域的一股强大力量,而深度神经网络(DNN)则是AI的核心引擎之一。DNN是一种模仿人类神经系统运作方式的计算模型,通过层层堆叠的神经元网络来实现复杂的模式识别和数据处理任务。从图像识别、语音识别到自然语言处理,DNN已经在各个领域展现了惊人的能力。然而,随着DNN模型的不断演进和复杂化,对计算资源的需求也与日俱增。
腾讯云TACO推出混合序列并行USP,大幅提升LLM和DiT训练性能
大语言模型长序列是近期研究的热点,如何训练超长序列的模型成为关注的重点。序列并行(SP)是一种将输入序列维度进行切分的技术,它已成为训练和推理更长序列的一种有效方法。近段时间,腾讯云在大模型序列并行领域取得重大突破,推出了创新的USP(Unified Sequence Parallel)技术。对比主流的DeepSpeed-Ulysses[1]和Ring-Attention[2]序列并行方式,USP在DiT场景下生图的性能提升最多24%,在LLAMA2-7B场景的性能提升最多2倍以上,为DiT和长序列场景提供强力支持。
微拍堂采用腾讯云数据库KeeWiDB,性能、效率、成本全面优化
日前,腾讯云数据库KeeWiDB在微拍堂成功落地,读写、查询性能全面提升。KeeWiDB为微拍堂提供高性能、高效率、低成本的数据库服务,助力微拍堂提升用户体验。
作为行业领先的艺术品电商平台,微拍堂经过8年时间发展,目前已拥有超1亿用户,入驻商家超33万,业务占比稳居行业之首。在业务持续增长的态势下,其自研的Hades数据库已无法满足TB级的终端设备信息存储需求。基于成本、性能等诸多方面的对比分析和测试,微拍堂最终选择了腾讯云数据库KeeWiDB,对原有数据库进行替换升级。
作为腾讯云全新一代分布式KV存
FlattenQuant | 推动低比特量化技术突破,大幅提升大型语言模型的计算效率和部署性能!
大型语言模型(LLM)的卓越能力近年来产生了重大影响(OpenAI, 2023; Ge等人,2023; Zhao等人,2023)。各种LLM已经被发布并在现实世界的生产环境中得到应用(Eloundou等人,2023)。因此,对于LLM的部署有着广泛的需求。
在混合云下,我们将Kubernetes与Fluid结合后性能提升了30%
作者 | 温芳 360 系统部数据开发高级工程师
一年前,360 系统部开始研究云舟项目——打破传统存算一体结构、保持近实时的弹性,云原生计算存储分离类似 Snowflake 的 DaaS 数仓平台,并支撑公司日益增多的机器学习任务 。
我们遇到的第一个挑战就是线下存储如何与云上的计算资源适配,数据依然存储到云下的 PoleFS 存储中,无法对接云上的 Serverless 弹性容器实例。我们倾向于使用 serverless 容器,因为它简单易用、极致弹性、最优成本、按需付费;但同时 Serverless
Windows 365 云电脑初体验:启动用了 30 多分钟,卡顿感明显
作者 | Simon Sharwood
译者 | 王强
策划 | 褚杏娟
在推出仅一天之后,微软表示,Windows 365 的试用容量已满,暂时停止了 Windows 365 云电脑产品的免费试用。微软表示,公司将铺设新的服务器容量,并鼓励那些有兴趣的用户注册,以便得到恢复免费试用的通知。
即使如此火爆,但外媒进行了使用体验后表示,无论是价格还是性能都没有给下留下深刻印象。以下是测评过程。
初体验
我们注册的是 Windows 365 的基础级别服务:基础级别每月 20 美元,包含一个云 PC,配备单个
腾讯云基于英特尔® DLB 技术实现多核无锁化限速方案
作为全球领先的云服务提供商之一,腾讯云*致力于向全球用户提供性能卓越的企业级网络服务。公有云对于服务质量有着严苛的要求,计算、内存、网络以及存储等各项资源的分配能否满足服务水平协议中所承诺的标准,都将直接影响最终用户的应用体验。对于云服务提供商来说,如何在充分利用以上资源,满足服务水平协议的前提下,尽可能减少额外资源开销,也是降低运营成本的关键因素之一。为在降低成本的同时保证优质的服务质量,腾讯云携手深度合作伙伴英特尔,基于腾讯云应用程序界面 (Application Programming Interfaces, API) TGW 与腾讯专门的硬件工程实验室 星星海实验室的创新软硬件结合方案,发挥 TGW 在网络领域的技 术优势,针对网络资源调度及分配展开性能优化。
FlattenQuant | 推动低比特量化技术突破,大幅提升大型语言模型的计算效率和部署性能!
大型语言模型(LLM)的卓越能力近年来产生了重大影响(OpenAI, 2023; Ge等人,2023; Zhao等人,2023)。各种LLM已经被发布并在现实世界的生产环境中得到应用(Eloundou等人,2023)。因此,对于LLM的部署有着广泛的需求。