腾讯云TACO推出混合序列并行USP,大幅提升LLM和DiT训练性能
大语言模型长序列是近期研究的热点,如何训练超长序列的模型成为关注的重点。序列并行(SP)是一种将输入序列维度进行切分的技术,它已成为训练和推理更长序列的一种有效方法。近段时间,腾讯云在大模型序列并行领域取得重大突破,推出了创新的USP(Unified Sequence Parallel)技术。对比主流的DeepSpeed-Ulysses[1]和Ring-Attention[2]序列并行方式,USP在DiT场景下生图的性能提升最多24%,在LLAMA2-7B场景的性能提升最多2倍以上,为DiT和长序列场景提供强力支持。
字节跳动 | 提出大模型遗忘方法,只需2% 的RLHF计算时间即可实现对齐!
随着大型语言模型(LLM)的推广和应用,人们越来越关心大模型输出内容的有害性,这对于客户服务、医疗资讯等领域来说是难以容忍的。那么如何避免 LLM 产生有害回复?
HuggingFists-低代码玩转LLM-腾讯云RAG(2)
1. 点击界面右上角的“user_name”,点击“个人设置”进入“资源账号”界面。
云原生 AI 工程化实践:FasterTransformer 加速 LLM 推理
OpenAI 在 3 月 15 日发布了备受瞩目的 GPT4,它在司法考试和程序编程领域的惊人表现让大家对大语言模型的热情达到了顶点。人们纷纷议论我们是否已经跨入通用人工智能的时代。与此同时,基于大语言模型的应用也如雨后春笋般出现,为我们带来了协同办公、客服对话、语言翻译、内容生成等方面前所未有的畅快体验。
HuggingFists-低代码玩转LLM-腾讯云RAG(1)
在之前的系列文章里,笔者介绍了如何使用阿里的千问LLM、阿里的文本嵌入模型以及Milvus向量库来搭建一个RAG(检索增强生成)的实验。可通过以下的文章链接回顾一下之前介绍的内容:
开发基于云的RAG应用,使用开源 LLM
按照以下步骤指南,使用 BentoML、LangChain 和 MyScaleDB 创建自定义 AI 应用程序。
联邦语言模型:边缘SLM+云LLM
联邦语言模型是一个利用了两种人工智能趋势的想法:小型语言模型 (SLM) 和大型语言模型 (LLM) 能力的提升。
中文版大模型 Token 成本计算器
分享一个轻量的小工具,10MB 左右,能够帮助你直观的了解大模型 Token 的计算方法。
宇宙尽头是「计算」!AI大佬Wolfram最新演讲:LLM自主在计算空间探索,奇点降临就是现在
近日,著名的英国科学家Stephen Wolfram在TED 18分钟的演讲中,分享了自己对这个问题的看法。
[译文] LLM安全:3.网络LLM攻击及提示注入知识普及(PortSwigger)
这是作者新开的一个专栏,主要翻译国外知名安全厂商的技术报告和安全技术,了解它们的前沿技术,学习它们威胁溯源和恶意代码分析的方法,希望对您有所帮助。当然,由于作者英语有限,会借助LLM进行校验和润色,最终结合自己的安全经验完成,还请包涵!
【AI】SLM,LLM,对话式AI,生成式AI的差异分析
一个包含许多概念和缩写的标题,别担心,下面我将为你一一解释,谷歌趋势显示,生成式人工智能是讨论最多的流行语:
LLM DevOps 平台:加速大模型应用开发 | 开源日报 No.269
bisheng 是一款开源的 LLM DevOps 平台。 该项目旨在赋能和加速大模型应用开发,帮助用户以最佳体验进入下一代应用开发模式。 其主要功能、关键特性和核心优势包括:
独家 | 使用检索增强生成技术构建特定行业的 LLM
企业正在竞相采用大型语言模型(也可以被称为LLM)。让我们深入了解如何通过RAG(检索增强生成技术) 构建特定行业的大型语言模型。
HuggingFists-低代码玩转LLM-腾讯云RAG(1)
在之前的系列文章里,笔者介绍了如何使用阿里的千问LLM、阿里的文本嵌入模型以及Milvus向量库来搭建一个RAG(检索增强生成)的实验。可通过以下的文章链接回顾一下之前介绍的内容:
Github 星标 14.6K: 一站式 AI 桌面应用 Anything LLM
Anything LLM 是一个集成了 RAG 和 AI Agent 功能的 AI 桌面应用,它可以将多种格式的文档、网址或内容转化为上下文,以便与大型语言模型(LLM)交流时使用,支持本地运行或部署为服务供多人使用,还可以搭配各种 LLM 和向量数据库构建私人 ChatGPT。
Lumos——一款由大模型Ollama提供的本地LLM浏览网页Chrome扩展
春节在家,翻了很多优秀的AI开源项目,这里选几款和大家分享一下。Lumos是一款由本地LLM驱动(也就是大模型本地布署),用于浏览网页的RAG LLM协助工具。
PyCon US:Simon Willison 谈论如何破解 LLM 以获取乐趣和利润
Django 的联合创始人认为,提示工程是一大堆愚蠢的技巧。但这并不是你无法使用该技术创建有趣应用程序的理由。
谷歌DeepMind爆火动画18秒解释LLM原理,网友蒙圈!组团求GPT-4下场分析
Google DeepMind最近在自己的视频博客上上传了一段视频,「简单明了地」演示了大语言模型的工作原理,引发了网友的激烈讨论。
谷歌DeepMind爆火动画18秒解释LLM原理,网友蒙圈!组团求GPT-4下场分析
Google DeepMind最近在自己的视频博客上上传了一段视频,「简单明了地」演示了大语言模型的工作原理,引发了网友的激烈讨论。
大模型安全:Prompt Injection与Web LLM attacks
大语言模型(英文:Large Language Model,缩写LLM)中用户的输入称为:Prompt(提示词),一个好的 Prompt 对于大模型的输出至关重要,因此有了 Prompt Engneering(提示工程)的概念,教大家如何写好提示词