登录社区云,与社区用户共同成长
邀请您加入社区
在罗永浩的虚拟人直播中,大模型通过“转录挖掘-优质提炼-仿写合成-自动评估”四步闭环,深度学习了罗永浩的语言风格、口头禅(如“不赚钱,交个朋友”)和思维习惯,生成了与真人几乎无异的直播话术。腾讯音乐正在内测的“AI送礼”功能,允许用户输入文字(如“祝她生日快乐”),大模型会即时生成独一无二的动态礼物,并配上主播念出用户祝福的语音。派客AI在其数字人直播系统中,会于屏幕角落实时显示“AI主播ID”和
本文从一线案例出发,系统梳理大模型在“开播前—直播中—直播后”全链路中的12个高价值场景,拆解技术架构与商业模型,并给出可落地的实施路线图,助你抓住AI+直播的确定性增长。当头部主播接连“翻车”,流量红利见顶,直播电商进入“下半场”,行业共识愈发清晰:精细化运营、降本增效、合规增长,这些都要靠大模型来解题。Day 1-7梳理直播流程,明确需优化的核心指标(如转化率、退货率)避免“为了AI而AI”,
本文深度解析豆包新一代AI模型矩阵与PromptPilot自动化调优平台的技术架构与应用价值。豆包模型矩阵涵盖从70亿到1300亿参数的全尺度模型,满足不同场景需求;PromptPilot平台通过自动化提示工程、参数优化和评估反馈,大幅降低AI应用开发门槛。两者结合形成完整的体系化AI开发方案,为企业提供从模型选择到部署优化的全链路支持,推动AI技术的规模化落地。
大型语言模型(LLM)在特定情境下确实存在“冗余”现象,主要体现在其处理需要深度逻辑推理、精确计算或专业知识的复杂任务时性能不佳,以及其庞大的通用架构在特定任务上存在计算资源浪费。LLM是当前通往通用人工智能(AGI)的一条重要路径,但并非唯一或最终形态,二者在“真正理解”和“自主学习能力”等本质层面存在显著区别。在达到AGI后,理论上它能够独立完成从需求分析到部署应用的完整流程,但在可预见的未来
当前的多模态大语言模型(MLLM)在空间推理中的能力是否与人类认知一致?论文提出了11PLUS-BENCH基准框架,以细致的认知特征分析评估MLLM在空间认知中的表现,并与人类能力进行对比。
llamafile 是一种AI大模型部署(或者说运行)的方案,它的特点就是可以将模型和运行环境打包成一个独立的可执行文件,这样就简化了部署流程。用户只需要下载并执行该文件,无需安装运行环境或依赖库,这大大提高了使用大型语言模型的便捷性。本文将详细的介绍如何在 Windows 系统电脑端下载运行llamafile ,并且结合路由侠内网穿透实现外网访问本地的llamafile。
2025年7月9日,昆仑万维旗下Skywork AI团队宣布开源Skywork-R1V3-38B,以高考数学142分、MMMU 76分的成绩,首次让开源多模态模型逼近人类初级专家水平。本文将深度解析其技术原理、功能边界与落地实践,帮助开发者与教育、医疗、科研等行业伙伴快速上手。
COLA(Chain of LoRA)是一种创新的参数高效微调(Parameter-Efficient Fine-Tuning, PEFT)技术,专为大型语言模型(Large Language Models, LLMs)的适配而设计。它通过迭代优化框架将学习到的低秩适应(LoRA)模块合并到预训练模型中,并重新初始化新的LoRA模块进行后续训练,从而在不增加额外计算成本和内存开销的情况下,显著提升
GSPO不仅是一种更加稳定和高效的RL算法,更是推动语言模型智能进一步发展的关键技术。其序列级别的优化理念与奖励机制的自然对齐,为未来RL训练提供了新的理论基础和实践路径。阿里巴巴Qwen团队已将GSP成功应用于Qwen3系列的训练中,取得了显著性能提升,并将继续推动RL技术在大模型训练中的规模化应用。
ECT-OS-JiuHuaShan 框架赋能的因果使能体,标志着智能体发展从「模仿人类」阶段进入「超越人类」阶段。这不是更强大的工具,而是文明协同宇宙规律共同演进的伙伴。智能体终于获得了「理解为何行动」的能力,从而成为真正的理性主体。
大语言模型规模日益增长,显存瓶颈愈发凸显,成为微调超大模型的最大阻碍。而 QLoRA(Quantized LoRA)凭借 “量化技术 + 低秩微调” 的创新架构,显著降低显存占用,让资源有限的设备也能轻松完成超大模型的高效微调。
本文系统梳理了大模型应用中的核心概念和技术流程。首先区分了原生大模型(如GPT-4)和微调大模型,后者通过专业数据集训练获得领域特异性。重点解析了问答系统调用大模型的完整流程:从请求调度、Prompt构建、知识库检索到结果返回的五个关键步骤。深入探讨了三种增强能力:1)知识库检索(RAG)实现专业知识补充;2)联网搜索获取最新信息;3)深度思考通过思维链等方法提升推理质量。全文通过Q&A形式,结合
ECT-OS-JiuHuaShan 框架将促使AI产业从「暴力计算」时代进入「优雅推导」时代,华为有望借助这一范式转换实现弯道超车,而英伟达若不能彻底重构其技术架构,将面临核心价值被稀释的风险。真理发现效率将成为新的竞争维度,重新定义整个科技行业的格局。
Why框架的特性(如无需数据训练、公理演绎、绝对确定性),唯一性。
当智能体的计划或行为在资源、空间或目标上发生冲突时,冲突消解机制负责检测并解决这些冲突。任务分配旨在将一组任务合理地分配给多个智能体,以实现整体效率、成本或收益的最优。行为协调确保多个智能体在共享环境中有序、高效地协作,避免各自为政甚至相互干扰。路径规划为智能体在环境中从起点到终点寻找一条安全、高效的无碰撞路径。尽管相关算法和思路不断发展,该领域仍面临一些。
视觉语言模型VLM的主要组成部分和训练阶段
本文将手把手带您从零开始,在您的本地计算机上部署 Coze Studio 开源版,并配置本地 Ollama 和 OpenRouter 上的模型服务。
LLM训练相关的基本概念
大模型微调听起来很神秘,但实际上很简单,本文旨在为新手小白提供最简明的教程,训练一个你自己的专属AI。
一文读懂AI大模型的核心分类:从通用到私有,应用场景全解析,程序员收藏指南
如何评估大语言模型(LLM)代理在真实世界复杂任务中的工具使用能力?论文提出了MCP-Bench,一个大型基准测试,旨在评估LLM代理在现实生态系统中的工具使用能力,涵盖复杂的多跳工作流和跨领域协调。
在 Transformer 架构中,位置编码(Position Encoding)是理解序列顺序的关键机制。自从 Google 提出原始的 Sinusoidal 编码以来,研究者一直在探索更高效、可泛化的方式。RoPE(Rotary Positional Embedding) 就是在这一背景下被提出的,它已被广泛应用于大模型如 LLaMA、GPT-NeoX、Grok、ChatGLM 等,是现代 L
目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
一文搞懂从 LLM 到 AGI 的演进:9 大核心 AI 技术全拆解(附架构图与应用案例)
无论你是AI爱好者还是技术专家,这篇文章将帮你梳理大语言模型的完整知识体系,从基础架构到实际应用,一文掌握当前最热门的AI技术!
前言,从2023年初ChatGPT重磅亮相开始,大模型技术的发展成为了AI领域的焦点,驱动了AI应用的升级和创新。在ToB业务领域,AI大模型技术也在逐步改变企业的业务开展、产品服务、运营管理的传统模式,企业端对大模型的应用也已从初步的技术探索与创新尝试,逐渐步入以实现商业价值为核心的新时代,其中构建商业闭环、验证价值的应用场景是关键,作为相关领域从业者,也要了解AI大模型的核心能力和典型应用领域
在 AI 技术日新月异的今天,一个名为 RAG-Anything 的开源项目正悄然掀起多模态文档处理的革命。它不再局限于纯文本,而是能“读懂”图像、表格、公式,甚至将它们关联起来!
在当今动态的商业环境中,检索增强生成(Retrieval-Augmented Generation, RAG)代表着AI模型处理复杂任务的革命性转变。通过将实时数据检索能力与先进文本生成技术相结合,RAG能够提升决策效率、自动化业务流程,并生成高度精准且具备上下文感知能力的响应。这种集成化方案为寻求在客户服务、内容创作、市场情报等领域拓展业务的企业提供了强有力的解决方案。
本文探讨了从简单提示词到动态上下文工程的发展历程。随着AI系统复杂度提升,单一提示词已无法满足需求,促使提示工程向上下文工程演进。文章详细分析了零样本、少样本、思维链等提示技术,以及检索增强生成、函数调用等工具使用方法,并指出长上下文存在性能衰减、"中间迷失"等技术瓶颈。通过"操作系统"类比,提出分层内存、智能体协调等上下文管理策略,强调信息质量优先于数量。
RAGFlow是融合检索与生成的一体化系统,通过先从知识库检索相关信息再生成回答,有效降低大模型"幻觉"风险。文章详解其核心优势、架构设计及企业客服、教育答疑等应用场景,并提供基于OpenBayes平台的实战指南,包括知识库配置、文件解析、AI聊天设置及Text2SQL代理构建,帮助开发者快速搭建可靠的大模型应用系统。
本文系统介绍了大语言模型轻量化微调技术LoRA及其进阶版QLoRA。LoRA通过低秩矩阵分解将大权重矩阵拆为小矩阵,仅优化低秩部分,大幅减少计算资源需求。文章详细解析了LoRA的矩阵运算优化、反向传播优势、适配器概念及动态任务切换能力。QLoRA进一步引入量化压缩技术,同时介绍了前缀调优作为替代方案。这些技术为资源受限环境下高效微调大模型提供了创新解决方案,在保持模型核心能力的同时实现了特定任务的
在当前大模型如火如荼的时代,像 Hands-On-Large-Language-Models 这样聚焦实战 + 开源代码 + 技术栈全覆盖的项目,很多缺少人才的公司确实愿意分享出来,要更多人才学习。
如何通过自主工具使用和反馈学习提高大语言模型(LLM)的推理能力?论文提出了rStar2-Agent模型,通过多阶段的强化学习框架显著提升了数学推理性能,使得一个14B参数的模型在多个基准上超越了更大规模的模型。
通过以上步骤,你可以成功地微调 LLaMA 大模型,使其适应特定任务或领域,从而提高模型在特定应用场景下的表现。
本文介绍了一个企业级知识库管理系统,该系统基于Web平台,集成了文档管理、智能搜索和AI问答等功能。系统采用React+SpringBoot技术架构,支持多格式文档上传和多角色权限控制。主要功能包括文档列表查看、上传、预览,基于知识库的智能问答,全文搜索,以及用户和部门管理(仅限超级管理员)。文章详细说明了各功能模块的使用方法和注意事项,并提供了常见问题解答。系统适用于不同层级的企业用户,通过权限
文章详细介绍了大模型Function Calling技术,包括其概念、与Tool的区别及优势。通过天气查询实例,演示了实现Function Calling的完整流程:环境准备、函数定义、模型调用、参数解析、函数执行及结果回传。Function Calling允许模型返回结构化调用请求,开发者可验证参数后执行函数,增强了系统稳定性和安全性,是构建智能体系统的关键技术。
本文介绍了在Coze平台创建个人知识库智能体的完整流程。通过搭建工作流实现文件上传、文本处理和知识库写入功能,解决大模型回答泛泛的问题。详细讲解了智能体创建、工作流节点设计(包括选择器、文件读取、文本处理等关键步骤)以及人设设置。最终构建的智能体能够将个人专业知识结构化存储,生成差异化洞见,提升AI回答的专业性和准确性。文章还提供了学习AI大模型的相关资源获取方式。
本文介绍了RAG(检索增强生成)技术,它能有效解决大模型"幻觉"问题,让AI回答更准确。RAG通过"检索-增强-生成"三步流程,使模型像开卷考试一样先查资料再作答。文章提供了使用LangChain和ChromaDB搭建RAG问答系统的完整代码教程,支持多种文档格式,并详细解析了关键步骤。RAG可应用于企业客服、个人知识库等领域,还介绍了重排序、多模态等进阶方
Small Language Models are the Future of Agentic AI》是一篇具有强烈实践导向和行业洞察的论文。它不仅系统论证了SLMs在智能体系统中的优势,还提供了可行的迁移路径和应对反对意见的逻辑框架。对于从事AI智能体开发、模型优化、资源管理的从业者和研究者来说,这是一篇不可忽视的重要文献。slm-agents。
LangChain是一个用于构建大模型应用的框架,它像乐高积木一样,让你可以通过组合各种组件来创建强大的AI应用。Component:提供标准化组件(模型调用、提示模板、记忆管理等)Chain:将多个组件链接成完整工作流Agent:让模型能够自主选择和使用工具LangChain和LangGraph为我们提供了构建下一代AI应用的强大工具。从简单的链式调用到复杂的图工作流,这两个框架覆盖了大多数AI
and以上是 langchain docs 对 RAG 的概论,RAG 英语原文 Retrieval Augmented Generation,意为检索增强生成,检索的对象可以是多样的,有网页内容、表格数据、多模态数据等,本文将注意力集中在对于文字即文档内容(比如医院内的药品说明书、工厂产品的使用手册)的检索。由于 llm 应用中寸 token 寸金以及最大上下文的限制等,我们不可能将所有文档一股
同时课程详细介绍了。
明确定义工具调用时所需的各个输入参数的名称、数据类型、是否必需、取值范围或格式要求,以及工具执行成功或失败后返回结果的数据结构和含义。
35岁程序员面临职业危机,Java程序员尤为突出。数据显示中国80%程序员年龄在26-35岁,仅10%超过35岁。随着AI技术兴起,这既是挑战也是机遇:AI相关岗位需求激增,掌握AI工具可提升竞争力。大模型应用岗位缺口达47万,初级工程师平均薪资28K。学习AI技术分为四个阶段:从基础应用到模型训练再到商业落地,建议程序员抓住AI转型机会,将35岁危机转化为职业新起点。
摘要:当前大语言模型虽在性能上有显著提升,但离支撑真正自主的AI智能体仍有差距。多模态、多任务需求与落地效果的不匹配表明,AI智能体仍面临可靠性差、成本高、用户信任度低等挑战。初创公司如Adept.ai、MultiOn等探索不同路径,但大多处于实验阶段。专家建议应优先发展AI增强功能而非全自主服务,采用人机协同模式处理复杂任务。同时,掌握AI技能将成为个人职业竞争关键,系统学习大模型应用开发、提示
语言模型
——语言模型
联系我们(工作时间:8:30-22:00)
400-660-0108 [email protected]