- 博客(84)
- 收藏
- 关注
原创 使用 NVIDIA Nsight Systems 分析 Ray 负载(verl)的性能
NVIDIA Nsight Systems 是一款系统级性能分析工具,旨在实现应用算法的可视化,找出程序中亟需优化的”瓶颈”并进行调整,以跨任意数量或大小的 CPU 和 GPU——从大型服务器到最小的系统级芯片 (SoC)——进行高效扩展。首先, Nsight Systems 不仅可以跟踪 GPU 的活动,还能够跟踪 CPU 的事件,从而帮助程序员建立起对程序整体工作流程的认识。它会锁定目标应用,以便在时间轴中同时显示 GPU 和 CPU 活动、事件、注释、吞吐量和性能指标。
2025-07-22 11:09:17
819
原创 NVIDIA 培训 | AI 培训班新课表发布,立即报名开发技能系统化实战培训
NVIDIA 深度学习培训中心(DLI)每月在北京或上海举办 NVIDIA 认证现场中文考试,面向国内开发者和 IT 专业人员,提供 Associate(初级)和 Professional(中级)认证考试。您将获得使用 NIM Operator 部署、监控和扩展 RAG 工作流的实践经验,并学习基础设施优化、性能监控和处理高流量的最佳实践。您将获得设计智能体的实践经验,这些智能体能高效地检索和完善信息、智能地路由查询,并利用诸如 LangGraph 等编排工具以及健全的软件工程实践来并发地执行任务。
2025-07-17 17:14:05
811
原创 重塑 AI 基础设施 第三届 NVIDIA DPU 黑客松竞赛结果出炉
她表示:“网络不仅仅是连接设备的基础设施,更是数据中心的神经系统。该项目联合了国内外知名的投资机构,创业孵化器,创业加速器,行业合作伙伴以及科技创业媒体等,打造创业加速生态系统,能够提供产品折扣,技术支持,市场宣传,融资对接,业务推荐等一系列服务,加速创业公司的发展。在“训练营+硬件+导师”的三重助力下,参赛团队基于 NVIDIA BlueField DPU 和 DOCA 软件框架的强大能力,在大模型优化、网络安全、智能存储等领域展开了深度探索并取得成果,实现了从理论认知到项目落地的完整闭环。
2025-07-17 17:08:07
927
原创 使用外部文件上传在 NVIDIA Air 中构建可扩展且自定义网络拓扑的优势
您可以在易于修改的文件中快速创建多个节点,而无需经历将新节点放入拖放编辑器并分配其资源(即使具有复制节点的功能)的繁琐过程。借助 NVIDIA Air API 或 SDK,您无需在浏览器中访问 air.nvidia.com,即可使用拓扑文件启动新的仿真。NVIDIA Air 演示市场中的几乎每个演示都提供了一个 GitLab 代码库,您可以在其中找到用于构建演示的拓扑文件。上传后,NVIDIA Air 将构建您的拓扑结构,您可以使用拖放编辑器进行任何进一步的修改。,了解如何创建外部拓扑文件。
2025-07-17 17:04:05
668
原创 使用 NVIDIA Air 服务将仿真与现实世界连接
使用共享仿真并通过 Web 控制台连接的每个用户在每个节点上都会看到完全相同的会话,而查看控制台的任何用户都会看到相同的数据。如果您的仿真需要来自外部来源的数据,您可以使用 API 或 Web 套接字拉取数据。例如,如果您的仿真依赖于第三方服务来提供天气数据、交通建模或财务建模,启用 HTTP/HTTPS 可实现与这些外部服务的无缝集成,从而实现动态更新。您可以使用自己首选的 SSH 客户端(例如 PuTTY、OpenSSH)或系统自带的终端,而不是使用 NVIDIA Air 中的内置控制台来访问节点。
2025-07-17 16:56:36
620
原创 NVIDIA DOCA 3.0 助力 AI 平台开启网络新纪元
在当今快速发展的 AI 领域中,支持大规模 AI 部署的基础设施与模型本身同样重要。随着企业从实验性 AI 项目扩展到生产就绪型部署,底层计算、网络和存储基础设施必须不断发展,以满足前所未有的需求。DOCA 正是这一发展的核心,它正在彻底改变开发者构建、部署和管理下一代 AI 平台的方式。最新版本的 DOCA 3.0 为开发者提供了丰富的库、驱动和 API,帮助他们为 NVIDIA BlueField DPU 和 Connect-X SuperNIC 创建高性能应用程序和服务。
2025-07-17 16:52:34
764
原创 NVIDIA 全栈加速代理式 AI 应用落地
从 AI 研究助理、软件安全检测到大规模视频分析,这些应用场景正切实推动代理式 AI 落地,在解决复杂业务问题、提升工作效率方面发挥关键作用。NVIDIA 通过全栈解决方案和工具,助力企业构建安全、稳定、高效的代理式 AI 应用。查看构建 AI 助手指南,可复制链接至浏览器获取电子书:
2025-07-17 16:48:32
661
原创 突破延迟极限:在 NVIDIA Blackwell GPU 上优化 DeepSeek-R1 的性能
在延迟敏感型应用中突破 DeepSeek R1 的性能极限是一项非凡的工程。本文详细介绍的优化措施是整个 AI 技术栈各个领域的协作成果,涵盖了内核级优化、运行时增强、模型量化技术、算法改进以及系统性能分析与调优。希望本文介绍的技术和最佳实践,能够帮助开发者社区在任务关键型 LLM 推理应用中更充分地发挥 NVIDIA GPU 的性能。
2025-07-04 17:11:31
911
原创 NVIDIA TensorRT-LLM 支持腾讯混元最新大语言模型 Hunyuan-A13B推理加速
未来,NVIDIA 技术专家团队将继续跟进混元模型的演进,探索更极致的推理加速技术(如新一代量化、更精细的算子融合、对 Blackwell 新特性的支持),不断刷新性能天花板。同时还将持续推动 TensorRT-LLM 与腾讯云 TI 平台、Hunyuan API 服务等生态的深度集成,提供更便捷的一站式混元模型部署与管理体验。
2025-07-04 16:59:53
841
原创 NVIDIA 培训 | 学习 3 门 NVIDIA AI 技术在医疗和健康的实践
NVIDIA BioNeMo 提供了一个专门用于药物研发的 LLM 和生成式 AI 平台,通过云原生 NIM ,研究人员能够简化 AI 工作流程,提高模型的可扩展性和部署效率。AI 技术正在迅速改变医疗和健康领域,NVIDIA 深度学习培训中心(DLI)推出 3 门医疗和健康领域的在线自主培训,帮助医疗专业人士和研究人员掌握最新的 AI 工具和技术。通过使用云原生 NIM 和 Blueprint,获得实际操作经验,能够部署可以大规模处理和解释复杂生化数据的 AI 模型,提升您的处理能力。
2025-07-04 16:50:45
695
原创 在魔搭社区使用 NVIDIA TensorRT-LLM PyTorch 新架构优化 Qwen3 系列模型推理
在上述已实现的各项优化特性之外,针对 Qwen3 系列模型,TensorRT-LLM 还在不断研发和探索新的优化方法,包括 kernel 层面的持续优化、算子融合、基于 sparse attention 的超长文本支持、基于 Eagle-3 的投机性采样、MoE 模型的 expert 负载均衡、新的量化精度(W4AFP8/NVFP4)等等,期待您紧密关注。Qwen 系列开源模型因其突出的模型能力、丰富的模型尺寸和持续更新的生态,在开源社区直接使用、二次开发和落地应用上都有着极其深刻的影响力。
2025-07-04 16:48:10
684
原创 基于 NVIDIA VSS 视频搜索和总结的 AI Blueprint,图灵新讯美打造企业级多模态视觉大模型融合解决方案
以融合解决方案为切入口,图灵新讯美充分发挥自身作为独立软件供应商 (ISV) 在技术集成、场景适配和客户交付方面的专业优势,打通从智算基础设施到场景应用的全链路,推动视觉智能从“看得清”走向“想得通、答得快”,真正将多模态 AI 转化为生产力、决策力与增长引擎。基于 VSS Blueprint 开发的应用接口,将事件分析,证据留存,触发告警的工作流无缝的集成到现有的新讯美的视频管理及调度平台上,实现不同目标任务,不同数据 (RTSP) 源,视觉模型及视觉大模型的灵活匹配和最佳部署。
2025-06-26 10:48:37
554
原创 什么是“物理AI”?
利用物理 AI,自主机器能够感知、理解并在现实 (物理) 世界中执行复杂的操作。物理 AI 是指使用运动技能理解现实世界并与之进行交互的模型,它们通常封装在机器人或等自主机器中。
2025-06-26 10:45:43
935
原创 NVIDIA Research 通过 AI 赋能的渲染技术为物理 AI 开发场景赋以新意
利用由 DiffusionRenderer 驱动的应用,智能汽车开发者可以获取大部分是白天驾驶镜头的数据集,并随机对每个视频片段的光照进行调整,以创建更多具有阴天或雨天、具有刺眼照明和阴影的夜晚以及夜间场景的视频片段。这样一来,研究人员观察到一种扩展效应,其中应用 Cosmos Predict 更大、更强的视频扩散模型相应提高了 DiffusionRenderer 的去光照和重新打光质量,实现了更清晰、更准确和时间上更一致的结果。
2025-06-26 10:42:51
552
原创 NVIDIA 发布全新的 AI 模型和开发者工具,推动汽车行业生态系统发展
辅助驾驶卡车领域的领军企业 Plus 正在利用 NVIDIA DRIVE AGX 平台构建其解决方案,该企业正在通过卡车运输数据对 Cosmos Predict 进行后训练,以生成高度逼真的合成驾驶场景,从而加速其辅助驾驶卡车解决方案的大规模商业化进程。为加速下一代辅助驾驶架构的开发,NVIDIA 发布了 NVIDIA Cosmos Predict-2,这是一种全新的世界基础模型,具有更强的未来世界状态预测能力,可生成高质量的合成数据,以及新的开发者工具。
2025-06-26 10:40:08
515
原创 NVIDIA 推出开源物理 AI 数据集,助力机器人及自动驾驶汽车技术发展
加州大学圣地亚哥分校多个机器人和自动驾驶汽车实验室的负责人 Henrik Christensen 表示:“利用这个数据集,我们能做很多工作,比如训练预测性 AI 模型,这些模型可以帮助自动驾驶汽车更好地追踪行人等易受伤害的道路使用者的动向,从而提高安全性。NVIDIA 物理 AI 数据集可以帮助开发者在预训练期间扩展 AI 性能,海量数据能够支持构建更强大的 AI 模型,在预训练阶段利用更丰富的数据对 AI 模型进行训练,以提高其在特定用例中的性能表现。
2025-06-26 10:37:25
607
原创 NVIDIA 人工智能开讲 | 了解物理 AI 新趋势
欢迎收听本期的 NVIDIA 人工智能开讲,本次节目邀请到了 NVIDIA 中国区高级技术市场经理施澄秋,为大家介绍 Physical AI(物理 AI)的新趋势,伴随 NVIDIA 推出的新的 Cosmos 平台,预计机器人行业将成为下一个 10 万亿美元市场。集顶尖的研究人员、技术专家及商业领袖,为您解读最具挑战性的 AI 难题,与您探讨由 GPU 技术推动的 AI 革命,帮您了解如何驾驭 AI 的磅礴力量。它如何推动物理 AI 的发展?00:56:物理 AI 是什么,和 AI 的关系是怎样的?
2025-06-25 17:51:28
293
原创 NVIDIA 面向物理 AI 开发者社区开放 Cosmos 世界基础模型
3D 输出时,扩散模型生成可控的高质量合成视频数据,用于启动机器人和自动驾驶汽车感知模型的训练。在 CES 大会上,NVIDIA 推出第一批 Cosmos 世界基础模型,用于基于物理的仿真和合成数据生成,配备先进的 tokenizer、护栏、加速数据处理和管理工作流,以及模型定制和优化框架。是一个用于加速物理 AI 开发的平台,推出了一系列世界基础模型——可以预测和生成虚拟环境未来状态的物理感知视频的神经网络,以帮助开发者构建新一代机器人和自动驾驶汽车(AV)。Super,用于高性能基线模型;
2025-06-25 17:47:20
628
原创 SC24 | NVIDIA 宣布与行业软件领先者推出 Omniverse 实时物理数字孪生产品
Omniverse Blueprint 通过整合用于加速求解器的 NVIDIA CUDA-X™ 库、用于训练和部署模型以生成流场的 NVIDIA Modulus 物理 AI 框架,以及用于 3D 数据互操作性和 RTX 支持的实时可视化的 NVIDIA Omniverse API(应用编程接口)来实现这些功能。NVIDIA 和 Luminary Cloud 在 SC24 大会上展示了业界领先的虚拟风洞,它允许用户以实时、交互式的速度对流体动力学进行仿真和可视化,甚至可以同时更改风洞内的车辆模型。
2025-06-25 17:24:03
491
原创 NVIDIA 培训 | NVIDIA 认证北京和上海现场考试时段发布
NVIDIA 深度学习培训中心(DLI)发布全新 NVIDIA 认证现场考试时段,自 6 月起每月在北京或上海举办。考试面向国内开发者和 IT 专业人员,提供 7 门 Associate(初级)和 Professional(中级)认证科目,考生可根据需求自由选择报考科目。邀请您和您的团队、伙伴、亲朋好友参加考试,展示您的专业知识和技能,助力个人职业生涯,增强企业竞争实力。根据您的工作角色、专业知识和职业目标,选择以下最适合您需求的专业认证。北京和上海考试安排。
2025-06-25 17:18:45
1065
原创 NVIDIA recsys-examples: 生成式推荐系统大规模训练推理的高效实践(上篇)
NVIDIA recsys-examples 将生成式推荐(如 “Actions Speak Louder than Words” 论文中提出的技术)与分布式训练(借由 TorchRec 增强)及优化训练推理相结合,助力开发和部署能够提供高度个性化用户体验的复杂推荐模型。我们诚挚邀请研究人员和从业者试用该工具,并期待与您共同推动生成式推荐系统的技术演进。
2025-06-19 14:37:31
1074
原创 NVIDIA 培训 | 机器人开发免费学习路径发布,掌握开发到部署全流程
通过学习 Isaac Sim 、 Isaac Lab 和 Isaac ROS 在线自主培训课程,从根本上了解机器人开发的核心概念,并探索仿真和机器人学习方面的必备工作流。课程概要:探索 NVIDIA Cosmos™ 平台,包括生成式世界基础模型(WFM)、先进的标记器(tokenizers)、护栏机制(guardrails),以及加速数据加工和精选流程,旨在加速物理人工智能的开发。课程概要:学习软件在环(SIL)的基本概念、优势,以及如何结合 Isaac Sim 和 ROS 2 应用于机器人开发。
2025-06-13 16:26:15
1083
原创 NVIDIA DOCA下载指南
借助 DOCA, 开发者可以通过创建软件定义、云原生、DPU 和 SuperNIC 加速的服务,并支持零信任保护,从而满足现代数据中心的性能和安全需求。选择资源包:在页面上,依次点击"BlueField"、"BF-Bundle"、"Ubuntu",然后选择"22.04"版本,安装BFB程序类型,以获取推荐的DOCA资源包。滚动至页面底部,选择"I Accept"以同意协议。选择资源包:在页面上,依次点击"BlueField"、"BF-FW-Bundle"、"BFB",以获取推荐的DOCA资源包。
2025-06-13 10:14:13
366
原创 2025年NVIDIA AI Open Day
2025年5月30日,新一期NVIDIA AI Open Day在北京举办,在这次活动上,NVIDIA 加速计算专家团队(DevTech)深度剖析了大语言模型最新技术进展,尤其是针对 DeepSeek 等主流模型的优化加速方案,深入分享了如何借助 NVIDIA 计算平台提升模型训练与推理效率。同时还有生成式推荐系统,CUDA开发深入解析,高级辅助驾驶和具身智能等技术内容,请点击以下链接,观看回放,温故知新,共同进步。
2025-06-13 09:58:02
224
原创 使用 NVIDIA Triton 和 TensorRT-LLM 部署 TTS 应用的最佳实践
当前主流的 TTS 大模型大致可分为两类:非自回归扩散模型和自回归 LLM 模型。F5-TTS 是一款非自回归扩散 TTS 模型,它基于 DiT (Diffusion Transformer) 和 Flow-matching 算法,移除了传统非自回归 TTS 模型中的 Duration 模块,使模型能直接学习文本到语音特征的对齐。随着大模型时代的到来,TTS 模型的参数量和计算量持续增长,如何高效利用 GPU 部署 TTS 模型,构建低延迟、高吞吐的生产级应用,已成为开发者日益关注的焦点。
2025-06-13 09:54:23
954
原创 火山引擎:单机部署 DeepSeek-R1 的 W4A8 方案,部署成本减半
DeepSeek-R1 凭借其优秀的深度推理能力,一经推出便在 AI 市场掀起热潮。然而,DeepSeek-R1 包含 671B 的模型参数,基于 FP8 的数据精度,权重显存消耗接近 700GB,单卡 96GB 显存的 GPU 卡,也需要 16 卡进行多卡部署(2 台 ecs.hpcpni3ln.45xlarge 实例),多机推理之间的数据传输效率也面临极大挑战。如何在保证模型性能的前提下,提升部署效率、降低推理成本,成为限制 DeepSeek-R1 大模型规模化部署及应用的关键挑战。
2025-06-13 09:48:32
828
原创 NVIDIA 将为每家 AI 工厂提供网络安全
NVIDIA 和 Cisco 正在为企业提供所需的基础设施,使企业能够自信的扩展 AI 的使用,同时保护其最宝贵的数据资产。随着代理式 AI(Agentic AI)的广泛应用,在企业级规模运行的 AI 模型和自主代理,能够实现数据、应用程序和用户的无缝连接,为从数据中获取洞察带来前所未有的机遇,但同时也催生出需要与之发展速度匹配的高级防护需求。Cisco 正在与 NVIDIA 合作,打造基于 NVIDIA 架构的安全的 AI 工厂,简化企业大规模部署和保护 AI 基础设施的方式。
2025-06-13 09:41:30
615
原创 COMPUTEX 2025 | NVIDIA 推出 NVLink Fusion,助力行业用户构建半定制 AI 基础设施
MediaTek、Marvell、Alchip Technologies、Astera Labs、Synopsys 和 Cadence 是首批采用 NVLink Fusion 的厂商,可支持定制化芯片纵向扩展(Scale-up)以满足模型训练和代理式 AI 推理等要求严苛的工作负载的需求。MediaTek、Marvell、Alchip Technologies、Astera Labs、Synopsys 和 Cadence 将借助 NVIDIA NVLink 生态系统打造自定义 AI 芯片。
2025-06-13 09:39:15
147
原创 借助 NVIDIA NVLink Fusion 将半定制计算平台集成到机架级架构
NVLink Fusion 包含 NVLink 芯片,可通过相同的 NVIDIA 机架级扩展架构来纵向扩展 NVIDIA 和半定制 ASIC 的混合基础设施,并与 NVIDIA CPU、NVIDIA NVLink 交换机、NVIDIA ConnectX Ethernet SuperNIC、NVIDIA BlueField DPU 以及用于横向扩展解决方案的 NVIDIA Quantum 和 NVIDIA Spectrum-X 交换机搭配使用。AI 变革所需的基础设施不但强大,还要敏捷、可扩展且高效。
2025-06-13 09:30:39
566
原创 NVIDIA全新语音AI加速解决方案
NVIDIA凭借其强大的GPU加速技术,推出了Parakeet-TDT-0.6B-V2全新的ASR语音识别模型,打造“小巧高效”的“超级听写机”,实现语音识别的“快、准、稳”。同时结合NVIDIA Triton 和 TensorRT-LLM加速优化的TTS语音合成解决方案,真正赋能实时的语音AI应用,驱动全栈式语音AI新变革。将聚焦Parakeet模型的核心技术介绍与TTS加速解决方案的实战应用分享,帮助您深入了解如何利用NVIDIA技术实现语音AI的高效开发与优化部署。自回归 TTS 部署加速。
2025-06-09 11:40:44
331
原创 NVIDIA 培训 | NVIDIA Earth-2 限时免费中文新课发布,掌握 AI 天气建模全流程
天气预报在公共和私营领域的规划与决策中不可或缺,天气会影响从供应链韧性到能源生产等方方面面。传统的数值天气预报系统操作复杂,对时间和计算资源要求极高。随着 AI 天气建模的最新进展,非专业人员如今也可以运行根据自身需求定制的预测。NVIDIA 深度学习培训中心(DLI)发布限时免费中文新课《使用 NVIDIA Earth-2 部署 AI 天气模型》,探讨先进的 AI 天气预测模型所带来的可能性,并教授如何将其集成进自定义工作流中。3 学时 | 中文 |
2025-06-06 14:22:48
911
原创 在阿里云 PAI 上一键部署和使用 NVIDIA Cosmos Reason-1 模型
阿里云 PAI 团队测试的 Cosmos Reason-1 tools 的性能表现如下:在 Qwen2.5-32B-Instruct 模型和 gsm8k 数据集 (Batch size = 2,048) 组合上进行后训练测试,相比其他开源框架,Cosmos Reason-1 tools 在小规模集群上实测有 1-2 倍的性能加速。它提供的模型后训练脚本 (SFT + RL) 将加速企业和开发者基于自有数据定制 Cosmos Reason-1 模型,从而创建专属的 physical AI 模型。
2025-05-30 11:23:36
1019
原创 第三届 NVIDIA DPU 黑客松开启报名
在整个活动期间,NVIDIA 将为您提供所需的支持和工具,帮助您学习 DOCA 软件框架的基础知识,以及了解如何使用 DOCA SDK 和工具开发 DPU 加速的云应用程序。本次竞赛期间,您将有机会与 NVIDIA 顶尖的网络技术专家直接交流,并在赛前参加线上技术训练营,在专业的培训及导师的指导下利用 NVIDIA BlueField DPU 及其硬件加速功能开发 AI 或基于网络的应用程序,将您的创新想法变为现实。团队注册完毕后,您仍可重新提交表单并指明您要修改先前的注册内容,以便修改您的申请。
2025-05-27 11:07:32
822
原创 NVIDIA 助力安利打造新一代智算中心
依托 NVIDIA AI Enterprise 企业级解决方案,安利正在构建安全、高效、可扩展的 AI 基础设施体系,全面提升算力资源调度能力与推理服务工程化水平,为 AI 在全业务场景的规模化落地提供坚实支撑。借助生成式 AI,安利正在重塑业务流程,推动企业数字化转型,驱动业务创新与价值增长。借助 NVIDIA 强大硬件性能与端到端 AI 软件生态,安利在本地快速部署大语言模型,构建覆盖全链路的 AI 应用开发与运维体系,实现 AI 能力在核心业务场景中的深度定制与规模化落地。
2025-05-27 11:01:11
806
原创 用于视频搜索和总结的 AI Blueprint 现已推出,可在各行各业部署视频分析 AI 智能体
通过 VAST InsightEngine,NHL 能够实现在亚秒级时间内对 PB (petabytes) 级视频的检索,支持对比赛精彩瞬间和高光时刻的近实时提取。AI 驱动的代理式工作流通过自动剪辑、标记和组合视频内容,进一步提高了内容创作效率,确保素材的便捷访问与高效利用。Linker Vision 的 AI 应用由 VSS 蓝图驱动,其智能体能够结合实时视频分析与生成式 AI 技术,不仅可以检测视觉元素,还能够解析并生成对洪水、交通事故等复杂城市事件的态势描述。除了视觉理解,它还支持音频转录。
2025-05-27 11:00:18
861
原创 逻辑推理 AI 智能体重构高价值决策制定路径
上获取,用户可使用它高效连接、分析和优化 AI 智能体团队,并通过完整的系统可追溯性和性能分析能力,识别效率低下的问题并进行改善。SAP 的智能体 Joule 将集成 NVIDIA Llama Nemotron 的逻辑推理功能,能够解析复杂的用户请求、深度挖掘企业数据价值、自主执行跨职能的业务流程。经实测对比,税务专用逻辑推理模型相较于通用模型,在使用逻辑推理方法时,税务问题的回复质量提高了 86%。每个组件都能增强智能体的能力,包括与外界交互能力、创建和执行详细计划的能力、以及半/完全自主行动的能力。
2025-05-27 10:57:55
778
原创 NVIDIA 实现通义千问 Qwen3 的生产级应用集成和部署
仅仅通过几行代码,开发者即可通过包括 TensorRT-LLM 在内的流行推理框架来使用最新的 Qwen 系列模型。此外,对模型推理和部署框架的技术选型需要考虑到诸多关键因素,尤其是在把 AI 模型部署到生产环境中时,对性能、资源和成本的平衡。
2025-05-06 16:18:58
1060
原创 企业使用 NVIDIA NeMo 工具快速引入 AI 成员,以提高员工生产力
要维护和优化生产环境中驱动 AI 智能体的模型,需要三类数据:用于获取洞察并适应数据模式演变的推理数据,提供智能的最新业务数据,以及验证模型与应用表现是否符合预期的用户反馈数据。已发布的 NeMo 微服务可与合作伙伴平台集成,作为创建 AI 智能体的构建模块,使用商业智能与强大的逻辑推理模型 (包括 NVIDIA Llama Nemotron) 处理更多任务。在多智能体系统中,数百个具有不同目标和工作流的专用智能体作为数字员工,协同处理复杂的任务,与员工并肩工作,实现跨职能的辅助工作并提升效率。
2025-04-28 10:16:52
1268
原创 NVIDIA AI 实践月 | 代理式 AI 落地应用,助力企业提升效率
因此,我们特别推出 NVIDIA Agentic AI 实践月系列内容,带您了解代理式 AI 在 NVIDIA 内部的各个实践,分享 NVIDIA 内部团队的解决方案和重要经验,供您参考和借鉴。然而,微调较小的模型需要高质量的标记数据,而创建这些数据既耗时又昂贵。这表明 API 目录可用于生产部署。通过这些前沿实践,NVIDIA 不断突破技术创新的边界,积极加速代理式 AI 的落地应用,为开发者和企业打造了一系列极具价值的参考范例与强大工具,助力他们在各自的专业领域中实现突破性创新,提升效率与竞争力。
2025-04-25 16:05:06
897
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人