- 博客(543)
- 收藏
- 关注
原创 云上AI推理平台全掌握 (4):大模型分发加速
为应对大模型服务突发流量场景,阿里云人工智能平台 PAI 推理服务 PAI-EAS 提供本地目录内存缓存(Memory Cache)的大模型分发加速功能,有效解决大量请求接入情况下的推理延迟。PAI-EAS 大模型分发加速功能,零代码即可轻松完成配置。
2025-07-18 16:36:34
490
原创 【ICML2025】大模型训练性能4倍提升!阿里云PAI团队研究成果ChunkFlow中选
近日,阿里云 PAI 团队、通义实验室与中国科学院大学前沿交叉科学学院合作在机器学习顶级会议 ICML 2025 上发表题为 Efficient Long Context Fine-tuning with Chunk Flow 的论文。
2025-07-17 15:55:24
596
原创 Post-Training on PAI (4):模型微调SFT、DPO、GRPO
阿里云人工智能平台 PAI 提供了完整的模型微调产品能力,支持 监督微调(SFT)、偏好对齐(DPO)、强化学习微调(GRPO) 等业界常用模型微调训练方式。根据客户需求及代码能力层级,分别提供了 PAI-Model Gallery 一键微调、PAI-DSW Notebook 编程微调、PAI-DLC 容器化任务微调的全套产品功能。
2025-07-17 10:29:30
619
原创 跨国数仓迁移背后的统一存储格式创新-Append Delta Table
本文将从底层存储格式差异与重构的技术角度,深入解析GoTerra在历时9个月的复杂迁移过程中,MaxCompute在底层存储格式上做出的一系列技术演进与创新改造。
2025-07-16 10:28:27
1010
原创 阿里云 EMR Serverless Spark:面向 Data+AI 的高性能 Lakehouse 产品
EMR Serverless Spark 是一款面向 Data+AI 的高性能 Lakehouse 产品。它为企业提供了一站式的数据平台服务,包括任务开发、调试、调度和运维等,极大地简化了数据处理和模型训练的全流程。
2025-07-15 16:52:26
716
原创 NL2SQL 再创佳绩!阿里云论文中选 SIGMOD 2025
当地时间6月22-27日,顶级国际会议SIGMOD 2025 在德国柏林正式召开。在本次会议中,阿里云带来主题演讲分享“随心搜索:阿里云AI搜索算法趋势”,与全球顶尖专家们共同交流阿里云AI搜索的演变、技术支撑和未来演变。
2025-07-15 11:38:05
627
原创 云上AI推理平台全掌握 (3):服务接入与全球调度
阿里云人工智能平台 PAI 平台推出的全球化的服务接入矩阵,为 LLM 服务量身打造了专业且灵活的服务接入方案,正重新定义 AI 服务的高可用接入标准——从单地域 VPC 安全隔离到跨洲际毫秒级调度,让客户的推理服务在任何网络环境下都能实现「接入即最优」。
2025-07-14 18:21:01
924
原创 如何在 Elasticsearch 中构建你的智能 AI 助手?
本文将带你探索一种全新的思路:如何基于 Elasticsearch 快速构建一个具备自然语言理解能力、异常检测和安全威胁识别能力的智能运维 AI 助手 。
2025-07-14 13:44:42
649
原创 基于MaxCompute MaxFrame 汽车自动驾驶数据预处理最佳实践
在汽车自动驾驶数据处理场景中,MaxCompute 主要完成对车端采集的大量 bag 包进行解压、处理等工作,基于 MaxCompute MaxFrame 高效、稳定的完成端到端数据处理流程。该方案具有一站式开发环境管理、海量弹性计算资源灵活调度、高效的分布式处理性能、统一的元数据管理的核心优势。
2025-07-14 10:45:33
630
原创 Post-Training on PAI (3): 自研高性能强化学习框架PAI-ChatLearn
人工智能平台 PAI 推出了高性能一体化强化学习框架 PAI-Chatlearn,从框架层面解决强化学习在计算性能和易用性方面的挑战。
2025-07-11 17:53:08
593
原创 数据 + 模型 驱动 AI Native 应用发展
随着AI技术从生成式AI(GenAI)向自主代理AI(AgenticAI)演进,企业面临构建数据与模型深度融合的AINative应用的新机遇。
2025-07-10 17:39:32
613
原创 Flink Forward Asia 2025 主旨演讲精彩回顾
FlinkForwardAsia2025大会在新加坡召开,聚焦实时数据与AI的融合。
2025-07-09 13:51:34
778
原创 10倍处理效率提升!阿里云大数据AI平台发布智能驾驶数据预处理解决方案
阿里云推出智能驾驶数据预处理解决方案,通过PAI、MaxCompute等技术栈实现流批一体处理,数据包处理效率提升10倍,推理任务提速1倍。该方案支持百万级任务调度,已应用于80%以上中国车企,成功解决传统方案在效率、扩展性等方面的问题。典型案例显示,某车企实现5万clips/天的处理能力,效率提升2-3倍。方案基于DataWorks、MaxCompute等核心产品构建,提供高性能全链路AI工程化平台。
2025-07-08 16:35:38
931
原创 Post-Training on PAI (2):Ray on PAI,云上一键提交强化学习
PAI 全新推出任务类型 Ray on PAI,模型训练服务 PAI-DLC 已集成 Ray,用户可将 Ray 框架的训练脚本直接提交至 PAI-DLC 进行训练,免部署免运维。整体训练过程一键提交实现上手 0 成本,还可享受 PAI 平台高效调度、自愈及企业级管理能力 。
2025-07-07 18:19:00
794
原创 AI搜索 MCP最佳实践
MCP核心优势:标准化协议:打破工具与模型壁垒,跨平台无缝调用; 降低复杂度:解耦工具开发与模型调用,告别硬编码模式。加速AI落地;全生命周期服务,快速集成工具链,提升效率。
2025-07-04 16:13:48
896
原创 [云上玩转Qwen3系列之四]PAI-LangStudio x AI搜索开放平台 x ElasticSearch: 构建AI Search RAG全栈应用
本文介绍如何利用PAI-LangStudio和Qwen3构建基于xElasticSearch的AISearchRAG智能检索应用。通过混合检索技术(全文+向量)与Qwen3模型结合,实现自然语言精准查询。主要步骤包括:创建模型服务连接、配置Elasticsearch数据库、建立知识库索引,以及部署应用流。该方案有效解决了大模型的领域局限和信息滞后问题,提升检索准确率80%,支持100+语言处理,可快速构建专业领域的智能搜索系统。开发者可基于模板进行二次开发,满足不同场景需求。
2025-07-02 19:41:00
958
原创 DistillQwen-ThoughtY:通过变长思维链蒸馏,全面提升模型推理能力!
阿里云PAI团队基于EasyDistill框架推出DistillQwen-ThoughtY系列推理模型,通过变长思维链蒸馏技术显著提升小模型推理能力。该系列采用Qwen3底座和DeepSeek-R1-0528教师模型,结合最新构建的36.5万条高质量OmniThought-0528数据集(标注认知难度和推理冗余度),在数学、代码等任务上超越前代模型。实验表明,DistillQwen-ThoughtY-32B在多项基准测试中表现优异(如AIME得分90.0)。
2025-07-01 19:55:33
1008
原创 云上AI推理平台全掌握 (1): PAI-EAS LLM服务一键压测
阿里云PAI-EAS为LLM推理服务提供专业压测方案,支持固定并发、请求速率和极限吞吐测试等多种模式。系统可自动生成TTFT、TPOT等核心指标数据,帮助用户评估服务性能。压测报告涵盖基本信息、配置、结果和监控,支持公共数据集或自定义数据测试。通过控制台即可快速创建压测任务,实时监控并获取完整报告,为AI推理服务性能优化提供全链路支持。本系列还将深入解析云上AI推理平台技术架构与行业应用,助力企业释放大模型价值。
2025-07-01 10:29:54
1088
原创 MaxCompute x 聚水潭:基于近实时数仓解决方案构建统一增全量一体化数据链路
聚水潭采用阿里云MaxCompute近实时数仓解决方案,有效解决电商ERP系统面临的增量数据处理难题。通过PKDeltaTable表格式,实现了增全量数据一体化管理,订单明细链路数据处理效率提升200%,更新周期从3小时缩短至30分钟,计算资源消耗降低56%。结合DeletionVector优化技术,核心SQL任务性能提升42%,资源消耗再降21%。该方案不仅简化了数据处理流程,还支持更长周期数据更新需求,为聚水潭88,400家客户提供更高效的数据服务,未来将进一步提升数据实时性和交互分析能力。
2025-06-30 16:29:14
1025
原创 Post-Training on PAI (1):一文览尽开源强化学习框架在PAI平台的应用
阿里云PAI-DLC平台整合主流强化学习开源框架(如Cosmos-RL、Ray、VeRL),优化大模型Post-Training阶段的性能与稳定性。Cosmos-RL通过异步异构部署实现2-3倍训练效率提升;Ray提供分布式计算支持,PAI简化其部署与故障恢复;VeRL结合PyTorch生态强化对齐训练。PAI-DLC具备万卡调度、智能容错等能力,降低开发门槛,提升算力利用率。开源框架与云平台的结合,加速强化学习在对话、决策等场景的产业落地,推动AGI发展。
2025-06-27 16:16:32
1017
原创 PAI-TurboX: 面向自动驾驶的训练推理加速框架
PAI-TurboX为自动驾驶模型训练与推理提供全栈加速方案,通过系统级优化(CPU亲和性/内存管理)、数据侧创新(高效DataLoader/智能样本分组)和模型侧改进(算子优化/设备重映射)三大维度,显著提升BEVFusion等主流模型的训练效率(最高缩短58.5%时间)。该方案有效解决了数据预处理瓶颈与多模态模型复杂度带来的性能挑战,并计划通过Remote Dataloader等新技术进一步释放GPU算力潜力。
2025-06-25 16:34:58
853
原创 【新模型速递】PAI-Model Gallery云上一键部署MiniMax-M1模型
MiniMax公司推出革命性大语言模型MiniMax-M1,采用混合专家架构和闪电注意力机制,支持百万级token上下文处理,计算效率达DeepSeekR1的4倍。该456B参数模型需8*96G显存,阿里云PAI平台已提供零代码部署方案,包含API调用和Web交互功能。PAI-ModelGallery同步接入多款热门模型,如优化版DeepSeek-R1,实现吞吐提升492%、时延降低86%的显著性能突破。
2025-06-23 14:55:03
546
原创 PAI推理重磅发布模型权重服务,大幅降低冷启动与扩容时长
阿里云PAI推出模型权重服务,大幅提升大语言模型部署效率。针对700GB+规模LLM加载耗时问题,该服务采用分布式缓存、RDMA传输、智能预取等技术,实现冷启动和扩容时间显著降低。实测显示,Qwen3-8B模型冷启动时间从235秒降至24秒(降幅89.8%),扩容时长缩至5.7秒(降幅97.6%)。该方案通过内存共享、智能分片等创新,使带宽利用率提升60%+,集群部署效率提升10倍,有效破解超大规模模型部署瓶颈。
2025-06-20 16:28:19
741
原创 DistilQwen-ThoughtX蒸馏模型在PAI-ModelGallery的训练、评测、压缩及部署实践
DistilQwen-ThoughtX 系列蒸馏模型,结合创新的变长思维链推理技术,根据任务难度自适应调整推理步骤,避免传统思维链方法的“过度思考”,大幅度提升推理场景下的模型能力。 DistilQwen-ThoughtX-32B 推理能力更是超越同尺寸 DeepSeek 官方蒸馏模型。通过 PAI-ModelGallery,可一站式零代码完成 DistilQwen-ThoughtX 系列模型的训练、评测、压缩和部署。
2025-06-13 14:17:45
604
原创 从MaxCompute到Milvus:通过DataWorks进行数据同步,实现海量数据高效相似性检索
阿里云Milvus向量检索服务与MaxCompute结合,通过DataWorks实现结构化数据高效向量化同步。该方案支持电商行为分析、医疗知识库构建等AI应用场景,提供从MaxCompute到Milvus的离线同步全流程操作指南,包括数据源配置、任务设置和结果验证。关键优势在于整合MaxCompute的大数据计算能力和Milvus的高效向量检索,解决企业智能化转型中的数据迁移挑战。
2025-06-11 18:27:09
578
原创 一体系数据平台的进化:基于阿里云 EMR Serverless Spark的持续演进
一体系汽配供应链平台因传统大数据平台瓶颈,与阿里云合作,基于 EMR Serverless Spark 构建云原生数据平台。其结合 DataWorks、StarRocks 打造 Lakehouse 架构,历经五阶段演进。迁移后技术、业务收益显著,为 AI 融合奠定数字化基础。
2025-06-10 17:55:36
1339
原创 ES Serverless 8.17王牌发布:向量检索「火力全开」,智能扩缩「秒级响应」!
阿里云 Elasticsearch Serverless 8.17 版重磅升级,带来三大核心突破: 1. 向量检索性能飞跃,原生KNN查询速度提升数十倍,内存占用降低75%,支持混合查询与智能结果融合; 2. 智能弹性调度实现秒级扩容,流量突增6倍仍能稳定响应,成功率保持95%以上; 3. 成本优化显著,采用预留+弹性CU模式,最高节省82%费用。该服务已开放华东/华北/华南多地公测,提供全托管、免运维的搜索解决方案,助力企业应对AI时代的海量数据检索需求。
2025-06-09 17:30:40
1201
原创 Fusion引擎赋能:流利说如何用阿里云Serverless Spark实现数仓计算加速
流利说基于阿里云EMR Serverless Spark构建高效数据平台,解决了原有半托管集群在弹性资源管理、成本、性能等方面的痛点。新架构采用Serverless模式实现按需计费,结合Fusion引擎使任务耗时减少40%,成本降低30%,失败率下降80%。平台整合Airflow调度、Hive元数据管理和OSS存储,支持离线ETL、数据集成和查询等场景,显著提升了任务执行效率与稳定性。
2025-05-30 16:26:44
972
原创 DistilQwen-ThoughtX:变长思维链推理模型,超越DeepSeek蒸馏模型
阿里云PAI团队提出创新思维链优化方法,通过构建包含200万标注思维链的OmniThought数据集,引入推理冗余度(RV)和认知难度(CD)评分机制,解决了大语言模型在复杂推理任务中存在的"过度思考"问题。研究表明,不同难度任务需要匹配相应长度的思维链:简单任务中长思维链会降低效率,而复杂任务则需要更详尽的推理过程。基于这一发现,团队开发了DistilQwen-ThoughtX系列模型,其性能超越同类产品,并在开源社区发布了数据集和模型权重。
2025-05-30 11:52:17
1063
原创 阿里云人工智能平台PAI开源EasyDistill框架助力大语言模型轻松瘦身
阿里云PAI推出开源工具包EasyDistill,旨在简化大型语言模型的知识蒸馏过程。该框架支持数据合成、基础与进阶蒸馏训练,包括黑盒/白盒训练策略、强化学习和偏好优化等方法。基于EasyDistill开发的DistilQwen系列模型在保持小参数量的同时性能卓越,特别是最新变长思维链推理模型DistilQwen-ThoughtX表现优异。项目还开源了包含100万指令数据和200万思维链的数据集,助力社区开发者提升模型性能。
2025-05-29 15:55:47
986
原创 火热邀测!DataWorks数据集成支持大模型AI处理
阿里云大数据开发治理平台 DataWorks 数据集成智能升级,以“ AI 释放数据价值”为核心,推出数据集成支持大模型 AI 处理功能,支持在数据同步过程中对数据进行高级分析和处理,帮助用户利用 AI 技术提升数据质量、挖掘数据价值。
2025-05-28 17:10:13
1030
原创 Cosmos on PAI系列一:PAI-Model Gallery云上一键部署NVIDIA Cosmos Reason-1
NVIDIA Cosmos 是一个世界基础模型(WFMs, world foundation models)开发平台,用于推动物理 AI 的发展,包含先进的视觉标记器、护栏以及加速视频数据处理工具管线。它专为加速智能驾驶汽车和机器人领域的合成数据生成、AI 模型训练与评估而设计。本篇文章介绍 Cosmos 最新世界基础模型 Cosmos Reason-1 如何在阿里云人工智能平台 PAI 上进行快速部署使用。
2025-05-22 17:44:33
762
原创 企业级AI搜索解决方案:阿里云AI搜索开放平台
随着信息技术的飞速发展,搜索引擎作为信息获取的重要工具,扮演着不可或缺的角色。阿里云 AI 搜索开放平台以其强大的技术支持和灵活的开放性,持续为用户提供高效的搜索解决方案。
2025-05-22 13:11:36
1031
原创 构建AI时代的大数据基础设施-MaxCompute多模态数据处理最佳实践
本方案通过 MaxCompute 提供面向多模态数据管理的表类型 Object Table,支持对 OSS 上的多模态图片数据进行元数据自动采集管理。同时,通过分布式 Python 计算框架 MaxFrame 完成对多模态数据处理开发,在 DataWorks 的 Notebook 中一站式完成多模态数据处理工作。
2025-05-20 14:49:00
905
原创 StarRocks+Paimon落地阿里日志采集:万亿级实时数据秒级查询
A+流量分析平台是阿里集团统一的全域流量数据分析平台,当前,流量采集团队每天需要的日志数据达到万亿级,在写入和查询面临着巨大挑战。在引入 StarRocks+Paimon 后,实现万亿级实时日志数据的秒级查询。Paimon负责高效存储实时日志数据,StarRocks作为计算引擎提供高性能查询能力。通过分桶表设计、Data Cache优化及文件大小控制,解决了高吞吐写入和高并发查询挑战,查询延迟稳定在秒级,大幅提升日志分析效率。
2025-05-19 13:40:36
675
1
原创 云上玩转 Qwen3 系列之三:PAI-LangStudio x Hologres构建ChatBI数据分析Agent应用
本文详细介绍了如何使用 LangStudio 和 Qwen3 构建基于 MCP 协议的 Hologres ChatBI 智能 Agent 应用。该应用通过将 Agent、MCP Server 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了 MCP+OLAP 的智能数据分析能力,使用自然语言即可实现 OLAP 数据分析的查询效果,减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足特定场景的需求。
2025-05-15 18:33:21
856
原创 开源大数据平台建设经典案例合集
EMR 作为云原生开源大数据平台,凭借其全栈技术生态、弹性资源和开箱即用的优势,已在多个行业头部企业中落地实践,覆盖云原生数据湖、实时湖仓分析、数据湖治理、机器学习等场景。本文精选多个标杆案例,解读 EMR 如何助力企业释放数据价值。
2025-05-13 17:12:53
1060
原创 阿里云 AI 搜索开放平台新增:服务开发能力
AI 搜索开放平台已提供20+原子化服务能力,可灵活组合搭建AI搜索。本期发布将重点解决用户在代码开发中的不便,通过集成 dsw 能力,新增 notebook 功能,为用户提供更便捷的代码编写、调试及运行环境,进一步提升服务调试体验。
2025-05-08 14:59:33
695
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人