10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

如何在浏览器内构建一个具身智能平台|QCon 上海

  • 2025-09-01
    北京
  • 本文字数:2107 字

    阅读完需:约 7 分钟

大小:1.10M时长:06:24
如何在浏览器内构建一个具身智能平台|QCon 上海

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon 全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


BamBot 作者 Tim Qian 已确认出席并发表题为如何在浏览器内构建一个具身智能平台的主题分享。近年来,AI 技术的爆发为机器人真正走进千家万户铺平了道路。我们可以看到,各类新型机器人以及具身智能模型和应用正如雨后春笋般涌现,机器人的能力越来越强、应用场景也越来越丰富。然而,随之而来的一个现实问题却愈发凸显:不同品牌、不同类型的机器人往往采用各自不同的控制方式,而各类 AI 模型的接入、使用方法和适用场景也存在显著差异。


对于普通用户来说,真正想让机器人为自己高效工作,依然面临着较高的技术门槛。要打破这一壁垒,核心在于通过技术手段实现标准化和抽象化。比如,构建统一的控制接口、适配多种模型的通用框架,降低机器人和 AI 技术的使用门槛,让用户无需关心底层技术细节,就能便捷地调动和管理各类智能硬件和应用,真正释放具身智能的价值。本次演讲将聚焦于如何基于浏览器构建一个面向多种机器人和 AI 模型的通用控制平台,分享其中的技术架构设计思路、关键挑战与实践经验。


Tim Qian,开源项目 BamBot 作者,其原创项目累计在 GitHub 上获得了 3w+ Star,广受开发者社区的认可。他不仅是 BamBot 的创造者,还开发了 Star-history 这一工具,该工具已被 Lerobot、Vue.js 等众多知名开源项目广泛采用。此外,他还创作了 Chat.xkcd,这是一套极具创意的卡通风格图标库。目前,他正专注于 bambot.org,致力于打造一个在浏览器中运行的机器人平台,为开发者提供更加便捷和创新的开发体验。他在本次会议的详细演讲内容如下:


演讲提纲

1. 机器人落地过程中的实际技术痛点

  • 尽管机器人硬件和 AI 模型发展迅速,但端到端交付仍存在明显障碍

  • 普通用户上手难度大,技术人员在实际部署时也面临以下挑战:

    控制逻辑分散,强依赖代码能力,缺少统一入口

    机器人品类多样,协议、接口不统一,适配成本高

    控制链条复杂,涉及硬件、通信、界面多层,系统集成难度大

2. 为什么技术方案选在浏览器端

  • 浏览器天然跨平台,避免了多端适配的重复工作

  • 前端技术栈成熟,3D 渲染、实时通信、界面交互能力强

  • 配合 WebAssembly、WebRTC、WebGPU 等技术,浏览器的能力边界大幅提升

  • 可以在无需安装、即时访问的前提下,完成从仿真到控制的完整链路

3. 浏览器中的可视化与物理仿真技术挑战

  • 高性能 3D 渲染:如何在浏览器内流畅展示机器人状态与环境

  • 物理仿真同步:真实物理引擎的接入与前端渲染的一致性问题

  • 数据交互:高频数据下的前后端通信优化

  • 性能瓶颈与资源管理:浏览器环境下如何避免性能坍塌

4. 控制系统的扩展性设计

  • 设计目标:控制通道抽象、输入方式可插拔、模型驱动灵活接入

  • 实现方式:

    控制输入统一封装,支持键盘、手柄、Web UI、AI 模型等多种输入源

    模型层与控制层解耦,支持不同智能模型快速切换

    统一协议设计,便于新硬件、新控制方式的接入

5. 多机器人适配方案

  • 通过标准化控制接口屏蔽底层差异

  • 基于能力描述和协议映射的适配层设计

  • 结合仿真与真实硬件,形成开发、测试、部署的一体化闭环

  • 最终目标:让技术人员专注于控制逻辑和应用开发,底层适配、协议转换透明化


您认为,这样的技术在实践过程中有哪些痛点?

  • 性能瓶颈:浏览器虽然能力越来越强,但相比原生应用,性能仍有限制

  • 浏览器环境下的硬件访问受限

  • 前后端同步的复杂性 - 机器人控制涉及状态同步、仿真与真实硬件对齐、AI 模型推理结果接入

  • 高频控制指令与状态反馈之间的网络延迟不可忽视,尤其跨网络部署时


演讲亮点

  • 从用户需求反推技术架构,如何设计一个既符合直觉、易上手,又具备强大扩展性的具身智能平台

  • Web Serial 协议在机器人控制链中的应用实践,打通浏览器与真实硬件的关键技术路径

  • 浏览器内多输入控制与 AI 驱动控制的融合设计,如何在一个统一平台下无缝切换传统控制与智能控制


听众收益

  • 系统了解具身智能平台的架构思路、技术选型与发展趋势

  • 获得面向实际落地的平台设计与多设备接入的工程经验

  • 理解浏览器在机器人控制中的优势与技术边界,拓展具身智能开发思路


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可享受 9 折优惠,单张门票立省 680 元,,详情可联系票务经理 18514549229 咨询。



2025-09-01 14:001

评论

发布
暂无评论

软件测试 | App控件交互

测吧(北京)科技有限公司

测试

行业分析| 智能无人自助设备

anyRTC开发者

人工智能 音视频 智能无人自助设备 自动售货机 无人超市

软件测试 | 显示等待机制

测吧(北京)科技有限公司

测试

软件测试 | Appium架构介绍与环境配置

测吧(北京)科技有限公司

测试

软件测试 | App控件定位

测吧(北京)科技有限公司

测试

中国人寿业务稳定性保障:“1+1+N” 落地生产全链路压测

TakinTalks稳定性社区

软件测试 | Capability使用进阶

测吧(北京)科技有限公司

测试

一卡通|多云流量监控支撑To C+To B,双向高效运维

智维数据

大数据 数据可视化 智能运维 运维安全

软件测试 | 控制特殊Toast识别

测吧(北京)科技有限公司

测试

软件测试 | 参数化测试用例的使用

测吧(北京)科技有限公司

测试

机器学习洞察 | 一文带你“讲透” JAX

亚马逊云科技 (Amazon Web Services)

ChatGPT 最好的替代品

图灵社区

机器学习 Transformer BERT ChatGPT

袋鼠云产品功能更新报告04期丨2023年首次,产品升级“狂飙”

袋鼠云数栈

3dmax的常用功能和使用方法

Finovy Cloud

3D渲染 3DMAX

软件测试 | 录制Appium测试用例

测吧(北京)科技有限公司

测试

应用交付可视化助力金融科技企业应用服务质量及效率提升

智维数据

数据可视化 智能运维 应用交付 流量分析系统

谈JVM参数GC线程数ParallelGCThreads合理性设置

京东科技开发者

线程 JVM cpu GC线程 ParallelGCThreads

软件测试 | 触屏操作测试自动化

测吧(北京)科技有限公司

测试

软件测试 | 高级定位技巧

测吧(北京)科技有限公司

测试

ChatGPT 最好的替代品

图灵教育

机器学习 BERT ChatGPT

软件测试 | App常见Bug解析

测吧(北京)科技有限公司

测试

应用交付可视化助力互联网行业提升办公网效率与满意度

智维数据

数据可视化 智能运维 应用交付 运维安全 流量分析系统

怎么编写接口测试用例?

Liam

测试用例 如何编写测试 测试用例设计

实现“无感知”的网络运维,新华社融媒体流量分析平台的创新之路

智维数据

大数据 防火墙 数据可视化 智能运维 运维安全

软件测试 | 元素定位方式与隐式等待

测吧(北京)科技有限公司

测试

4道数学题,求解极狐GitLab CI 流水线|第2&3题:父子流水线 + 多项目流水线

极狐GitLab

ci DevOps pipeline 极狐GitLab 流水线

分享7个刺激的老司机网站,别轻易点开

引迈信息

程序员 面试 前端 摸鱼

软件测试 | 属性获取与断言

测吧(北京)科技有限公司

测试

Tapdata Connector 实用指南:数据入仓场景之数据实时同步到 BigQuery

tapdata

可靠、安全、稳定,开源高质量项目 | 亚马逊的开源文化

亚马逊云科技 (Amazon Web Services)

软件测试 | adb命令的组成

测吧(北京)科技有限公司

测试

如何在浏览器内构建一个具身智能平台|QCon 上海_软件工程_QCon全球软件开发大会_InfoQ精选文章