- 博客(436)
- 收藏
- 关注
原创 RangeNet++如何重新定义3D点云解析?
RangeNet++解决了LiDAR语义分割中的核心挑战,通过三大创新实现了突破:1)采用球面投影和Darknet53编解码网络架构,避免了传统2D投影导致的信息丢失;2)首创GPU加速的最近邻搜索替代CRF,有效消除语义粘连现象;3)开发了完整的标签回溯机制,能将CNN预测结果精准映射回原始点云。该技术不仅支持19类语义识别,还能在嵌入式系统实时运行,为自动驾驶和机器人导航提供了可靠的3D环境理解方案。
2025-07-16 10:00:00
318
原创 Python Fraction类实战:生成小学分数四则运算试卷
本文探讨Python的fractions模块在小学五年级分数运算教学中的应用。针对传统浮点数处理方式存在的精度丢失问题,重点解析Fraction类精确存储分数(分子/分母形式)的特性及其多种构造方法。通过演示字符串、小数及科学计数法的分数转换技术,特别强调使用Decimal对象避免浮点误差的解决方案。文章还介绍了如何结合random模块生成随机运算题,并利用Pillow库实现试卷可视化输出,为构建精确的分数四则运算考试系统提供完整技术方案。
2025-07-15 10:00:00
476
原创 传感器大小端详解
本文介绍了计算机系统中的大小端概念,包括大端模式(高位字节存低地址)和小端模式(低位字节存低地址)的区别。文章通过0x12345678示例说明两种模式的存储方式,并列举了常见处理器架构的字节序。同时提供了通过联合体和指针转换两种判断系统大小端模式的方法,以及网络编程中常用的字节序转换函数(htonl/htons/ntohl/ntohs)。这些知识对系统开发、网络编程和理解计算机底层原理至关重要。
2025-07-14 10:00:00
386
原创 Buildroot实战指南:从零构建IMX6ULL嵌入式根文件系统
本文介绍了使用Buildroot构建嵌入式根文件系统的优势及方法。相比busybox,Buildroot集成了常见第三方库和软件,简化了移植过程。文章详细解析了Buildroot的目录结构、执行流程和编译机制,包括如何通过menuconfig配置选项、包下载编译过程以及映像文件制作。并以IMX6ULL平台为例,演示了从下载源码、配置选项到最终生成映像文件的具体操作步骤,同时指出了配置过程中可能遇到的错误及解决方法。
2025-07-13 10:00:00
304
原创 机器人长周期任务规划:STEP技术如何解决“思维断层“和“注意力涣散“难题
针对机器人在执行长周期任务时面临的"思维断层"和"注意力涣散"两大痛点,研究者提出STEP(SubgoalTreeEmbodiedPlanner)创新框架。该技术采用分层树状结构分解任务,通过双模型协作机制实现:1)子目标分解模型递归拆解抽象指令为可执行动作;2)终止模型判断分解粒度是否达标。
2025-07-12 10:00:00
623
原创 【广告算法】【基础】【0】广告算法作用和流程
本文系统介绍了广告算法的学习路径与实际应用价值。在信息爆炸时代,推荐系统扮演着三重角色:对平台是流量分配引擎,对用户是个性化助手,对商家则是曝光利器。其核心技术流程分为召回层(快速初筛)、粗排层(初步过滤)和精排层(精准排序)三大模块,核心思路是通过用户/物品向量化实现高效匹配。专栏将聚焦FM、双塔模型等普适性方法,以论文解读方式深入剖析推荐算法的底层逻辑,帮助读者构建从理论到实践的完整知识体系。
2025-07-11 10:00:00
868
原创 从零搭建UBUS环境:OpenWrt进程间通信框架实战指南
本文介绍了在OpenWrt系统中搭建UBUS进程间通信框架环境的完整流程。首先概述了UBUS的核心组件(ubusd守护进程、libubus库、命令行工具及多语言支持),然后详细说明了安装步骤:包括JSON库、Lua语言环境、UBOX基础库以及UBUS本体的安装方法,并强调每个步骤都需要验证安装是否成功。文章为开发者提供了从零开始配置UBUS环境的实用指南,适用于机器人等嵌入式系统的开发场景。
2025-07-10 10:00:00
206
原创 PID控制及整定算法
PID控制算法通过比例、积分、微分三个环节实现精确控制。比例控制快速响应误差但存在稳态误差,积分控制消除稳态误差但响应滞后,微分控制预测误差趋势改善动态性能。三者结合形成PI或PID控制器,既保证响应速度又提高控制精度。参数整定是PID控制的核心,需平衡各环节强度:比例系数过大会导致振荡,积分时间影响误差消除速度,微分时间决定超前调节效果。采样周期选择也至关重要,需兼顾精度和计算效率。PID广泛应用于模拟和数字控制系统,通过负反馈实现稳定调节。
2025-07-09 10:00:00
988
原创 PID参数自整定终极指南:基于继电反馈的智能调节算法详解
本文探讨了基于继电反馈的PID参数自整定算法。该算法通过设置整定模式和调节模式,在整定时利用继电器开关使系统产生周期性振荡,从而获取系统特征参数(临界增益Kc和振荡周期Tc),进而自动计算PID参数。文章详细介绍了描述函数法用于分析振荡波形特性的原理,以及如何从理想继电环节推导系统参数。这种自整定方法避免了人工调参的专业性要求,为PID控制器设计提供了自动化解决方案。
2025-07-08 10:00:00
235
原创 具身智能机器人学习路线全解析
《具身智能机器人学习路线全解析》系统介绍了这一融合多学科的前沿技术领域。学习路径包含:1)数学物理基础(线性代数、力学等);2)机器人学核心(机械结构、运动控制);3)人工智能技术(机器学习、计算机视觉)。文章通过波士顿动力Atlas等案例,展示了高动态平衡、复杂运动等关键技术实现。该路线为学习者提供了从理论到实践的完整框架,涵盖编程、算法及硬件设计等关键技能。
2025-07-07 10:00:00
565
原创 深入解析ARM Cortex-M处理器:状态、模式与栈寄存器全攻略
本文详细解析了ARM Cortex-M3/M4处理器的状态、模式与栈寄存器机制。处理器仅支持Thumb状态,分为线程模式和处理模式两种运行状态,具有特权和非特权两种访问等级。重点介绍了栈寄存器SP的双实体结构(MSP和PSP)及其在不同模式下的使用规则,CONTROL寄存器的配置方法,以及通过EXC_RETURN实现模式转换的机制。文章还阐述了访问等级(Ring0-Ring3)的分层保护原理及其在系统安全性中的作用,为理解处理器权限管理和异常处理机制提供了全面指导。
2025-07-06 10:00:00
1029
原创 每日前沿技术分享——特权动作让机器人轻松掌握复杂长程操作任务
本文介绍了一种利用特权动作(PrivilegedAction)提升机器人强化学习效果的新方法。针对长期、接触丰富的操作任务,传统强化学习面临探索困难、容易陷入局部最优等问题。研究人员提出在模拟环境中使用物理上不可行但能增强探索的特权动作(如禁用碰撞、应用虚拟力),并结合课程学习逐步过渡到真实环境约束。该方法避免了依赖人工演示或精心设计的奖励函数,使机器人能更高效地自主学习复杂操作技能。实验表明,特权动作机制显著提升了机器人在长期任务中的表现。
2025-07-05 10:00:00
637
原创 机器人锂电池技术科普梳理
智能AGV机器人锂电池技术发展现状与趋势 摘要:随着智能搬运机器人广泛应用,锂电池技术成为关键因素。目前主流电池类型包括三元锂电池和磷酸铁锂电池,后者因安全性高、寿命长等优势市场份额持续增长(2024年达50.3%)。智能AGV机器人普遍采用48V电压,80Ah容量的锂电池配置。技术发展呈现三大特点:磷酸铁锂电池逐步替代三元锂电池,软包电池等新型封装工艺兴起,以及针对不同作业场景的定制化电池解决方案需求增加。未来锂电池技术将向更高能量密度、更强环境适应性和更长循环寿命方向发展。
2025-07-04 10:00:00
248
原创 RLHF常见问题
RLHF(基于人类反馈的强化学习)是AI领域的重要技术,通过将人类偏好融入模型训练提升语言模型性能。其流程包括预训练、奖励建模(训练RM模型量化人类偏好)和强化学习优化(使用PPO算法)。RM模型通常固定但可更新,价值模型(VM)则预测长期收益并辅助信用分配。折扣因子(γ=0.9或0.99)平衡即时与远期奖励,优势函数优化模型行为。该技术有效解决多目标优化问题,使生成内容更符合人类价值观。
2025-07-03 10:00:00
1542
原创 每日前沿技术分享:VISK框架可以让机器人轻松完成插拔、刷卡等精细操作
研究人员提出VISK框架,利用AnySkin磁性触觉传感器和基于Transformer的策略学习架构,使机器人能够完成插拔插头、刷信用卡等精细操作。该框架包含视觉编码器、触觉编码器和观察主干三部分,通过融合多模态感知信息,解决了传统光学触觉传感器高维数据处理复杂的问题。实验表明,VISK框架在低维触觉数据支持下,显著提升了机器人执行精确接触式操作的能力。
2025-07-02 10:00:00
1027
原创 【数据分析】如何在PyCharm中高效配置和使用SQL
PyCharm 作为 Python 开发者的首选 IDE,其 Professional 版本提供了强大的数据库集成功能,让开发者无需切换工具即可完成数据库操作。如果你使用的数据库没有列出(例如 MaxCompute),你可以选择 Generic SQL,这是一个通用的 SQL 方言,支持许多标准的 SQL 语法。PyCharm 的数据库工具窗口允许你连接到不同的数据库,并直接在 IDE 中运行 SQL 查询。在 SQL 方言设置页面,选择适合你使用的数据库的 SQL 方言。从弹出的菜单中,选择数据库类型。
2025-07-01 10:00:00
287
原创 清华大学UniDetector:突破传统限制,打造零样本泛化的通用物体检测器
新类别区分能力:即使有了足够的训练数据,当遇到从未见过的新类别时,模型仍然容易产生偏差,倾向于预测那些出现在训练集中频率较高的类别。平衡已知与未知类别之间的关系:在一个开放的世界里,既存在大量已知的常见物体,也有许多未曾见过或罕见的新类别。如何让模型在这两者之间找到恰当的平衡点,既不会忽视稀有类别,又不会过度关注常见的部分,是另一个重要的考量因素。
2025-06-30 10:00:00
533
原创 从TCP/UDP实验到AT命令解析与后台线程设计(上)
对于WIFI模块,使用“AT_Device”结构体表示它,这个结构体里有一个“AT_Socket”结构体数组,每个“AT_Socket”里都有一个队列“recv_queue”(用来保存WIFI模块接收到的网络数据)。用户APP要使用网络时,先从“AT_Socket”数组里分配得到空闲的数组项,以后会使用这个结构体保存数据传输过程中的信息,比如WIFI模块里使用到的硬件socket号、本地ip/port、远端ip/port。当线程要接收网络数据时,它们只需要读取对应的“AT_Socket”结构体里的队列。
2025-06-28 10:00:00
395
原创 人形机器人还值得涌入嘛?
数据显示,人形机器人所涉及的技术、硬件及智能算法研发正迎来前所未有的投资热潮,相关融资数据和市场反馈也印证了这一现状。目前,核心部件的研发占据了整个产业链中75%以上的成本,但随着规模化生产和工艺优化的推进,中下游环节的附加值有望大幅提升。各家企业正在谋求突破能效、精细操控以及多模态感知与决策等关键瓶颈,以便在未来的实际应用中实现更为高效的整体协作和任务执行。整合派:如Figure AI和Sanctuary AI,致力于同时突破硬件和软件,追求系统层面的深度融合与协同优化。中游:机器人整体的研发与制造。
2025-06-27 10:00:00
359
原创 一文教会你如何在KITTI数据集进行轨迹评估
在众多公开数据集中,KITTI数据集无疑是最权威、应用最广泛的评测平台之一。 本篇文章将手把手带你走进KITTI轨迹评估的完整流程
2025-06-26 10:00:00
633
原创 深入解析Linux进程通信:管道、信号与IPC机制全攻略
创建这个文件节点,不可以通过open 函数,open 函数只能创建普通文件,不能创建特殊文件(管道-mkdifo,套接字-socket,字符设备文件-mknod,块设备文件-mknod,符号链接文件-ln –s,目录文件mkdir)所谓的有名,即文件系统中存在这个一样文件节点,每一个文件节点都有一个inode号而且这是一个特殊的文件类型:p管道类型。在文件IO中创建一个文件或打开一个文件是由open函数来实现的,它不能创建管道文件。
2025-06-25 10:00:00
1216
原创 从零打造STM32智能桌面机器狗
博主根据教程重新设计了一个性能稳定,语音识别与语音输出,OLED人机交互,可充放电的四足式桌面机器人,采用嘉立创EDA设计了原理图以及对应的PCB文件。将语音模块、OLED显示屏模块、SG90舵机模块、蓝牙模块集成到一块电路板上,采用异步全双工串口通信的方式与蓝牙模块进行数据交互,然后通过IIC通信与0.96寸OLED显示屏进行通信,采用锂电池为单片机和其他的模块提供稳定的电源。
2025-06-24 10:00:00
406
原创 LoHoVLA技术:让机器人像人类一样思考与行动的统一框架
欢迎来到每日前沿技术分享专栏。我们今天要来给大家分享的是LoHoVLA模型。—— 捡起垃圾、整理物品、擦拭桌面等,而不是一个简单的单一动作。。这篇工作不仅提出了创新的模型架构,还构建了专门的数据集 LoHoSet,通过实验证明了统一框架在长期任务中的显著优势。让我们一起深入探讨,LoHoVLA 如何让机器人像人类一样,既有全局规划能力,又能精准执行每一个动作。
2025-06-23 15:38:43
601
原创 从傅立叶变换到 FAST---具身智能加速神器
本文探讨了具身智能中的动作压缩方法,重点介绍FAST技术。针对高频率机器人控制任务(如20-50Hz)中传统方法(如RT-2)存在的Token消耗大、控制延迟问题,提出基于DCT(离散余弦变换)的解决方案。FAST流程包含数据归一化、DCT变换、系数量化和矩阵稀疏化四个步骤,将原始动作矩阵高效压缩为离散Token序列。相比傅立叶变换,DCT更适用于实数域控制信号,能显著减少Token数量,提升控制效率。该方法为具身智能系统提供了更高效的行动表示方案。
2025-06-22 10:00:00
251
原创 带你手搓ROS应用之如何优化大规模系统中的通信效率
本文将探讨ROS2在大规模系统中通信优化的方法,具体包括通过调整DDS QoS(Quality of Service)策略、负载均衡、数据压缩等方法,结合实际的代码示例进行演示,并辅以必要的数学公式来说明这些优化策略的效果。
2025-06-21 10:00:00
812
原创 动手学AI 第一部分第一节——从数据准备到模型训练的完整流程解析
本文是AI深度学习原创教程的开篇之作,系统地介绍了训练模型的完整流程。教程将分为CV、NLP、具身智能等模块展开,首节重点讲解基础核心知识。内容包括:1)数据准备阶段的数据收集、清洗和增强技术;2)模型结构选择与搭建方法;3)关键超参数(学习率、批量大小等)的设置原则;4)训练优化过程及Adam等优化器的应用。通过ResNet50微调等实例,文章以计算机视觉为例,详细解析了从数据预处理到模型训练的全链路关键技术,为后续深度学习专题奠定基础。
2025-06-20 10:00:00
890
原创 3D激光SLAM仿真实战(一)
本文介绍了在Gazebo仿真环境下搭建3D激光SLAM系统的过程。基于Ubuntu 20.04和ROS Noetic,通过Gazebo构建仿真环境并保存为.world文件。重点讲解了如何安装velodyne激光雷达模拟功能包,将其集成到阿克曼小车模型上,包括修改URDF文件中的雷达位置参数。同时说明了在launch文件中加载地图、模型和仿真参数的配置方法,涉及车辆姿态设置、世界文件引入和机器人状态发布等内容。最终实现了搭载3D激光雷达、IMU和相机的小车模型,为后续点云地图构建和定位功能奠定了基础。
2025-06-19 10:00:00
796
原创 带你手搓ROS应用之如何实现硬实时性与低延迟通信
本文探讨了在ROS2中实现硬实时性与低延迟通信的技术方案。通过采用支持实时调度的操作系统(RTOS或Linux PREEMPT-RT)、配置DDS的QoS策略(包括reliability、history等参数)、优化消息传输机制以及设置任务优先级调度,可以有效提升ROS2系统的实时性能。文章详细阐述了系统部署流程,包括操作系统选择、ROS2版本要求、DDS中间件配置等关键环节,并提供了代码示例。这些方法特别适用于机器人控制、自动驾驶等对实时性要求严格的场景,为开发人员提供了实现硬实时通信的实践指导。
2025-06-18 10:00:00
612
原创 上海AI实验室Point Track项目代码实战:从代码配置到核心模型架构全攻略
本文详细介绍了PointTrack项目的代码配置与运行流程。首先说明了环境配置步骤,包括克隆代码库、创建conda环境和安装依赖包。接着阐述了数据处理流程,包括数据集下载和预处理方法,并提供了CoTracker模块的离线使用方案。文章详细讲解了模型训练的两个阶段:TrackTransformer预训练和下游策略学习,同时对比了传统行为克隆(BC)的训练方式。
2025-06-17 10:00:00
708
原创 A-LOAM 代码解析:LaserMapping 节点(1)— 初始化与数据流
LOAM的核心特点就是将帧帧匹配和地图构建解耦,这在保证效率的同时,提升了精度,之前里程计节点介绍完了,接下来我们来介绍建图节点,建图节点一方面是用来建图的,另一方面就是用来帮助我们消除里程计节点的累积误差的,因为我们里程计节点的帧帧位姿估计,肯定是有误差的,而且频率又那么高,不作处理,结果会很差。
2025-06-16 10:00:00
1596
原创 带你手搓ROS应用之如何在ROS2处理灾难性恢复问题
在机器人系统中,灾难性恢复(Disaster Recovery,DR)指的是在发生系统故障、网络中断、硬件损坏或其他突发事件时,系统能够快速恢复并继续运行。ROS2作为一个高度可靠的机器人操作系统,提供了多种工具和机制来确保机器人系统的容错性和恢复能力。然而,当系统发生重大故障时,如何设计有效的灾难性恢复方案,确保系统在失效后能够快速恢复,并减少服务中断时间,是一个重要的研究课题。本文将讨论如何在ROS2中实现灾难性恢复,介绍基本概念、灾难性恢复的算法流程、实现步骤、部署环境、代码示例和运行效果。
2025-06-15 10:00:00
981
原创 【LoRA】怎么指定LoRAConfig的target_modules
近期由于需要训练Qwen3 A3B 30B MoE模型,然而尝试过7张卡,在100step的时候爆显存了,而8张卡消耗太大,因此寻求一种能够减少显存的方法,经过查询可知,可以通过4bit的方式进行训练,也可以通过指定LoraConfig中的target_modules进行训练,而MoE中最重要的可动的地方就是router,因此查看能不能使用target_modules直接指定router进行训练,而不需要进入源码进行手动冻结,而目前很多框架都支持指定。
2025-06-14 10:00:00
774
原创 STM32 PID控制全解析:从原理到调参实战指南
本文围绕STM32中的PID控制展开。介绍了PID的比例、积分、微分三部分作用,以及积分限幅和输出值限幅。阐述了位置式、增量式和串级PID的原理与代码。还讲述了Kp、Ki、Kd调参要点,并介绍了野火多功能调试助手的调参方法及通信代码。
2025-06-13 10:00:00
632
1
原创 Cursor Agent---如何更好地掌控AI编程助手
Cursor是一款受到开发者欢迎的AI编程助手,今天我们来分析它的系统提示词,以便更好地理解它的工作原理,提高使用效率。
2025-06-12 10:00:00
1927
原创 从零理解PID控制:小球仿真到代码实现,手把手教你掌握工业级控制算法
很多人应该都听说过PID,它的运算过程简单,并能在大多情况下实现较好的控制效果,因此它是工程实践中使用最广泛的控制方法之一。抛开公式,我将带你从案例出发,详细了解PID的工作原理和使用方法。注:阅读本文不需要有过多的基础知识,只需中学物理和数学知识就能看懂(当然如果有高等数学知识和单片机知识的话理解起来会更容易)我们假设有一个一维的坐标轴(向右为正方向),在上面上有一个小球(可以看作质点),小球不受任何阻力,可以自由左右滑动;
2025-06-11 10:00:00
1663
原创 具身智能从DRL-robot-navigation学起
在这个数字化和智能化日益加速的时代,机器人技术正在逐渐改变我们的生活方式。是一个非常不错的入门开源项目,它利用深度强化学习(Deep Reinforcement Learning, DRL)让机器人实现自主导航,通过模拟环境训练机器人,使其能够学习如何在复杂环境中有效地移动,避开障碍物并达到目标位置。其核心技术是基于TensorFlow实现的深度Q网络(Deep Q-Network, DQN),这是一种被广泛应用于强化学习的神经网络模型。
2025-06-10 10:00:00
603
原创 基于人工智能的闸机人脸识别门禁系统
Dlib的核心架构融合了图像计算和深度学习的精髓,凭借高效的算法和灵活的模块化设计,在视觉分析任务中展现出了非常优秀的性能,尤其是在精准识别人脸和面部特征方面。Haar图像特征最初是通过对矩形区域进行分析来开发的,它通过计算不同区域之间的灰度对比,能够捕捉到描述物体形态的关键信息。在人脸识别任务中,Haar特征的一个突出特点就是它能够有效抓取面部的关键结构,比如眼睛、鼻子、嘴巴等位置的亮度差异。具体来说,它是通过计算白色矩形区域和黑色矩形区域的像素总和的差值,来表示图像在这些区域内的灰度差异。
2025-06-09 10:00:00
1441
原创 相机雷达外参标定算法调研
相机与激光雷达的外参标定是自动驾驶、机器人等领域的基础工作。精准的标定不仅有助于提高数据融合的效果,还能提升算法的整体性能。随着技术的发展,许多研究者和公司致力于开发高效的标定工具和算法,本文将对无目标标定和有目标标定两种主要的标定方法进行调研。
2025-06-08 10:00:00
604
原创 【MoE】【Qwen3】【1】彻底搞懂Qwen3底层源码
前面我们详细讲解了deepseek MoE的具体代码实现细节,同时指出了Deepseek MoE存在的缺陷和不足。而Qwen3 MoE作为近期的重大新闻,本文也讲解一下Qwen3的具体实现,顺便探讨该模型与DeepSeekMoE模型的区别。本文将讲解Qwen3的核心模块即Qwen3MoeSparseMoeBlock类的代码实现和形状推理。
2025-06-07 10:00:00
1327
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人