- 博客(7)
- 资源 (5)
- 收藏
- 关注
原创 深入浅出强化学习算法系列
此时,可用深度神经网络作为函数逼近器,来近似强化学习中的策略函数或价值函数【也可以对环境进行建模,得到环境模型-即状态转移函数和奖励函数】,即深度强化学习。已知策略梯度PG算法,可以用梯度上升的方法来更新θ,但是,如果每次θ更新的步长过大,会导致新策略函数与当前策略函数偏离较远,进而使得策略函数性能急剧下降甚至崩溃。时序差分以贝尔曼方程作为基础,即,当前状态的价值由即时奖励和下一个状态的价值决定。智能体不需要制定显式的策略,它维护一个价值表格或价值函数,并通过这个价值表格或价值函数来选取价值最大的动作。
2025-03-08 16:10:30
495
原创 马尔可夫决策过程
强化学习,是在与环境互动过程中,为了达成一个目标而进行的学习过程。与监督学习的区别:反馈模式不同:有监督学习有反馈,无监督学习无反馈,强化学习有延迟反馈。学习目标不同:强化学习关注长期收益,监督学习关注标签或误差。学习模式不同:强化学习是学习+决策过程,具备和环境交互能力,而监督学习不具备。
2025-03-06 21:44:42
697
原创 【ubantu系统各种报错】人间悲喜是共通的,相同错误可以快速解决以节省时间
可以通过删除/var/lib/dpkg/info /下面所有的sougou开头的文件,再通过 sudo apt-get -f install后,再执行sudo dpkg -i ./xxxx可以解决掉大部分问题。
2024-01-05 11:30:45
513
1
原创 【opencv及Tansformer报错】
把_,contours, hierarchy = cv2.findContours(skin, cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)改为contours, h = cv2.findContours(skin, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)就不报错了,表示读入图片出错,检查下摄像头能否正常驱动、打开,读入图片等等,自己报错是因为,把摄像头插在usb分线上会报错,直接插在usb口上不会报错。
2024-01-05 11:16:54
1437
1
原创 【开箱即用:Yolov8-pose多类别多目标的关键点检测】内含数据转换代码、TensorRT推理代码
当前网络上的yolov8-pose推理代码基本上都是基于一个类别的代码写的,且很多代码参数都是写死的,在实际工程中遇到多类别的关键点检测项目,代码修改难度较大。因此,写一篇文章,从yolov8-pose的原理出发,记录多类别多目标的关键点检测从训练到推理的过程,即存在多个类别,每个目类别包含多个关键点,且每一个类别中存在多个目标。附上对应的数据转换代码及推理代码。如有不同技术理解,欢迎探讨。
2024-01-04 18:41:06
2496
11
yolov5_weights.zip
2020-08-04
yolov5预训练模型.zip
2020-08-04
tensorflow-1.14.0-cp27-non-linux_aarch64.whl.tar
2021-01-28
tensorflow-1.15.4+nv20.12-cp36-cp36-linux_aarch64.whl.tar
2021-01-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人