file-type

基于EPIC-Kitchens数据集的TSN/TRN/TSM动作识别基准

ZIP文件

下载需积分: 50 | 861KB | 更新于2024-11-24 | 49 浏览量 | 1 下载量 举报 收藏
download 立即下载
它包含了完整的训练、验证和测试数据集,以及相应的注释,用于评估各种动作识别模型的性能。EPIC-KITCHENS-100是该基准的一个重要组成部分,它包括了100个不同的厨房相关的动作类别。 TSN(Temporal Segment Networks)、TRN(Temporal Relation Networks)和TSM(Temporal Shift Module)是三种用于视频动作识别的深度学习架构。这些模型的定义由各自的原始作者提供,并包含在这个回购中。TSN通过分割视频为多个段然后进行独立的网络评估并最终汇总分数的方式,TRN侧重于探索视频帧之间的时序关系,而TSM则通过引入时间偏移模块来更好地捕捉视频中的时间动态特性。 训练脚本和测试脚本允许研究人员复现和评估模型在EPIC-KITCHENS-100数据集上的性能。这些脚本提供了必要的步骤和代码,以便进行模型训练、验证以及最终的测试。 另外,提供的EPIC-Kitchens 100验证集中的预训练模型,可用于加速研究和开发过程。它允许研究者在这个基准上微调模型,而不是从零开始训练,从而节省了大量时间和计算资源。 在2021年2月20日的一次更新中,研究者们指出,他们将数据预处理时的平均值和标准偏差设置为了相同的值,即ImageNet的平均值。他们重新训练了网络,将均值设为ImageNet均值,标准差设为ImageNet标准差,发现所有模型(TSN / TRN / TSM)的表现都不如原始设置(mean = [0.485, 0.456, 0.406]和std = [0.485, 0.456, 0.406])好。因此,他们决定保留原始的检查点,以确保最佳性能。 该资源还提到了其他两个相关模型:TBN(Temporal Background Networks)和SlowFast Networks,虽然具体的文件中并没有包含这两个模型的代码或预训练模型,但提到了相关信息的链接,供感兴趣的读者参考。 整个资源是为使用Jupyter Notebook进行数据分析和机器学习研究的社区所准备的。Jupyter Notebook是一个开源的Web应用程序,允许用户创建和共享包含实时代码、方程、可视化和解释文本的文档,非常适合进行数据清洗与分析、统计建模、数据可视化、机器学习等任务。 文件名称列表C1-Action-Recognition-TSN-TRN-TSM-master表明了这个文件属于一个代码仓库的主分支,包含了所有最新的更新和完整的资源代码。"

相关推荐