深度学习_没头发的米糊的博客-CSDN博客

深度学习

关注

文章平均质量分 91

关注数：文章数：2 文章阅读量：2249 文章收藏量：6

作者: 没头发的米糊

风浪未平息，我宣告奔跑的意义。现为中国科学技术大学电子科学与信息工程系（6系）硕士研究生，从事计算机视觉相关的课题研究。本科曾就读于合肥工业大学软件工程专业，拥有丰富软件开发经验。【主要技术栈】前端：Vue、Nuxt.js；后端：Python、Java、Node.js；客户端：Flutter、UniApp；深度学习：Pytorch；其它：C/C++、Rust、Kotlin

展开

专栏收录文章

【论文阅读】Generating Radiology Reports via Memory-driven Transformer (EMNLP 2020)

本文将记忆力机制引入到了端到端的放射性医学影像描述生成的任务重，从而确保了生成结果能够准确、详细地描述输入的影像，并且遵循常规的模式性的描述机制。在引入记忆力机制的过程中，其更改Transformer的结构的地方比较新颖，在LN层上动刀子，从而将记忆的影响带到了Decoder内部的隐层状态中，获得了更细粒度的控制。

原创 2023-11-07 13:23:15 · 719 阅读 · 0 评论
【论文阅读】Progressive Spatio-Temporal Prototype Matching for Text-Video Retrieval

提出了一种新颖的文本视频检索框架，称为ProST，将匹配过程分解为互补的对象短语和事件句子原型对齐。在对象短语原型匹配阶段，设计了空间原型生成机制，以便专注于重要的视频内容并加强精细的空间对齐。在事件句子原型匹配阶段，他们使用时间原型生成机制逐渐生成多样化的事件原型，并学习动态的一对多关系。希望通过这篇论文不仅能够提供有关互补的时空匹配的重要性的见解，还能够促进未来的研究，通过解决设计缺陷而不是主要是尝试和错误来推动文本视频检索领域的进展。

原创 2023-11-07 14:08:10 · 1530 阅读 · 1 评论

深度学习

作者: 没头发的米糊

【论文阅读】Generating Radiology Reports via Memory-driven Transformer (EMNLP 2020)

【论文阅读】Progressive Spatio-Temporal Prototype Matching for Text-Video Retrieval