logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

多模态大模型终极指南!铁一院x商汤贯通28行业知识,万字综述精华:从方法到应用全攻略!

**论文简评**: 《MultiTrust-X:多模态大型语言模型的信任度评估基准》这篇论文是关于评估和缓解多模态大规模语言模型(MLLM)中信任度问题的重要工作。作者提出了一种统一的框架,该框架涵盖了多模态信任度的各种维度以及针对其独特风险的新颖风险。他们通过大量实验揭示了现有模型的漏洞,并提出了新的减缓方法——Reasoning-Enhanced Safety Alignment(RESA)。

文章图片
#人工智能#大数据#前端 +2
20250829_201110_多模态推理革命___从感知到规划,全模态理解+Agent行为

推理是智能的核心,塑造了决策、得出结论以及跨领域泛化的能力。在人工智能领域,随着系统越来越多地运行在开放、不确定和多模态的环境中,推理对于实现鲁棒和自适应行为变得至关重要。大型多模态推理模型(LMRM)已成为一种有前景的范式,通过整合文本、图像、音频和视频等模态来支持复杂的推理能力,旨在实现全面感知、精确理解和深度推理。随着研究的推进,多模态推理已迅速从模块化、感知驱动的流水线发展到统一、以语言为

文章图片
#知识图谱#人工智能#fastapi +2
2025工作流革命!MCP让n8n听懂人话,RAG自动化从入门到精通一篇封神

配置一个从Salesforce到MySQL的数据同步工作流,3天都还没搞定。这是不是你刚接触n8n的样子?

文章图片
#自动化#运维#人工智能 +4
揭秘!RAG与智能体如何打造企业智慧大脑(附架构图),零基础到专家,看这一篇就够!

当企业知识沉睡于数据孤岛,大模型却在幻觉中徘徊。RAG不只是技术,更是打通知识与智能的关键桥梁。

文章图片
#人工智能#深度学习#机器学习 +1
突破Prompt瓶颈:链式思维+双阶段奖励,港大等开源GoT-R1让多物体合成更神准!

视觉生成模型虽然在根据文本提示生成图像方面取得了进展,但在应对包含**多个对象、精确空间关系和属性绑定**的复杂提示时仍面临挑战。现有方法缺乏对**语义内容与空间布局的显式推理能力**,难以生成结构合理、语义一致的图像。

文章图片
#语言模型#人工智能#自然语言处理 +2
浅谈OpenAI o1的价值意义及RL 的Scaling Law

1.1 我觉得OpenAI o1是自GPT 4发布以来,基座大模型最大的进展,逻辑推理能力提升的效果和方法比我想的要好,GPT 4o和o1是发展大模型不同的方向,但是o1这个方向更根本,重要性也比GPT 4o这种方向要重要得多,原因下面会分析。、1.2为什么说o1比4o方向重要?这是两种不同的大模型发展思路,说实话在看到GPT 4o发布的时候我是有些失望的,我当时以为OpenAI会优先做o1这种方

文章图片
#人工智能#算法#机器学习 +3
历时两年打造的知识图谱推理综述

首先,撰写这篇综述论文的初衷是想证明在这个大模型的时代,知识图谱仍然有很多研究和应用的价值,同时希望为相关领域的研究人员提供一定的参考和启发。本综述从任务导向的角度将知识图谱推理分为**静态单步推理**、**静态多步推理**、**动态推理**、**多模态推理**、**小样本推理**和**归纳式推理**六类,并从六类基本推理任务出发介绍理论方法、知识图谱推理的下游应用以及当前更具挑战的推理任务,包括

文章图片
#知识图谱#人工智能#机器学习 +2
一文搞懂:从“大模型LLM”过渡并入门“多模态大模型MLLM”

近几年主要处理NLP相关的任务,从小模型到大模型LLM,主要都是针对文本,最近有多模态模型MLLM处理的需求,迫切需要学习下多模态模型的整体情况,整理了此文。

文章图片
#人工智能#大数据#java +2
    共 804 条
  • 1
  • 2
  • 3
  • 81
  • 请选择