
大模型
文章平均质量分 86
分享大模型相关知识
一点.点
悟已往之不谏,知来者之可追
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
VLA视觉语言动作大模型的简单介绍
VLA(Vision-Language-Action)模型是人工智能多模态领域的自然演进成果,旨在通过整合视觉感知、语言理解和动作生成能力,赋予机器更接近人类的交互与决策能力。其发展受到多模态学习、强化学习与机器人控制以及大模型泛化能力的推动。VLA模型的技术架构包括多模态融合编码器、动作解码器和记忆与规划模块,具有跨模态泛化、少样本适应和因果推理能力等优势。应用领域涵盖服务机器人、工业自动化、自动驾驶、医疗辅助和教育娱乐等。原创 2025-05-23 17:08:06 · 1010 阅读 · 0 评论 -
视觉语言模型(Vision-Language Model, VLM)的简单介绍
视觉语言模型(VLM)起源于多模态机器学习的研究,早期计算机视觉和自然语言处理独立发展,后逐渐融合。2014-2016年,深度学习推动多模态任务兴起,2017年后Transformer架构的提出加速了领域融合,CLIP和Flamingo成为里程碑。VLM通过联合学习视觉和语言特征实现跨模态对齐,关键技术包括对比学习和跨模态注意力机制。其优势在于多模态理解能力、零样本学习和泛化性,广泛应用于智能客服、教育、医疗、自动驾驶等领域。原创 2025-05-23 16:39:41 · 1330 阅读 · 0 评论 -
大模型领域常用专业词汇(分类整理)
如果此文章对您有所帮助,那就请点个赞吧,收藏+关注 那就更棒啦,十分感谢!!!原创 2025-04-25 08:48:01 · 1088 阅读 · 0 评论 -
大模型简单介绍
大模型(Large Language Models, LLMs)是基于深度学习技术构建的超大规模人工智能模型,参数量级通常达数十亿至万亿级别,通过海量数据预训练学习复杂模式,具备强大的泛化能力和多任务处理能力159。参数量级庞大:例如GPT-3拥有1750亿参数,GPT-4参数量达约1.8万亿13。预训练+微调范式:先在通用数据(如互联网文本)上预训练,再针对特定任务微调,实现灵活迁移学习15。涌现能力:参数规模超过临界值(约百亿级)后,模型展现出未显式训练的复杂能力,如逻辑推理、跨语言迁移等19。原创 2025-05-02 06:27:48 · 1046 阅读 · 0 评论