
人工智能
文章平均质量分 91
leah126
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大模型微调(Fine-tuning)全解,需要了解的都在这里,收藏这篇就够了
所谓大模型微调,指的在已有的大规模预训练模型基础上,通过对标注数据进行训练,进一步优化 模型的表现,以适应特定任务或场景的需求。不同于RAG或者Agent技术,通过搭建工作流来优化模型表现,微调是通过修改模型参数来优化模型能力,是一种能够让模型“永久”掌握某种能力的方法。原创 2025-07-08 10:53:49 · 807 阅读 · 0 评论 -
【大模型开发 】 一文搞懂Fine-tuning(大模型微调),收藏这一篇就够了
1、LoRALoRA(Low-RankAdaptation)是一种旨在微调大型预训练语言模型(如GPT-3或BERT)的技术。其核心理念在于,在模型的决定性层次中引入小型、低秩的矩阵来实现模型行为的微调,而无需对整个模型结构进行大幅度修改。这种方法的优势在于,在不显著增加额外计算负担的前提下,能够有效地微调模型,同时保留模型原有的性能水准。原创 2025-07-08 10:52:33 · 593 阅读 · 0 评论 -
九款国内免费大模型,前三款强烈推荐!收藏这篇就够了
在开始今天的介绍之前,我们先看一张图,是由《2024年中国大模型能力评测》中提供的大模型综合竞争力气泡图。腾讯混元、文心一言、通义千问,不过从功能性和实用角度,我最推荐的是Moonshot的Kimi和清华系的智谱AI。原创 2025-07-08 10:49:59 · 915 阅读 · 0 评论 -
【大模型微调】一文掌握7种大模型微调的方法,收藏这一篇就够了
本篇文章深入分析了大型模型微调的基本理念和多样化技术,细致介绍了LoRA、适配器调整(Adapter Tuning)、前缀调整(Prefix Tuning)等多个微调方法。详细讨论了每一种策略的基本原则、主要优点以及适宜应用场景,使得读者可以依据特定的应用要求和计算资源限制,挑选最适合的微调方案。大型语言模型(LLM)的训练过程通常分为两大阶段:阶段一:预训练阶段在这个阶段,大型模型会在大规模的无标签数据集上接受训练,目标是使模型掌握语言的统计特征和基础知识。原创 2025-07-08 10:46:16 · 873 阅读 · 0 评论 -
什么是大模型?一文读懂大模型的基本概念,收藏这篇就够了
大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。原创 2025-07-08 10:45:12 · 829 阅读 · 0 评论 -
浅谈互联网中弱口令的危害,从零基础到精通,收藏这篇就够了!
弱口令(weak password) 没有严格和准确的定义,通常认为容易被别人(他们有可能对你很了解)猜测到或被破解工具破解的口令均为弱口令。弱口令指的是仅包含简单数字和字母的口令,例如“123”、“abc”等,因为这样的口令很容易被别人破解,从而使用户的互联网账号受到他人控制,因此不推荐用户使用。原创 2025-03-24 21:55:34 · 934 阅读 · 0 评论 -
黑客笔记15:超级弱口令检查工具SNETCracker,从零基础到精通,收藏这篇就够了!
工具目前支持SSH、RDP、SMB、MySQL、SQLServer、Oracle、FTP、MongoDB、Memcached、PostgreSQL、Telnet、SMTP、SMTP_SSL、POP3、POP3_SSL、IMAP、IMAP_SSL、SVN、VNC、Redis等服务的弱口令检查工作。超级弱口令检查工具是一款Windows平台的弱口令审计工具,支持批量多线程检查,可快速发现弱密码、弱口令账号,密码支持和用户名结合进行检查,大大提高成功率,支持自定义服务端口和字典。原创 2025-03-24 21:54:33 · 928 阅读 · 0 评论 -
弱口令(Weak Password)总结和爆破工具.md,从零基础到精通,收藏这篇就够了!
网站管理、运营人员由于安全意识不足,为了方便、避免忘记密码等,使用了非常容易记住的密码,或者是直接采用了系统的默认密码等。攻击者利用此漏洞可直接进入应用系统或者管理系统,从而进行系统、网页、数据的篡改与删除,非法获取系统、用户的数据,甚至可能导致服务器沦陷。弱口令(weak password) 没有严格和准确的定义,通常认为容易被别人(他们有可能对你很了解)猜测到或被破解工具破解的口令均为弱口令。原创 2025-03-24 21:53:30 · 1150 阅读 · 0 评论 -
10个最佳 Node.js CMS 平台推荐,从零基础到精通,收藏这篇就够了!
内容管理系统是一种软件应用程序,它提供图形用户界面,其中包含我们可以用来创建、更新、管理和发布内容的工具。内容存储在数据库中,并通过CMS提供的展示层或前端层(通常以网站模板的形式)显示给目标受众。有不同类型的「CMS」原创 2025-03-22 22:09:56 · 908 阅读 · 0 评论 -
7 款殿堂级的开源 CMS,从零基础到精通,收藏这篇就够了!
不会编程:首选 WordPress 因为它成熟简单,编程相关的东西都被藏在了背后。会 Python:django-cms 容易接受,wagtail 则更新、势头更猛。会前端:推荐 strapi 它背后有商业化公司支持,吃透了可以谋个远程全职。不会前端,但懂后端:推荐 Ghost,它玩法多、社区活跃、有免费主题。以上就是本文的所有内容了,由于篇幅问题没有写静态网站生成器相关的开源项目,后面我会专门再做一期。❤️黑客/网络安全学习路线。原创 2025-03-22 22:05:28 · 1210 阅读 · 0 评论 -
AngularJS 模块化和依赖注入,从零基础到精通,收藏这篇就够了!
这是我参与8月更文挑战的第2天,活动详情查看:AngularJS 带有内置的依赖注入机制。您可以将您的应用程序分为多个不同类型的AngularJS可以注入到每个等组成。模块化您的应用程序可以更容易地重新使用,配置和应用程序测试组件。这些核心类型可以注入到彼此使用AngularJS依赖注入机制。纵观本文的其余部分,我将解释如何定义和注入这些组件相互转化。原创 2025-03-21 22:04:01 · 792 阅读 · 0 评论 -
依赖注入的主要类型,从零基础到精通,收藏这篇就够了!
Spring3.X鼓励使用,Spring 4.X以后认为是可选的注入方式,Setter注入字段本身是可变化的,所以对象本身或注入的内容可以为空。即,一般依赖的组件以及组件依赖的外部输入等,都需要我们在构造的时候完成初始化。构造器注入如果参数过多,代码看起来不是很友好,一般需要做一些重构,换句话说就是不应该把太多的职责放到一个类里,一个方法里不应该有太多的输入。这也是耗费了大白近四个月的时间,吐血整理,文章非常非常长,觉得有用的话,希望粉丝朋友帮忙点个**「分享」木马免杀问题与防御********必知必会。原创 2025-03-21 22:02:58 · 700 阅读 · 0 评论 -
iris请求注入流程浅析,从零基础到精通,收藏这篇就够了!
/ bindings是在iris.Application初始化的时候就已经准备好了,handler在注册到iris.Application的时候通过getBindingsForFunc初始化了if err!= nil {continuereturn// 调用controller的业务逻辑// 请求结果分发处理err!= nil {篇头说过,注入模块有两部分,一部分是一开始的初始化,一部分是请求处理时的注入,这里的是注入。原创 2025-03-21 22:02:00 · 1027 阅读 · 0 评论 -
网页疯狂自动刷新,发生了什么?业务:我传了一张两亿像素的图片而已,从零基础到精通,收藏这篇就够了!
此次问题的根源在于浏览器渲染机制对超大像素图片的处理。当图片分辨率超出设备性能的承载范围时,渲染阶段的计算量急剧增加,导致浏览器崩溃甚至页面进入无限刷新的死循环。通过对浏览器渲染流程的分析,我们发现,图片的加载、重排和光栅化等阶段是性能瓶颈的关键所在。尤其是在光栅化阶段,浏览器需要将超大图像转化为位图,这一过程对CPU和GPU的计算资源需求非常高,进一步加重了性能负担。这个案例提醒我们,在设计和开发过程中,必须时刻关注性能瓶颈,尤其是在涉及大规模资源(如图片、视频等)的加载和渲染时,更应该小心谨慎。原创 2025-03-19 21:59:09 · 675 阅读 · 0 评论 -
2025最新Vue面试题:从基础到源码,面试官最爱问的都在这!从零基础到精通,收藏这篇就够了!
slot 是 Vue 中的一种用于 组件内容分发 的机制。它允许父组件向子组件插入内容,从而使组件更加灵活和可复用。原创 2025-03-19 21:57:49 · 895 阅读 · 0 评论 -
13个Cursor神功能,比VSCode强大100倍,从零基础到精通,收藏这篇就够了!
在经历了从VSCode到Cursor的转变后,我深刻体会到AI辅助开发工具已经不仅仅是一个代码补全助手,而是evolving成为一个真正的开发伙伴。功能特性Cursor对比说明基础功能代码补全✅ 更智能的上下文理解✅ 基于上下文补全Cursor的补全更准确,理解更深入多行编辑✅ 智能批量编辑⚠️ 仅支持基础多光标Cursor支持更智能的批量修改代码解释✅ 实时、详细✅ 基础解释Cursor的解释更加详细和准确AI 特性对话功能✅ 内置Chat功能。原创 2025-03-19 21:52:35 · 913 阅读 · 0 评论 -
2025 前端+大前端+全栈 知识体系,从零基础到精通,收藏这篇就够了!
爆肝一周,每天搜索和整理 2h,终于写完了。希望给所有前端开发员的同学一份专业详细的参考目录。近期有计划面试的同学,可到面试派刷题,学习面试流程和技巧。黑客/网络安全学习路线对于从来没有接触过黑客/网络安全的同学,目前网络安全、信息安全也是计算机大学生毕业薪资相对较高的学科。大白也帮大家准备了详细的学习成长路线图。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。这也是耗费了大白近四个月的时间,吐血整理,文章非常非常长,觉得有用的话,希望粉丝朋友帮忙点个**「分享」「在看」「赞」**原创 2025-03-18 20:56:02 · 930 阅读 · 0 评论 -
MyBatis四大组件Executor、StatementHandler、ParameterHandler、ResultSetHandler详解,从零基础到精通,收藏这篇就够了!
上次我们在说mybatis 的 plugin 功能的时候,提到了其可作用于myBatis 的四大组件,也放了一个基础的模型图,但是对于这四大组件更具体的功能和原理:却没有进一步说明,今天就来完成这项工作Statement 是Java JDBC API中定义的一个接口,位于java.sql 包下,是一种执行静态SQL语句的对象,可以用于执行SQL语句的查询、更新、插入和删除等操作。原创 2025-03-18 20:54:44 · 683 阅读 · 0 评论 -
MacDevKit: 一键打造完美的 macOS 开发环境,从零基础到精通,收藏这篇就够了!
MacDevKit 的另一个强大之处在于它的可定制性。你可以通过编辑init.sh添加或删除要安装的工具和应用程序修改 Git 配置和 SSH 密钥生成调整 VS Code 扩展更改 macOS 系统设置"your-new-extension-id" # 添加你的扩展MacDevKit 是一个强大的工具,它可以帮助你在几分钟内配置好一个完整的 macOS 开发环境,省去繁琐的手动配置过程。无论你是刚入行的新手,还是经验丰富的老手,MacDevKit 都能为你节省大量时间和精力。原创 2025-03-18 20:52:26 · 788 阅读 · 0 评论 -
Redis---RDB_AOF_混合持久化,从零基础到精通,收藏这篇就够了!
Redis 是内存数据库,数据都是存储在内存中,为了避免进程退出导致数据的永久丢失,需要定期将 Redis 中的数据以某种形式(数据或命令)从内存保存到硬盘。当下次 Redis 重启时,利用持久化文件实现数据恢复。除此之外,为了进行灾难备份,可以将持久化文件拷贝到一个远程位置。原创 2025-03-18 20:50:21 · 808 阅读 · 0 评论 -
浅谈互联网公司业务安全,从零基础到精通,收藏这篇就够了!
业务安全,按照百度百科的解释:业务安全是指保护业务系统免受安全威胁的措施或手段。广义的业务安全应包括业务运行的软硬件平台(操作系统、数据库等)、业务系统自身(软件或设备)、业务所提供的服务的安全;狭义的业务安全指业务系统自有的软件与服务的安全。我的理解:某个平台上的业务是指该平台用户在使用过程中涉及到的一系列流程,而业务安全就是保证这些流程按照预定的规则运行。通过对比正常用户与马甲用户的行为、指纹等,标识马甲用户。从上面的一些威胁可以看出,账号体系安全是其他业务的基础,与许多业务直接相关。原创 2025-03-17 20:33:41 · 1073 阅读 · 0 评论 -
你的Web系统真的安全吗?从零基础到精通,收藏这篇就够了!
也就是说,请求带上了相应的token,那么服务端就能拿到token做相应的校验,校验通过则信任该请求并执行相关业务逻辑,如果没带、带一个非法的或者过期的则认为不合法。实际上,除了这些基础且标准化的漏洞,每个业务系统本身的业务逻辑也很有可能成为黑客攻击的目标,一旦被抓到并攻破,那后果将是非常严重的。但后台开发小哥也许在设置token过期的配置中,眼花加手抖,多打一位数,或者把单位理解错,在S级单位上用了MS级的数值,那过期时间就会被设定的很长。但是,这个判断在一些web程序中,只在前端做了,在后端没做。原创 2025-03-17 20:31:38 · 884 阅读 · 0 评论 -
10款免费网络管理神器,从入门到精通,收藏这篇就够了!
作为一名合格的网络管理员,首要任务当然是时刻盯着网络,一旦出现问题,就要像猎豹一样迅速出击,解决问题!简单网络管理协议 (SNMP) 仍然是监控各种网络指标的“黄金标准”,从设备和接口的运行状态到带宽、CPU 利用率,甚至硬件设备的温度,统统不在话下。如果你需要基本的服务器负载均衡功能,但又囊中羞涩,Zen Load Balancer 绝对是一款成熟且免费的开源解决方案,能够满足你的大部分需求。除了上面提到的这些工具,再给大家补充一些其他的开源工具,它们不一定执行特定的网络功能,但可以帮助网络管理。原创 2025-03-14 16:51:43 · 1086 阅读 · 0 评论 -
Web 渗透测试之沙场点兵:信息收集篇,从零基础到精通,收藏这篇就够了!
域名嘛,就好比是互联网世界的“门牌号”,也就是。原创 2025-03-14 16:27:29 · 1149 阅读 · 0 评论 -
一文了解AI Agent,(非常详细)从零基础到精通,收藏这篇就够了!
AI Agent 会利用 LLM 的推理能力,把问题进行拆解,形成一个一个的小问题,并定义好这些小问题之间的前后关系,先处理哪个,再处理哪个。通过调用外部的插件工具,来获取原本LLM并不具备的能力,如:文心的Chat files插件获取文档解析能力;记忆(Memory),把员工以往的汇报内容进行分析,提炼出汇报文案风格、内容格式、汇报周期、汇报人等特征信息,作为长记忆进行存储,供撰写报告时使用。行动(Action),基于工作报告应用开放的执行权限,待LLM成功生成工作报告后,自动执行提交操作,完成任务。原创 2025-03-13 17:33:07 · 1283 阅读 · 0 评论 -
MySQL数据库安全加固:防注入与权限管理策略,从零基础到精通,收藏这篇就够了!
亲爱的朋友们,今天我们一起学习了如何在MySQL数据库中加强安全防护,包括防止SQL注入和管理用户权限。虽然这段旅程充满了技术细节,但只要跟随我们的指引,相信你也能建立起坚实的防线。如果你觉得这篇文章对你有所帮助,请不要吝啬你的赞和分享,让更多的人受益吧!原创 2025-03-12 22:31:59 · 1091 阅读 · 0 评论 -
我的数据库被勒索了!从零基础到精通,收藏这篇就够了!
大家好,我是苍何。最近一个多月,全身心投入到**「开源项目」「数据库被勒索」**的经历,希望大家足够重视数据库的安全防护。因为是开源项目嘛,为了控制成本,数据库使用的是阿里云 1 核 2G 的 ECS 服务器自己搭建的。想着还在测试阶段,密码干脆就设置的比较简单,没错,就是 123456 😂。并且怎么简单怎么来,用的 docker 快速就搭建了,并没有设置好权限。搭建好后过了一晚,一直在重启,看了下日志,以为是内存不足导致,又给 MySQL 加了**「内存限制和内存保留」**。原创 2025-03-12 22:27:45 · 994 阅读 · 0 评论 -
Redis数据库三级等保测评指导与加固,从零基础到精通,收藏这篇就够了!
对于从来没有接触过网络安全的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。这也是耗费了大白近四个月的时间,吐血整理,文章非常非常长,觉得有用的话,希望粉丝朋友帮忙点个**「分享」因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取。木马免杀问题与防御********必知必会。****网络安全/渗透测试。****网络安全/渗透测试。****网络安全/渗透测试。原创 2025-03-12 22:26:35 · 773 阅读 · 0 评论 -
最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025),从零基础到精通,收藏这篇就够了!
语言模型」是一种「人工智能系统」,旨在处理、理解和生成类似人类的语言。它们从大型数据集中学习模式和结构,使得能够产生连贯且上下文相关的文本,应用于翻译、摘要、聊天机器人和内容生成等领域。原创 2025-03-11 16:17:07 · 1141 阅读 · 0 评论 -
非常容易理解大模型,从零基础到精通,收藏这篇就够了!
大模型需要大量的数据来“喂养”,这些数据里可能包含用户的个人信息,如何保护这些信息的隐私和安全,是个大问题。大模型的参数太多,内部机制太复杂,很难理解它是怎么做决定的,这在一些对决策可解释性要求高的领域,比如医疗、金融等,可能会影响它的应用。更厉害的是,大模型还能根据你的要求写文章,而且写得还挺溜,有理有据的。比如,在诊断肺部疾病时,大模型可以分析肺部CT影像,看看有没有病变,还能判断病变的类型和严重程度,帮助医生更准确、更快速地诊断。而且,大模型还能根据聊天内容,理解你的意思,做出更智能、更贴心的回应。原创 2025-03-11 15:30:44 · 537 阅读 · 0 评论 -
一文读懂AI Agents:让大模型拥有行动力,从零基础到精通,收藏这篇就够了
推理框架关键特点适用场景优势ReAct思考-行动-观察循环实时工具调用、交互式任务实时反馈、工具调用灵活显式中间推理步骤需要明确计算与推理的问题提高推理准确性与可解释性树状多路径探索复杂规划与决策问题深度探索、多路径评估。原创 2025-03-11 15:18:49 · 842 阅读 · 0 评论 -
恶意代码技术及恶意代码检测技术原理与实现,从零基础到精通,收藏这篇就够了!
由于特征签名的的唯一性可对一样本实现100%的查杀率,但由于特征签名具有的唯一性,仅能实现一对一(即一个签名值仅能匹配一个恶意文件),这种方法虽然不可能出现误报的情况,但所需的病毒库体量会过于庞大,且只要恶意代码作者重新编译文件或改变任何一个字节,都会使得该签名值无法匹配,但是由于签名计算实现十分简单快速,因此基于特征签名的检测技术适合对突发的一种恶意代码进行应急响应,前提是恶意代码不会动态更新其本体。以上的种种检测技术丰富了与恶意代码的对抗手段,同时也提供了对层出不穷的新病毒的检测能力以及应急响应能力。原创 2025-03-10 22:08:10 · 1113 阅读 · 0 评论 -
杨冀龙:网络攻防技术对抗之恶意代码分析技术与应用,从零基础到精通,收藏这篇就够了!
What),不知道敌人是谁,什么时候来攻击,为什么来攻击,使用什么来攻击等等,没有这些情报等同于盲人摸象,不清楚该使用什么样的防御手段,防御成本就会很高。恶意代码的深入分析,正是应对6W难题的有效方法,以此揭示攻击者的技战术、策略和程序,从而为防御者提供宝贵的信息,以构建更为坚固的安全防线。他还探讨了样本中的混淆技术、加壳手段以及对抗分析方法的使用,这些高级技术的使用增加了分析的难度,但也为安全专家提供了研究和对抗的新方向。通过对这些技术的深入理解,可以更有效地构建防御措施,提高网络空间的安全性。原创 2025-03-10 22:07:01 · 999 阅读 · 0 评论 -
恶意代码分析实战:熊猫烧香病毒样本分析,从零基础到精通,收藏这篇就够了!
在这里我们利用逆向界的倚天剑和屠龙刀,IDA和OD来对熊猫烧香进行逆向分析,对其内部实现的原理有个了解,因为篇幅关系不会对整个程序彻底分析,而是挑拣一些重要内容进行分析。有兴趣的可加QQ群:1145528880 (一起学习 逆向、PWN二进制安全、Web信息安全、IoT安全、游戏逆向分析原理交流)黑客/网络安全学习路线对于从来没有接触过黑客/网络安全的同学,目前网络安全、信息安全也是计算机大学生毕业薪资相对较高的学科。大白也帮大家准备了详细的学习成长路线图。原创 2025-03-10 22:05:28 · 1222 阅读 · 0 评论 -
[开源]一套实现SSR服务端渲染的CMS系统,适合企业搭建SEO型网站,从零基础到精通,收藏这篇就够了!
使用 nest.js 基于 node.js 和 nuxt.js 基于 vue.js 开发的 CMS 系统,实现 SSR 服务端渲染,且可生成静态HTML,有利于SEO。适合企业搭建SEO型网站。原创 2025-03-09 21:09:46 · 1101 阅读 · 0 评论 -
Python实现轻量级CMS:从零搭建你的内容管理系统,从零基础到精通,收藏这篇就够了!
写代码就像搭积木,一块一块搭起来,最后就成了一个完整的系统。代码写得不错,但还有很多可以优化的地方,比如加个缓存、整个全文搜索,以后慢慢迭代呗。咱们今天就用Python的Flask框架搭一个mini版的CMS,麻雀虽小五脏俱全,该有的功能都给它安排上!对于从来没有接触过网络安全的同学,我们帮你准备了详细的学习成长路线图&学习规划。这也是耗费了大白近四个月的时间,吐血整理,文章非常非常长,觉得有用的话,希望粉丝朋友帮忙点个**「分享」来搞定,它就像个翻译官,把Python代码转成数据库能懂的语言。原创 2025-03-09 21:05:06 · 984 阅读 · 0 评论 -
【2025版】一文带你了解网络安全领域要熟知的50个术语!
在现代社会中,网络安全已成为一个至关重要的领域。随着技术的进步和互联网的普及,网络攻击变得越来越复杂和频繁。了解和掌握网络安全的基本术语,对于从业人员和普通用户来说都十分必要。本文将详细介绍网络安全领域需要熟知的50个术语,帮助读者更好地理解和应对各种网络威胁。原创 2025-03-08 10:43:01 · 939 阅读 · 0 评论 -
【2025版】多场景对比,现在谁是最强视频生成模型?从零基础到精通,精通收藏这篇就够了!
OpenAI的正式版终于上线了!不过,在Sora缺席的10个月里,等等模型都横空出世,有的甚至都卷出了自己的特色风格和功能,比如Runway的多帧修改、可灵生成的表情更加自然、海螺的二次元风格等等。接下来我们就来一起看看,Sora和这些模型的对比效果究竟如何吧!原创 2025-03-08 09:34:37 · 1103 阅读 · 0 评论 -
【2025版】QwQ-32B,性能比肩全球最强开源推理模型,从零基础到精通,精通收藏这篇就够了!
近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1 通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。这一次,我们探讨了大规模强化学习(RL)对大语言模型的智能的提升作用,同时推出我们。这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。这一成果突显了将强化学习应用于经过大规模预训练的强大基础模型的有效性。此外,我们还在推理模型中。原创 2025-03-08 09:31:24 · 892 阅读 · 0 评论 -
【2025版】QwQ-32B比肩DeepSeek-R1满血版,从零基础到精通,精通收藏这篇就够了!
6号凌晨 3 点,阿里开源发布了新推理模型 QwQ-32B,其参数量为 320 亿,但性能足以比肩 6710 亿参数的 DeepSeek-R1 满血版。千问的推文表示:「这次,我们研究了扩展 RL 的方法,并基于我们的 Qwen2.5-32B 取得了一些令人印象深刻的成果。我们发现 RL 训练可以不断提高性能,尤其是在数学和编码任务上,并且我们观察到 RL 的持续扩展可以帮助中型模型实现与巨型 MoE 模型相媲美的性能。欢迎与我们的新模型聊天并向我们提供反馈!原创 2025-03-08 09:28:35 · 1285 阅读 · 0 评论