- 博客(7)
- 收藏
- 关注
转载 deepseek-r1的1.5b、7b、8b、14b、32b、70b和671b有啥区别?
系列提供了多种参数规模的模型(1.5B、7B、8B、14B、32B、70B 和 671B),它们在模型架构、性能表现、资源需求和适用场景上有显著差异。,采用 MoE 架构,支持超长上下文(128K tokens),在复杂任务上表现顶尖。> - 小模型支持4-bit 量化(如 Qwen-1.5B),可在边缘设备运行。> - 小模型(≤7B)响应快(0.1~0.3秒),但深度推理能力弱;> - 追求 低延迟/低成本 → 选 7B/8B(性价比最高);(科研/代码/决策):70B 或 671B(API)
2025-07-05 17:54:38
240
转载 前/后向自动微分的简单推导与rust简单实现
利用微分的定义式\]因此可以用割线斜率公式近似微分, 当\(h\)足够小时割线将与切线重合.\]数值微分存在两个缺点:\(h\)的取值, 要保证\(h\to 0\), 才能保证割线足够接近切线, 但当\(h\)过小时容易因浮点误差导致数值不稳定, 尤其当导数变化剧烈时, 可能需要反复调整\(h\)来找到合适的精度.精度不足, 误差项与\(h\)有效数字的平方成正比, 也就是说即使最理想情况下, 在f64范围内,\(h\)
2025-07-05 09:40:35
31
转载 MCP数据脱敏应用开发
数据脱敏(Data Masking),又称数据漂白、数据去隐私化或数据变形。指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。
2025-06-01 14:41:10
33
转载 SpringBoot集成OpenPDF实现PDF导出
一、前言OpenPDF是一个开源的Java PDF库,它基于iText 5.x版本,但是它主要提供了HTML到PDF的转换能力。我们可以在SpringBoot项目中使用OpenPDF来生成PDF文件。PDF文件因其跨平台兼容性和格式的稳定性而在商业文档中广泛使用。使用Spring Boot集成OpenPDF库可以方便地将H...
2024-08-20 04:21:47
310
转载 Swin和ViT不同任务上の差异
Swin Transformer的提出,就是让Transformer也有CNN的Block和层级这个多尺度的概念。Vit的作者在Paper的最后面提出,只在Classification方面做了尝试,其他的留给后人。因为在图像的其他下游任务中,比如目标检测,语义分割,图像生成,都需要更细的粒度。那就要调整patch的大小,如...
2024-08-03 04:54:48
186
转载 基于典型相关性分析的多视图学习方法(基于半监督学习的 CCA)——泛化能力的多视图分析模型(GMA)...
泛化能力的多视图分析模型(Generalized Multi-view Analysis, GMA)是由Sharma等人提出的,旨在扩展传统无监督的典型相关分析(Canonical Correlation Analysis, CCA)至有监督学习和更广泛的数据分析场景。GMA的核心在于能够处理多源异构数据,同时考虑数据的标...
2024-07-16 03:43:36
126
原创 更新kubernetes 过期证书
kubeadm 版本在kubernetes 1.15 版本 提供了强大的证书管理功能,本文章适用于kubernetes1.15以下版本(文章中kubernetes版本是1.13.2)。1.15 版本的证书管理相关文档:官方文档-使用 kubeadm 进行证书管理[官方文档-kubeadm alpha 使用说明]9https://kubernetes.io/docs/refere...
2024-01-31 14:25:23
824
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人