- 博客(2)
- 收藏
- 关注
原创 深入了解DeepSeek(从模型解析到部署及硬件分析)
DeepSeek-R1系列模型通过蒸馏技术实现了从671B参数大模型到多个小规模高效版本的转化。文章首先介绍了模型蒸馏的概念,即通过知识迁移将大模型能力转移到小模型的技术。随后详细解析了DeepSeek-R1-Distill-Qwen和Llama系列的多个版本(1.5B-70B参数),并对比了它们的性能表现,其中32B模型在多个基准测试中超越GPT-4o等大模型。文章还提供了显存占用计算公式,以7B模型为例说明FP16训练至少需要88.8GB显存(4×A100 80GB)。最后指出通过4-bit量化技术可将
2025-07-03 17:18:29
790
原创 一个使用 Python Flask、JavaScript 和 MySQL 的邮箱验证码注册系统
本文介绍了一个基于Python Flask、JavaScript和MySQL的邮箱验证码注册系统实现方案。系统主要包含三个部分:前端页面使用HTML/JS进行邮箱格式验证并通过Fetch API发送请求;后端使用Flask处理验证码生成、邮件发送(通过SMTP服务器)和用户注册验证;MySQL数据库存储用户哈希密码等安全信息。文章详细说明了项目结构、环境准备步骤(包括Python库安装、邮箱SMTP配置和MySQL数据库设置),并提供了完整的后端代码实现,涵盖验证码生成、邮件发送、数据库连接和用户注册处理等
2025-07-02 22:34:16
681
【C/C++开发】VS Code搭建C/C++开发环境全解析:跨平台配置与优化指南如何在VS Code
2025-06-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人