Github开源项目_云樱梦海的博客-CSDN博客

Github开源项目

关注

文章平均质量分 74

关注数：文章数：32 文章阅读量：68176 文章收藏量：444

作者: 云樱梦海

资源导航 360p.blog

展开

专栏收录文章

无需邀请码的AI智能体-OpenManus横空出世

开发者社区微信群爆满至第十个群，成为AI开源领域的新晋顶流。它的出现不仅打破了Manus的“技术壁垒神话”，更让普通用户和开发者都能零门槛体验AI智能体的强大能力。尽管它仍不完美，但已为开发者提供了可扩展的底层框架，也为普通用户打开了“零门槛AI助手”的大门。，它继承了Manus的核心功能——作为“通用AI智能体”，能够通过自然语言指令自主完成网页浏览、信息检索、代码执行、文件处理等复杂任务，且。MetaGPT团队凭借已有技术积累（如多智能体框架MetaGPT），快速嫁接工具链，实现核心功能复用。

原创 2025-03-10 09:27:35 · 1144 阅读 · 0 评论
DeepSeek开源周第六天：极致推理优化系统，提高GPU计算效率

先打个比方：如果把AI模型比作一个学霸的大脑，那么推理系统就是让这个大脑快速解题的"加速器"。它决定了AI在处理问题时能多快给出答案，同时消耗多少"脑力"（计算资源）。🚀 超级计算器（分布式推理）💡 过目不忘的记忆法（显存优化）📦 知识压缩术（量化技术）DeepSeek V3 R1的发布，标志着顶尖AI技术不再是科技巨头的专属玩具。就像Android系统开启移动互联网时代，这次开源将推动AI技术走进千家万户。无论是想开发智能应用的学生党，还是企业中的技术负责人，现在都可以站在巨人的肩膀上创新。

原创 2025-03-03 10:18:14 · 723 阅读 · 0 评论
一文读懂 Pyarmor：保护你的 Python 脚本

Pyarmor 是一款专为 Python 脚本加密和保护而生的工具。它可以有效地防止 Python 脚本在运行时被泄露，还能对脚本的使用期限进行设置，甚至可以将脚本绑定到特定的硬件设备上，比如硬盘、网卡等。这样一来，你的 Python 脚本就相当于穿上了“金钟罩”，既安全又可靠。无缝替换：加密后的脚本仍然是一个有效的.py文件，可以直接替换原来的脚本，不会影响使用。均衡加密：提供了丰富的加密选项，让你在安全性和性能之间找到最佳平衡点。不可逆加密。

原创 2025-03-01 22:32:05 · 1480 阅读 · 0 评论
DeepSeek开源第四天发布并行策略升级:DualPipe与EPLB技术

DualPipe是DeepSeek团队开发的一种创新并行训练策略，它巧妙地结合了两种管道并行方式，实现了计算资源的最大化利用。简单来说，这项技术让模型训练过程中的前向计算和后向传播可以同时在不同的GPU上进行，大大提高了训练效率。EPLB（Expert Parallel Load Balancing）是DeepSeek推出的另一项关键技术，专门用于解决MoE（Mixture of Experts）模型训练中的负载不均衡问题。

原创 2025-02-27 11:24:55 · 788 阅读 · 0 评论
Anthropic推出混合推理模型：Claude 3.7 Sonnet,“可见扩展思维”技术,让AI像人类一样思考

通过“可见扩展思维”（Visible Extended Thinking）技术，Claude首次向用户展示了AI生成答案的完整思考路径，就像人类写草稿一样逐步推演。Claude的“可见扩展思维”技术，让普通人也能窥见AI的思考过程。”时，Claude会先分解问题（如物理模拟原理、代码框架设计），再逐步生成代码片段并测试，最终给出可行方案。对此，Anthropic的答案是：通过安全对齐研究，从底层约束AI的行为。Claude的定价是竞品的3-6倍，扩展思维模式消耗的token更多，可能劝退预算有限的用户。

原创 2025-02-27 10:59:17 · 585 阅读 · 0 评论
字节跳动Phantom炸场！视频创作进入“复制粘贴”时代，小白也能当导演

🔥短视频巨头又双叒叕放大招了！今天凌晨，一款名为的AI视频生成工具横空出世，直接把“复制粘贴”玩出了影视级效果——你随手拍的猫主子，能瞬间穿越到科幻大片；你上个月旅游的照片，下一秒就能变成迪士尼动画主角！话不多说，带你看懂这个“傻瓜式”视频神器的三大逆天操作！

原创 2025-02-19 21:21:22 · 979 阅读 · 0 评论
重磅开源！昆仑万维发布AI短剧神器：免费+可控，视频创作零门槛！

这意味着AI短剧制作成本将暴跌，人人都能成为“导演”的时代真的要来了！，动辄高昂费用+复杂操作劝退无数创作者。但今天，昆仑万维直接甩出。传统AI视频生成模型常被吐槽。，小白也能秒变短剧导演！

原创 2025-02-19 21:11:55 · 1069 阅读 · 0 评论
马斯克放大招！Grok 3震撼发布：号称“地球上最聪明AI”，性能碾压GPT-4o？

Grok 3发布

原创 2025-02-18 17:18:03 · 390 阅读 · 0 评论
业界首个一体化语音交互系统Step-Audio重磅开源！支持RAP/方言/情感控制的实时对话

Stepfun-AI团队于2025年2月17日开源了革命性的Step-Audio语音交互系统，这是业界首个集。单模型实现语音识别、语义理解、对话管理、语音克隆、语音生成全流程，突破传统ASR+TTS级联架构的延迟瓶颈。项目地址：https://github.com/stepfun-ai/Step-Audio。实现双码本对齐，相比CosyVoice系统在语音自然度(SS)指标上提升12%。基于130B参数模型的合成数据生成技术，构建了包含。的开源实时语音对话框架。[2] 实时语音交互中的流式处理优化。

原创 2025-02-18 17:07:42 · 2599 阅读 · 0 评论
开源音色转换，实时/零样本，支持歌声seed-vc

目前发布的模型支持零样本语音转换🔊 、零样本实时语音转换🗣️ 和零样本歌声转换🎶。无需任何训练，只需1~30秒的参考语音，即可克隆声音。支持进一步使用自定义数据进行微调，以提高特定说话人的性能，数据需求门槛极低（每位说话人至少1条语音），训练速度极快（最少100步，在T4上只需2分钟）！实时语音转换支持约300ms的算法延迟和约100ms的设备侧延迟，适用于在线会议、游戏和直播。要查看演示和与之前语音转换模型的比较，请访问的演示页面🌐 和评估结果📊。

原创 2025-02-10 12:49:05 · 1129 阅读 · 0 评论
阿里通义实验室发布Textoon：AI秒变2D卡通角色，语音驱动开口说话！

Textoon 是由阿里巴巴通义实验室开发的一种可以通过文本描述自动生成 2D 卡通角色的智能系统。它可以在一分钟内生成一个可动画的 2D 角色，并且这个角色可以像 3D 动画一样动起来、眨眼、张嘴说话！核心优势🔥 比手工 Live2D 角色制作快 100 倍！🔥 比传统 AI 生成更精准、更生动！🔥 比普通 Live2D 更容易修改、更强大！🔥 支持语音驱动，让角色真正“开口说话”！🚀 Textoon = AI + Live2D + 语音动画，一站式解决 2D 角色创作！

原创 2025-02-10 10:31:28 · 702 阅读 · 0 评论
【0208更新】阿里开源语音克隆CosyVoice2 整合包

阿里开源语音克隆CosyVoice2 整合包[新增prompt文字识别]

原创 2025-02-08 12:14:08 · 955 阅读 · 2 评论
CosyVoice /F5-TTS /GPT-SoVITS /Fish-Speech 开源语音克隆与文本转语音（TTS）项目的对比整理

GPT-SoVITS（5秒样本） > CosyVoice（3秒样本）。：F5-TTS > CosyVoice（流式）；在长文本合成中可能出现异常音调，需参数调优；：仅CosyVoice支持细粒度指令调整；生成音频可能伴随底噪，需后处理优化。并列稳定性最佳，适合商业应用；

原创 2025-02-07 23:15:55 · 5682 阅读 · 1 评论
腾讯 Hunyuan3D-2：高分辨率3D 资产生成

在当今数字化时代，3D 资产生成技术正变得越来越重要。无论是游戏开发、影视制作还是虚拟现实领域，高质量的 3D 模型和纹理都是创造沉浸式体验的关键。然而，传统的 3D 资产制作往往需要大量的时间和专业技能。幸运的是，腾讯的 Hunyuan3D-2 项目为我们带来了新的希望，它通过大规模扩散模型实现了高分辨率 3D 资产的高效生成。Hunyuan3D-2 是腾讯推出的一个先进的大规模 3D 合成系统，旨在生成高分辨率的纹理化 3D 资产。

原创 2025-01-22 10:44:00 · 1511 阅读 · 0 评论
开源AI写小说-RWKV-Runner：基于RWKV模型的多功能AI助手

RWKV-Runner是一个开源项目，由josStorer开发并托管在GitHub上。它基于RWKV模型，提供了丰富的功能和便捷的操作方式，旨在为用户提供一个简单易用且功能强大的AI助手。RWKV-Runner作为一个基于RWKV模型的多功能AI助手，凭借其丰富的功能、灵活的部署方式和良好的用户体验，为用户提供了极大的便利。无论是日常聊天、写作辅助还是音乐创作，它都能满足用户的需求。如果你对AI助手感兴趣，不妨尝试一下RWKV-Runner，相信它会给你带来意想不到的惊喜。

原创 2025-01-09 21:39:29 · 1411 阅读 · 1 评论
#Phi-4：微软 14B 参数开源模型，性能匹敌 OpenAI GPT-4o-mini，现已登陆 Ollama

Phi-4 作为微软推出的最新小型语言模型，在仅有 140 亿参数的情况下，通过创新的训练方法和高质量的数据，展现出了媲美甚至超越一些更大规模模型的性能。它在数学推理、编程任务、长文本处理等多个领域都表现出色，为人工智能技术的发展提供了新的思路和可能性。Phi-4 的成功也证明了在模型设计中，数据质量的重要性不亚于模型规模。

原创 2025-01-09 11:51:33 · 2209 阅读 · 0 评论
开源工具tdl 导出 Telegram 聊天记录比官方的更快更好用

tdl 是一款非常实用的 Telegram Downloader，能够帮助我们轻松导出 Telegram 聊天记录。

原创 2025-01-08 21:16:17 · 2525 阅读 · 0 评论
开源免费GitHub搭建资源分享站

一个可使用GitHub Pages部署基于 HTML、CSS 和 JavaScript 开发的资源列表展示系统

原创 2025-01-08 10:54:53 · 1477 阅读 · 0 评论
Sonic：开源Go语言开发的高性能博客平台

Sonic，一个以其速度如声速般快速而命名的博客平台，是一个用Go语言开发的高性能博客系统。正如其名字所暗示的，Sonic旨在提供一个简单而强大的博客解决方案。这个项目受到了Halo项目团队的启发，前端部分是基于Halo项目的分支。

原创 2025-01-01 19:14:28 · 1267 阅读 · 0 评论
LANDrop：跨平台的开源免费局域网文件传输工具

所有必要的个人数据都完全且仅存储在用户的设备上。此外，LANDrop还会收集匿名的分析和使用数据，以改善应用的性能和功能，但不会包含任何个人数据。今天，我们将介绍一款名为LANDrop的跨平台文件传输工具，它不仅开源免费，而且支持iOS、Android、macOS、Windows和Linux等多个平台。LANDrop以其开源、免费、跨平台和高安全性的特点，成为了局域网文件传输的理想选择。LANDrop使用先进的协议，提供接近线速的传输速度，并采用军用级别的加密和认证，确保传输的安全性。

原创 2024-12-31 21:56:04 · 4097 阅读 · 0 评论
AI驱动的PDF翻译保留排版格式-PDFMathTranslate

PDFMathTranslate以其强大的功能和用户友好的设计，为跨语言PDF文档处理提供了一个全新的解决方案。随着AI技术的不断进步，我们可以预见，PDFMathTranslate将在未来的文档翻译领域扮演更加重要的角色。今天，我要介绍一款革命性的工具——PDFMathTranslate，它不仅能够实现PDF文档的全文双语翻译，还能完整保留原文的排版和格式。让我们来看一个实际案例。PDFMathTranslate背后的技术基于最新的机器学习算法，能够理解复杂的文档结构，并进行精准翻译。

原创 2024-12-31 17:35:22 · 1765 阅读 · 0 评论
DeepSeek-V3：新一代AI模型的突破与开源

DeepSeek-V3的发布不仅是技术的一次飞跃，更是开源精神的体现。它不仅在性能上与世界顶尖的闭源模型媲美，更以开源的方式，推动了人工智能技术的普惠发展。我们期待DeepSeek-V3在未来能够带来更多的创新和突破，为AI领域的发展贡献力量。

原创 2024-12-27 10:59:30 · 1428 阅读 · 0 评论
DeepSeek-V3 与 DeepSeek-V3-Base：两大模型对比解析

近年来，随着人工智能技术的飞速发展，大型语言模型（LLM）在自然语言处理、代码生成、数学推理等领域的应用越来越广泛。：在 MMLU、DROP、LiveCodeBench 等基准测试中表现优异，尤其在数学推理和代码生成任务中超越了许多开源和闭源模型。：开源 FP8 权重，支持 SGLang、LMDeploy、TensorRT-LLM 等工具，用户可在不同硬件平台上高效运行。：主要针对编程任务，尤其是在多语言编程测评中表现突出，适合开发者用于代码生成和优化。

原创 2024-12-27 10:55:58 · 15060 阅读 · 0 评论
PyInstaller详细打包教程 - 从入门到进阶

PyInstaller是一个功能强大的打包工具，通过正确的配置和使用，可以轻松将Python应用打包成独立可执行文件。仔细规划项目结构合理处理资源文件注意平台兼容性做好测试验证。

原创 2024-12-26 15:06:20 · 1196 阅读 · 0 评论
使用Nuitka打包Python应用程序完整教程

Nuitka是一个Python的替代编译器,它可以将Python代码编译成独立的可执行程序。更快的执行速度更小的文件体积更好的兼容性支持所有Python特性Nuitka是一个强大的Python打包工具,通过正确配置可以轻松将Python应用打包成独立可执行文件。本文介绍的命令和参数可以满足大多数打包需求,如遇到特殊情况可以查看Nuitka的官方文档获取更多信息。Nuitka官方GitHub仓库: https://github.com/Nuitka/Nuitka。

原创 2024-12-26 15:00:07 · 1082 阅读 · 0 评论
Ollama-OCR：利用视觉语言模型从图像中提取文本

Ollama-OCR利用视觉语言模型从图像中提取文本。本文将介绍 Ollama-OCR 的关键特点、安装方法、快速开始指南以及输出格式的详细信息。需安装:ollama https://ollama.com/download。

原创 2024-12-23 21:41:03 · 2232 阅读 · 0 评论
开源数字人直播DH_live web整合包免训练使用教程

七木数字人web交互系统主要实现:免训练数字人视频制作和实时语音数字人可搭配一些直播场控软件的语音驱动数字人进行直播「数字人(可直播用+数字人视频制作)」链接：https://pan.quark.cn/s/2e06a0249917。

原创 2024-12-23 15:30:30 · 2743 阅读 · 0 评论
开源6.5K InStock股票系统win整合包：量化投资的利器

InStock股票系统是一个功能全面的量化投资工具，它能够抓取每日股票、ETF的关键数据，计算股票指标，识别K线形态，综合选股，并支持选股策略和股票验证回测。该系统支持自动交易，并适配PC、平板和手机等多种设备。

原创 2024-12-18 11:19:25 · 2353 阅读 · 0 评论
开源手机无线投屏PC脚本反控手机scrcpy

解压后运行start_wifiConnect.bat。通过usb开启手机端口后可用无线投屏反控手机。如需反控手机,需开启USB调试(安全模式)

原创 2024-12-14 22:17:09 · 756 阅读 · 0 评论
Meta Llama 3.3 70B：性能卓越且成本效益的新选择

在人工智能领域，大型语言模型一直是研究和应用的热点。Meta公司最近发布了其最新的Llama系列模型——Llama 3.3 70B，这是一个具有70亿参数的生成式AI模型，它在性能上与4050亿参数的Llama 3.1相媲美，但成本更低。

原创 2024-12-07 10:47:15 · 691 阅读 · 0 评论
Fish Speech 更新1.5: 世界第一开源 TTS 模型(附win整合包)

Fish Speech V1.5 是一种领先的文本转语音（TTS）模型，基于超过 100 万小时的多种语言音频数据进行训练。项目地址:https://github.com/fishaudio/fish-speech。

原创 2024-12-06 19:38:06 · 3492 阅读 · 5 评论
全能OCR神器GOT-OCR2.0整合包部署教程

本文提供了关于GOT-OCR2.0项目的安装和使用指南，包括NVIDIA显卡驱动、CUDA工具包和cuDNN的安装步骤，以及如何验证CUDA版本和使用整合包进行简单文本识别的说明。

原创 2024-09-20 11:58:33 · 2688 阅读 · 0 评论

Github开源项目

作者: 云樱梦海

无需邀请码的AI智能体-OpenManus横空出世

DeepSeek开源周第六天：极致推理优化系统，提高GPU计算效率

一文读懂 Pyarmor：保护你的 Python 脚本

DeepSeek开源第四天发布并行策略升级:DualPipe与EPLB技术

Anthropic推出混合推理模型：Claude 3.7 Sonnet,“可见扩展思维”技术,让AI像人类一样思考

字节跳动Phantom炸场！视频创作进入“复制粘贴”时代，小白也能当导演

重磅开源！昆仑万维发布AI短剧神器：免费+可控，视频创作零门槛！

马斯克放大招！Grok 3震撼发布：号称“地球上最聪明AI”，性能碾压GPT-4o？

业界首个一体化语音交互系统Step-Audio重磅开源！支持RAP/方言/情感控制的实时对话

开源音色转换，实时/零样本，支持歌声seed-vc

阿里通义实验室发布Textoon：AI秒变2D卡通角色，语音驱动开口说话！

【0208更新】阿里开源语音克隆CosyVoice2 整合包

CosyVoice /F5-TTS /GPT-SoVITS /Fish-Speech 开源语音克隆与文本转语音（TTS）项目的对比整理

腾讯 Hunyuan3D-2： 高分辨率3D 资产生成

开源AI写小说-RWKV-Runner：基于RWKV模型的多功能AI助手

#Phi-4：微软 14B 参数开源模型，性能匹敌 OpenAI GPT-4o-mini，现已登陆 Ollama

开源工具tdl 导出 Telegram 聊天记录比官方的更快更好用

开源免费GitHub搭建资源分享站

Sonic：开源Go语言开发的高性能博客平台

LANDrop：跨平台的开源免费局域网文件传输工具

AI驱动的PDF翻译保留排版格式-PDFMathTranslate

DeepSeek-V3：新一代AI模型的突破与开源

DeepSeek-V3 与 DeepSeek-V3-Base：两大模型对比解析

PyInstaller详细打包教程 - 从入门到进阶

使用Nuitka打包Python应用程序完整教程

Ollama-OCR：利用视觉语言模型从图像中提取文本

开源数字人直播DH_live web整合包免训练使用教程

开源6.5K InStock股票系统win整合包：量化投资的利器

开源手机无线投屏PC脚本反控手机scrcpy

Meta Llama 3.3 70B：性能卓越且成本效益的新选择

Fish Speech 更新1.5: 世界第一开源 TTS 模型(附win整合包)

全能OCR神器GOT-OCR2.0整合包部署教程

腾讯 Hunyuan3D-2：高分辨率3D 资产生成