- 博客(277)
- 资源 (17)
- 问答 (2)
- 收藏
- 关注

原创 我试用了5款文本转语音工具后的真实感受
【5款TTS工具实测推荐】作为内容创作者测试了AI易配音、Google TTS等主流文本转语音平台。AI易配音凭借8万字符免费额度、300+音色免费使用、独特情感标签功能(如(愤怒)(高兴)语调转换)和多格式支持成为首选,尤其适合视频配音和有声读物制作。Google TTS技术强但操作复杂,Natural Reader适合简单文档朗读,Balabolka需离线安装,Speech2Go功能较基础。综合比较显示AI易配音在免费程度、音质效果和易用性上表现最佳,是个人创作者的性价比之选。建议优先试用其免费功能满足
2025-08-04 10:58:57
12132
10

原创 推荐几个常用免费的文本转语音工具
文本转语音技术正在不断发展,为内容创作带来新的可能性。从简单的文本朗读到富有情感的多角色配音,这些免费工具已经能够满足大部分创作者的需求。如果你正在寻找一款功能全面、支持中文且特别适合小说转语音的工具,我强烈推荐尝试AI易视频。它不仅提供基础的文本转语音功能,还有文本翻译和小说角色配音等特色功能,能够帮助你更高效地创作优质内容。无论你是内容创作者、教育工作者还是有声书爱好者,这些工具都能为你的项目增添语音元素,提升内容的可访问性和吸引力。选择适合自己需求的工具,开始探索文本转语音的无限可能吧!
2025-05-13 14:37:26
12697
12

原创 从零开始,手把手教你搭建Lerobot机械臂
SO-ARM100是一款具备 6 自由度、支持 3D 打印、极具性价比的开源机械臂。Lerobot是个开源机器人的解决方案,可基于act的强化学习框架训练SO-ARM100模仿人的操作,当然也可以是其他机械臂。如果没人指导,还是有点麻烦的,好在AI还能帮点忙,不然要退货了。目前简单抓取动作的成功率还行,看看能不能训个叠衣服的机械臂!还有做了些好玩的视频,分享在小红书账号上,感兴趣的可以看看。希望这篇教程对你有所帮助,快去动手试试吧!说不定还能给蚂蚁机器人助个力,哈哈。
2025-02-27 14:53:39
12638
14

原创 喜报! 祝贺KnowStreaming升级为首批银河计划成员
9月16日,中国信息通信研究院(以下简称“信通院”)主办的2022 OSCAR 开源产业大会在京成功举办,滴滴4项开源项目由可信开源社区共同体正式成员升级为首批银河计划(TWOS Galaxy 2022)成员,会上、DoKit、LogicFlow、Delta 4位项目代表上台领取了奖杯,未来将与信通院及各成员单位一起聚焦开源技术,共同学习成长,提升创新能力,推动开源产业生态完善。
2022-10-08 14:04:48
12258
8

原创 多图详解kafka生产者消息发送过程
文章目录相关配置源码元信息数据的更新 METADATA发起ApiVersionsRequest获取Kafka版本信息发起MetadataRequest获取元信息信息Kafka服务接受到METADATA客户端收到Response, 更新元数据 ProducreMetaData生产者拦截器生产者拦截器详解onSend(ProducerRecord今天我们来通过源码来分析一下,生产者发送一条消息的所有流程~~~相关配置参数说明默认/示例key.serializerkey的序列化器,需要
2022-04-29 08:30:00
10014
38

原创 【kafka运维】Kafka全网最全最详细运维命令合集(精品强烈建议保存)
本文所有命令,博主均全部操作验证过,保证准确性; 非复制粘贴拼凑文章; 如果想了解更多工具命令,可在评论区留下评论,博主会择期加上;kafka-topics.sh、kafka-configs.sh、kafka-reassign-partitionskafka-console-producer.sh、kafka-console-consumer.sh、kafka-leader-election、kafka-verifiable-producer.sh、kafka-verifiable-consumer、
2021-06-25 11:48:00
54351
56
原创 Nano Banana:下一代AI图像创作与编辑指南
Nano Banana,一个在技术圈引发轰动的AI图像工具,其神秘代号的背后是谷歌的最新杰作:Gemini 2.5 Flash Image。根据谷歌首席执行官 Sundar Pichai 在社交媒体上的推文以及谷歌开发者博客的官方介绍,Nano Banana 并非一个独立模型,而是 Gemini 2.5 Flash Image 在早期测试阶段所使用的内部代号。这一正式身份的揭晓,将这款被誉为“史上最强AI图像编辑器” 的工具,正式纳入了谷歌强大的AI生态系统。
2025-08-31 19:41:54
417
原创 长篇音频制作(小说自动配音)完整教程
智能分章节管理:支持将长文本分割成多个章节,便于管理和制作多角色音色配置:为不同角色分配专属音色,让音频更生动AI智能分段:自动识别对话内容并分配给对应角色灵活的音频控制:精确调节每个片段的音量、语速、音调多种片段类型:支持TTS语音、静音间隔、上传音频文件批量处理:一键批量生成所有音频片段无缝音频合并:自动将所有片段合并为完整音频AI易配音使用AI语音合成技术支持多种音色选择可调节语速、音调、音量在音频中插入静音间隔用于段落间的停顿可精确设置静音时长上传自定义音频文件。
2025-08-13 09:43:13
12249
11
原创 推荐几个常用免费的文本转语音工具
本文推荐了5款免费文本转语音(TTS)工具,满足不同创作需求。重点介绍了国产平台AI易视频的特色小说转语音功能,能智能识别角色对话并分配不同音色,适合有声书制作。其他推荐包括Google Text-to-Speech的高质量语音合成、Natural Reader的文档朗读功能、Balabolka的批量离线处理以及Speech2Go的便捷网页版。文章对比了各工具的特点,建议创作者根据场景选择,特别推荐AI易视频的中文支持和多角色配音功能,为数字内容创作提供便利。
2025-06-30 15:10:47
12108
11
原创 AI数字人模型研究分析报告
数字人模型研究综述 本文系统分析了当前主流数字人技术模型,包括已集成的Wav2Lip、MuseTalk等4种模型和7种新兴开源方案。Wav2Lip适合实时直播,资源消耗低;MuseTalk效果最佳但需高端GPU;UltraLight专为移动端优化。新兴模型中,LivePortrait和EchoMimic V2表现突出,后者推理速度提升9倍。SadTalker适合短视频制作,Hallo提供影视级效果但资源需求极高。FaceChain专注于静态头像生成。整体来看,不同模型在实时性、效果质量和硬件需求间各有侧重,
2025-06-21 22:48:11
11989
原创 微软Build 2025五大AI发布
微软Build 2025大会重磅发布五大AI创新 引领开放式智能代理网络新时代GitHub推出自主AI编码代理 Copilot升级实现无代码AI定制 让编程更便捷高效其他亮点包括 提升AI模型可解释性 增强开发者工具 以及拓展AI应用场景微软AI战略布局加速推进 为开发者和用户带来更智能更便捷的未来体验 值得关注
2025-05-25 20:35:13
12255
原创 Anthropic放弃“世界最佳编码模型”
Anthropic重磅发布Claude 4系列AI模型 其中包括号称全球最佳编程模型的Claude 4 Opus和Sonnet 在微软谷歌等巨头纷纷发布AI新品的背景下 Anthropic的这一举动无疑为近期AI热潮再添一把火 Claude 4系列大幅提升了自主编程能力 为人工智能发展树立新的里程碑 赶快了解这一改变游戏规则的AI模型吧 它将如何影响你的工作和生活呢
2025-05-24 20:31:54
11557
1
原创 Claude 4 & Claude Code 正式发布,Anthropic API 新增四项新功能
Claude Opus 4 是全球顶级的编码模型,在复杂、长周期任务和智能体工作流方面表现出持续的卓越性能。Claude Sonnet 4 是对 Claude Sonnet 3.7 的一次重大升级,提供了卓越的编码和推理能力,同时能更精确地响应您的指令。Claude Opus 4 和 Sonnet 4 是混合模型,提供两种模式:近乎即时的响应和用于更深度推理的扩展思考。Claude 的 Pro、Max、Team 和 Enterprise 计划均包含这两款模型及扩展思考功能,。
2025-05-23 10:08:06
12872
1
原创 微软宣布的五大重要事项|AI日报0520
微软在Build大会上宣布了五大重要事项,旨在通过开放的智能体网络重塑技术栈,助力开发者构建赋能应用。首先,GitHub Copilot升级为编码智能体,可自主完成代码任务。其次,Copilot可学习公司独特语言风格,放大专业知识。第三,智能体工厂Foundry支持更多模型,集成多种服务。第四,NLWeb项目允许用自然语言与网站交互。最后,Microsoft Discovery整合技术栈,加速科学研究。此外,VS Code计划成为开源AI编辑器,坚守开放、协作原则。其他重大消息包括GitHub Copilo
2025-05-20 12:29:27
12702
原创 AI 图像生成再升级
宝马与阿里巴巴合作推出AI汽车 这一消息引发了人们对未来智能驾驶的期待 AI汽车将整合阿里巴巴的云计算和大数据技术以及宝马的汽车制造经验 为用户提供更智能更便捷的驾驶体验 除了AI汽车 本周AI领域还有其他值得关注的进展 Ideogram 3.0图像模型的发布以及GPT-4o的图像生成能力让AI创造力达到了新高度 AI技术正在不断革新我们的生活方式 让我们拭目以待未来AI技术将如何改变世界
2025-03-27 19:35:18
12654
原创 Gemini 2.5 荣登 AI 排行榜榜首
Google凭借其强大的新Gemini 2.5 Pro模型重回AI排行榜榜首 该模型在推理 数学 科学和编码等基准测试中占据主导地位 然而随着AI以闪电般的速度持续发展 以及OpenAI等竞争对手正在准备下一代模型 Google能保持王座多久呢
2025-03-26 19:03:01
12793
原创 AI 的“摩尔定律”出现
AI 能力正在快速发展 类似于摩尔定律 近期研究表明 自2019年以来 AI 完成任务的能力每7个月翻一番 如今 AI 系统能够处理长达一小时的人类任务 预计到2030年它们将能够处理长达一个月的项目 这意味着自动化浪潮即将到来 世界是否已经准备好迎接这一挑战
2025-03-20 19:55:52
13042
原创 英伟达“AI 超级碗”开幕
Nvidia CEO Jensen Huang 在其“AI超级碗”演讲中,展示了公司最新的芯片 个人超级计算机 星球大战风格的机器人以及自动驾驶车队 这些创新展示了 Nvidia 在人工智能和机器人领域的巨大进步 黄的演讲预示着该公司可能迎来爆炸性增长 这次活动涵盖了广泛的主题 从强大的新AI芯片到先进的机器人系统 都展现了 Nvidia 在人工智能领域的领导地位
2025-03-19 22:43:32
2101
原创 中国发布 GPT-4.5 竞争对手,成本仅为其百分之一 | AI日报0317
中国科技巨头百度发布两款强大 AI 模型 它们的成本仅为 OpenAI 的 GPT-4.5 的百分之一 这一举措可能引发全球 AI 价格战 百度宣称其模型性能卓越 价格极低 这将为用户提供更实惠的 AI 解决方案 并且可能会改变 AI 市场的格局
2025-03-17 19:43:40
2593
原创 Google 的 Gemma 3 支持单 GPU 部署 | AI日报0313
Google 推出 Gemma 3 模型 突破 AI 效率瓶颈 支持单 GPU 部署 Gemma 3 具备高性能 多模态能力 可在设备端运行 消除对大规模计算的需求 此外 Gemini Flash 新增图像生成功能 进一步扩展了 AI 的应用范围
2025-03-13 19:18:08
2428
原创 OpenAI 新代理工具包 | AI日报0312
OpenAI 发布了一款新的 AI 代理工具包 允许企业构建自己的自主助手 这标志着 AI 代理领域向前迈出了一大步 该工具包集成了网页浏览 文件管理和计算机使用等功能 旨在将 AI 代理从炒作转化为企业级的现实 这对于人工智能爱好者来说是一个重大新闻 让我们一起探索 OpenAI 如何改变 AI 代理的未来
2025-03-12 19:29:42
2595
原创 麦当劳 AI 重塑
麦当劳正在其全球餐厅部署人工智能系统 这家快餐巨头希望通过 AI 数据分析 预测性维护和 AI 经理实现技术升级 然而 解决其屡屡出故障的冰淇淋机可能是真正的考验 麦当劳的 AI 驱动餐厅将如何改变顾客的体验 以及 AI 在解决其运营挑战中能发挥多大作用 这些都值得我们期待
2025-03-11 20:08:23
2684
原创 苹果的 AI 紧急情况
苹果计划推出全面升级的Siri 然而该项目面临重大延期 据报道 升级后的Siri 可能要到2027 年才能推出 由于像亚马逊这样的语音助手竞争对手不断推进 苹果的 AI 推出计划正迅速演变成一场内部紧急事件 这对于希望看到 Siri 赶上人工智能热潮的 Apple 用户来说 或许是一个令人失望的消息
2025-03-03 19:40:32
2295
原创 OpenAI 人工智能政策蓝图 | AI日报0114
OpenAI发布了其美国人工智能政策蓝图 旨在共享人工智能带来的繁荣 与此同时 美国政府也发布了关于先进芯片的全球控制新规 这引发了关于美国人工智能战略是否将面临十字路口还是加速推进的讨论 本文将深入探讨这些最新发展 并分析其对未来人工智能行业的影响 让我们一起关注人工智能领域的最新动态
2025-01-14 19:40:50
3630
2
原创 自然语言处理基础:全面概述
这篇文章深入浅出地讲解了自然语言处理 (NLP) 的基础知识,从其核心概念和技术入手,阐述了 NLP 的重要性、组成部分、NLU 和 NLG 的集成、NLP 面临的挑战以及未来发展方向。无论你是初学者还是 NLP 行业的专业人士,这篇文章都将为你提供全面的解读和深入的洞察。
2025-01-10 13:34:06
4332
1
原创 Omi的“读心术”AI可穿戴设备 | AI日报0109
Omi推出革命性AI可穿戴设备 旨在读取你的思想 提升生产力 Omi承诺通过始终在线功能和脑机接口技术实现这一目标 但它能否克服过去AI可穿戴设备面临的挑战 此外 文章还报道了Adobe的AI视觉效果工具TransPixar 将任何视频转换为即时教程以及微软开源强大的Phi-4模型 探索未来AI技术发展趋势 尽在本文中
2025-01-09 19:47:54
4174
2
原创 英伟达开启“AI 代理时代” | AI日报0108
Nvidia 宣称即将开启“AI 代理时代” AI 代理将像智能手机一样普及 这家芯片巨头发布了多项重磅 AI 和机器人技术 旨在成为 AI 代理革命的核心 同时 Panasonic 与 Anthropic 合作推出 AI 健康应用 帮助用户更好地了解自己的健康状况 Nvidia 在 CES 2025 上宣布了这些消息 并表示 AI 代理将改变我们的生活方式 让我们拭目以待 AI 代理将如何改变我们的未来
2025-01-08 19:38:34
3834
5
原创 OpenAI 宣称已掌握构建通用人工智能 (AGI) 的方法| 0107AI日报
OpenAI 创始人 Sam Altman 宣布他们已经掌握了构建通用人工智能 AGI 的方法 这意味着超级智能和强大的 AI 代理即将到来 我们对未来的认知可能将发生前所未有的改变 除了 OpenAI 的突破 三星在 CES 2025 上全面押注 AI 并展示了其在该领域的最新进展 同时 研究表明 AI 钓鱼攻击的成功率令人震惊 提醒我们 AI 技术带来的潜在风险
2025-01-08 10:44:25
4100
2
原创 Sam Altman 的奇点猜想 | AI日报0106
Altman 发布隐晦的奇点评论微软计划投资 800 亿美元用于 AI 基础设施通过高级 AI 推理解决复杂问题患者通过思维控制 AI 和机器人阅读时间: 5分钟。
2025-01-06 20:56:16
4559
9
原创 OpenAI CEO 奥特曼发长文《反思》
OpenAI CEO 奥特曼发表长文《反思》,回顾了从 ChatGPT 到 AGI 的探索之路。文章回顾了 OpenAI 创立的初衷,当时很少有人相信他们能够成功。2022 年,OpenAI 推出了 ChatGPT 并迅速走红,这证明了他们对 AGI 的研究方向是正确的。文章也强调了 OpenAI 在开发 AGI 的过程中所面临的挑战和机遇。奥特曼在文章中分享了自己的反思,以及对未来 AGI 发展的展望,并呼吁人们关注 AGI 的伦理问题和社会影响。
2025-01-06 16:48:56
3575
原创 未来还有真实的内容创作吗
这篇文章揭示了一个由 AI 生成的视频是如何成功骗过数千名网民的,包括作者本人。视频模拟真实情感,引发共鸣,展现了 AI 技术在创造逼真内容方面的惊人能力。文章分析了 AI 技术的进步和对未来社会的影响,引发了人们对 AI 伦理和真实性问题的思考。
2025-01-03 13:13:03
4328
10
原创 教AI像六年级学生一样思考并像孩子一样学习
文章探讨了AI学习和思考方式的局限性 并提出了一种全新的思路 让AI像六年级学生一样思考并像孩子一样学习 文章指出 AI缺乏像小学生一样的好奇心 游戏性和解决问题的韧性 这导致了AI在跳出框架思考方面存在不足 文章以AI图像生成为例展示了AI近年来取得的巨大进步 但同时也强调了AI需要学习像孩子一样思考和学习才能更进一步 文章最后提出了一个问题 是否可以创造一个拥有想象力 惊奇和好奇心的AI 并以此作为人类创造力的伙伴
2025-01-02 18:13:07
4061
2
原创 你应该了解的5个AI编程工具
AI编码助手在几个月前才开始受到关注,当时Cursor因其与Claude 3.5 Sonnet语言模型的出色表现而走红。如今,越来越多强大的工具可以通过简单的文本描述生成全栈网络应用。这仅仅是个开始。到2025年,我们可能会看到更先进的编程工具。Anthropic的计算机使用功能已经允许Claude通过简单的交互控制用户的PC。想象一下,可以告诉AI构建应用,它就能使用你计算机上的不同工具为你处理一切。
2025-01-02 10:38:18
5042
19
原创 OpenAI 的 o3 — AGI 还是闪亮的幻影?
OpenAI 在圣诞节前宣布的 o3 模型并没有悄无声息地进入,而是突然出现,其开创性的能力引发了人们的喝彩,例如解决复杂的谜题和在编码方面表现出色,以及人们对其成就是否真正标志着 AGI 到来的质疑。是的,o3 可以解决研究生级别的数学问题,但它可以被要求推断家庭争吵中的动机或在危机中即兴发挥,而它却无法做到。我们所看到的东西可能会塑造未来,不仅提供对人工智能的愿景,也提供当我们敢于梦想并与我们自身的局限性作斗争时,我们可能成为的样子。从灼伤的感觉到掉落的勺子的重量,我们的身体塑造了我们理解世界的方式。
2024-12-31 19:00:00
3011
1
原创 亚马逊云科技2024 re:Invent大会亮点:Nova大模型与AI基础设施全面升级
2024 re:Invent大会展示了AWS在AI时代的雄心和实力。从Nova系列大模型到全面升级的AI基础设施,再到简化AI开发的新工具,AWS正在为即将到来的AI浪潮做全面准备。这不仅将加速企业的AI转型进程,也可能重新定义整个云计算和AI行业的格局。对于开发者、企业用户和整个技术生态系统来说,这无疑是一个充满机遇和挑战的新时代的开始。除了这次大会新发布的nova模型,AWS还有更多有趣的AI模型实验,快戳下方链接进入云上实验室开始体验吧!注册即可免费体验24小时快冲!
2024-12-10 18:17:44
18809
25
原创 写代码还有专业的编程显示器?
从一开始质疑、到最后的真香从我不需要显示器,到我必须要拥有一台揭示着我对这个品牌的认可。对大众来说,它是一个不错的产品对于一个程序员来说,我觉得它是一个优秀的产品因为我觉得它是真的站在程序员的视角去看待问题解决问题。优秀的色彩显示效果、合适的屏占比、极致护眼、专业的编程模式、自动旋转、桌面分区、自带音响、等等这些功能让我觉得它值这个价格。但是也有一些让我觉得需要改进的地方过于笨重、自动旋转不够灵敏、等等。那么,这么一台显示器,你觉得如何?
2024-10-14 10:14:04
20430
14
原创 苹果AI时代:Apple Intelligence能否守护隐私与未来?
最近,苹果展示了其人工智能底牌,推出了Apple Intelligence(重新定义AI),这是一套基础模型,将极大地改变苹果消费者使用其产品的方式。虽然仍需在实际中证明自己,但它是一个强有力的演示,至少从普通用户的角度来看,在 UI/UX 级别的消费级 AI 方面,它与其竞争对手(主要是谷歌和微软)处于同一水平。然而,昨天的演讲在某些方面也承认了失败,更重要的是,它可能背叛了苹果建立其品牌的基础之一——数据隐私,以至于马斯克已经威胁要禁止在他们的公司使用苹果产品。
2024-06-14 08:30:00
5770
原创 AI日报0610 -- Prompt这样改,AI成本瞬降20%!
ChatGPT 最新更新引入了“后台对话”功能,让您在使用其他应用程序或屏幕关闭时继续聊天。约翰霍普金斯大学研究发现,在思路链提示中添加“简洁”指令可以缩短 AI 响应长度,微软正在对其新的 Recall 设备上的 AI 功能进行更改,新增加密保护。人工智能图像生成技术的提升,可能使我们身边的虚拟品牌大使和模特逐渐增多。虽然回忆功能带来了便利,但也引发了隐私问题,新措施将帮助缓解这些担忧。测试显示,简洁指令使响应长度缩短约 50%,对准确性影响极小。Recall 功能将默认关闭,用户需手动选择加入。
2024-06-10 22:14:15
6803
原创 ChatGPT-4o 有何特别之处?
有趣的是,它包括实时视频处理等强大功能,这一关键功能最终可以让我们创建强大的虚拟助手,实时支持我们的日常生活。在不使模型的主干(LLM)本身更加智能的情况下,能够跨多种模态进行推理的模型必然会更加智能,因为该模型不仅具有更多功能,而且还能够在不同数据类型之间传递知识。总而言之,ChatGPT-4o 现在可以从文本以外的其他形式捕获信息,包括关键音频、图像或视频提示,以生成更相关的响应。在真正的多模态模型中,您可以向模型发送音频、文本、图像或视频,模型将根据需求使用文本、图像或音频(还不是视频)进行响应。
2024-05-31 16:33:19
7353
12
dubbo官方文档
2018-05-30
SpringMVC+FREEMARK+Redis
2016-10-26
Centos 7环境开发者环境初始化脚本
2018-12-26
MAC 的 ffmpeg
2018-12-21
SpringMVC4.0+MYBATIS3.0
2014-11-23
java基础 继承和多态实例
2014-07-16
ffmpeg for Linux
2018-12-21
JAVA实现GAME2048
2014-07-25
eclipse svn 插件下载
2015-08-21
早上早点起床可以学习两个小时
2021-04-29
OAUTH2.0授权登陆怎么保持登陆状态
2016-11-05
TA创建的收藏夹 TA关注的收藏夹
TA关注的人