抖音自动生成视频、字幕、自动上传发布

dy-auto是一个项目,它使用ffmpeg处理视频生成、添加语音和字幕,结合微软SpeechStudio的文字合成及whisper的语音生成字幕功能。该项目支持通过jieba3k进行文案关键词提取,并利用playwright进行自动化操作。用户需配置python环境、安装依赖并提供资源,程序会随机选取图片和文案生成视频并自动上传至抖音。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

dy-auto

✨ 抖音自动生成视频、字幕、自动上传发布✨

项目地址

点击进入https://github.com/Richard0403/dy-auto

录屏效果

https://github.com/Richard0403/dy-auto/assets/14147304/21400a42-9296-4956-9517-ced8d8bf4737

技术架构

名称功能
ffmpeg处理视频的生成,语音添加,字幕的添加等
微软SpeechStudio文字合成语音
whisper语音生成字幕
jieba3k用于文案的关键词提取
playwright用于自动化操作

项目结构

|-- DyPic                                      // 图片资源目录
|   |-- 建筑集                                  // 图片组1
|   |   |-- pic_0001.jpeg                     // 图片命名规则
|   |   |-- pic_0002.jpeg                     // 图片命名规则
|   |-- 可爱小动物                              // 图片组2
|   |   |-- pic_0001.jpeg                     // 图片命名规则
|   |   |-- pic_0002.jpeg                     // 图片命名规则
|-- DyText                                    // 文案文件夹
|   |-- 6_躺平真的会毁掉年轻人吗?.txt             // 文案话题(txt内部的见解用#分割)
|-- dy_auto                                    // 代码目录
|   |-- main.py 主程序入口

使用教程

  1. 环境配置
        * python 3.10.11
        * ffmpeg 安装
  2. 账号注册 
        * 微软speech studio, 注册入口
        * 拿到资源密钥和地区名称, 填入speech_voice_gen.py 的speech_key 和 service_region字段中
  3. 安装依赖库
       * pip install -r requirements.txt
  4. 准备图片和文案资源(项目文件结构见下文)
       * 文件夹准备: 在项目文件夹同级,新建DyTemp、DyText、DyPic文件夹
       * 图片资源: 格式见目录DyPic
       * 文案资源: 格式见目录DyText
  5. 获取token
       * 先执行该命令,扫码登录,成功后关闭浏览器, 会自动保存cookie
           playwright codegen www.douyin.com --save-storage=cookie.json    
  6. 运行
       * 程序运行入口 main.py

项目执行流程

image.png

注意

1.文案和图片的使用是随机获取的

2. whisper运行默认不使用GPU,为了使用GPU, 安装如下依赖

pip uninstall torch 
pip cache purge 
pip install torch -f https://download.pytorch.org/whl/torch_stable.html
  1. 可实现多个账号循环上传

声明

本项目只做个人学习研究之用,不得用于商业用途!更不可用于违反法律道德商业等不良用途,使用者责任自负!

### 音视频字幕提取方法 对于从音视频中提取字幕并生成标准的 SRT 或 VTT 文件,可以采用多种方式实现自动化或手动处理。 #### 自动化方案 一些第三方工具和服务能够帮助完成这一过程。例如,快转字幕是一个有效的解决方案[^1]。此平台利用先进的语识别技术来转换频内容为文字形式。用户上传目标视频至该网站后,系统会自动生成对应的文本字幕。之后,这些字幕可以通过特定功能导出成所需的SRT或者VTT格式文件。 如果希望不依赖外部服务而是在本地环境中操作,则可能需要用到编程手段结合开源库如 `pydub` 和 `speech_recognition` 来抓取声数据,并调用谷歌云API或其他类似的在线语到文本的服务接口来进行翻译工作;最后再借助 Python 的 subtitle 库将得到的文字序列按照时间戳整理成为正式的字幕文档。 #### 手动方案 当不具备条件使用上述提到的技术途径时,也可以考虑采取较为传统的方法——即先下载含有内置硬编码字幕音视频片段(注意版权),接着运用专业的视频编辑软件比如 Adobe Premiere Pro, Final Cut Pro X 等读取出其中嵌入式的字幕信息,进而保存下来作为独立的 .srt 或者.vtt 文件。 ```python import speech_recognition as sr from pydub import AudioSegment # 假设已经有一个名为audio_file.wav的声文件 r = sr.Recognizer() with sr.AudioFile('audio_file.wav') as source: audio_data = r.record(source) text = r.recognize_google(audio_data) print(f"Transcribed Text: {text}") ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值