- 博客(71)
- 问答 (1)
- 收藏
- 关注
原创 linux安装gitlab详细教程,本地管理源代码
GitLab 是一个用于仓库管理系统的开源项目,使用Git作为代码管理工具,并在此基础上搭建起来的Web服务。默认管理员账号为root,密码在/etc/gitlab/initial_root_password下面。大家在部署的过程中有遇到什么问题欢迎留言讨论,大家一起学习成长。接着咱们就可以创建项目、创建用户使用git管理您的代码了。不知道该更新什么文章了,写一篇最近部署的gitlab吧。其主要功能是供内部团队使用、协助、管理代码仓库。咱们来登录下,登录后记得修改下密码。别着急,记得看下启动成功后的输出。
2025-09-01 08:40:43
224
原创 Xinference详细搭建步骤及如何接入dify
Xinference 是针对生成式 AI 场景度身定制的能力全面的推理服务平台。附官网地址:https://xorbits.cn/
2025-08-28 08:43:50
360
原创 手把手教安装Ubuntu系统
这就是安装Ubuntu系统的整个过程,好几年前装过一次,但是过程忘光了已经,这次安装还算顺利。幸亏只是测试用的一个服务器,没什么影响,重装系统也就重装了,要不然罪过可就大了。大家在安装的过程中有遇到什么问题,或者其他文章的问题欢迎留言,大家一起讨论学习。服务器选择U盘启动,选择咱们刚下载的镜像文件,进入安装第一步。准备个新U盘,打开refus,选择镜像文件,点击开始。选择语言,找半天没找到中文,那就选择english吧。配置镜像地址,我这边没管,选择的默认的。第一步,直接选择默认的即可。
2025-08-18 08:53:43
277
原创 ComfyUI工作流不动了?
工作流跑到某一个节点然后就不动了,一直保持在这个节点,comfyui后台也没报错,也不输出内容。再看下控制台有报错输出没吧,还是一样,没有这一步的报错输出。盯着控制台的输出看了有一个wronging,ffmpeg_bin_path设置的不对,没有找到ffmpeg。下载了一个ffmpeg放到了这个目录下面,然后我的配置路径如下,可能别的版本路径会不一样。工作流跑到该节点的时候虽然有报错,但是终于有输出了,这就好处理了。还是报错,虽然报错,但是这些都是些常见问题了,缺少了一些安装包。---《通透》杨天真。
2025-08-14 08:43:15
621
原创 离线部署ollama与使用模型
找到我本地linux服务器上面以前下载的ollama模型,然后复制到这个没网络的服务器上面。注:刚开始我将模型文件复制错地方了,导致一直找不到模型文件,我复制到/home/user/.ollama下面了,只想着找到.ollama文件,复制到下面,没想到复制错了。所谓投资,无非是用现在的资源换取未来的资源。接着去添加dify即可,记得dify的网络要跟ollama的网络互通,可以将两个应用部署到同一台服务器上面。我这边已经下载好了,并且已经修改过了,后台回复“ollama”可拿到Linux安装包和脚本文件。
2025-08-11 09:12:29
371
原创 dify前端源码部署详细教程
我在这边刚开始时就是填的docker启动的那个ip跟端口,但是一直连不上后端服务,研究半天,后来连上这个服务地址才可以的。我本地原来下载的版本是20.0.0版本的,没关系,咱们再来下载个22版本以上的。注意:不能写docker启动后显示的那个后端地址,要写咱们docker部署的那版的web端连接的后端地址。咱们打开docker部署的那版web端,按F12,随便点几个按钮看下连的哪个地址,填到这里就可以了。哈哈,还算可以,就是发现个小问题,但是不影响使用,目前还不知道怎么回事。--- 财富自由之路。
2025-08-07 08:54:12
410
原创 LivePortrait--蒙娜丽莎的“笑”
这其实是快手开源的一款超好玩的表情同步(表情控制)项目,让静态图像生成动态视频。这款工具不仅可以用于人脸动画,还能扩展到动物肖像,提供了广泛的应用场景。用他们自己的视频测试的效果还不错,就如上面那个视频一样,但是一换成自己的视频生成的蒙娜丽莎头部就有点模糊,头还有点晃。--- 财富自由之路。总结:上传的视频头部不要乱晃,最好只有面部表情,否则生成的视频就会头部乱晃,模糊。前段时间网上比较火的梦娜丽莎人物图片脸部丰富表情的视频,今天咱们来复现下。我这边是已经安装过的,没有安装过的是install按钮。
2025-08-04 10:01:01
283
原创 win和Linux下载huggingface模型的方法
人活一辈子,最神奇的感受就是:明明大家身处同样的世界,头顶同样的蓝天,脚踏同样的大地,呼吸着同样的空气……这就是我通常下载huggingface上面模型的方法,本人通常使用第一种,简单快捷,如果大家在使用的过程中有什么问题的话欢迎留言,大家一起讨论学习。搭建环境,跑项目的时候经常要去上面下载模型,有些项目会自动下载,但是有些需要自己下载,这些需要自己下载的模型大家都是怎么下载的呢?起初,我不知道如何下载,都是使用的最笨的方法,打开huggingface的模型地址,一个一个手动下载。我最近经常使用这个方法。
2025-07-31 15:47:12
779
原创 coze开源了?咱们也来尝下鲜。附详细部署教程
在线模型服务的 model ID,在本示例中为火山方舟 doubao-seed-1.6 模型接入点的 Endpoint ID,获取方式可参考获取 Endpoint ID。听到重磅大消息,coze也开源了,当初从认识智能体就是从coze开始的,苦于当时项目原因需要本地化部署选择了其他开源的智能体项目。:在线模型服务的 API Key,在本示例中为火山方舟的 API Key,获取方式可参考获取火山方舟 API Key。发现这个开源版本不能线上配置模型,需要按照提供的配置模板配置,咱们以官方给的例子来测试下。
2025-07-28 12:14:57
427
原创 ComfyUI存在高危漏洞?看这篇来处理ComfyUI高危漏洞
近期,北京市网络与信息安全信息通报中心发现,ComfyUI存在任意文件读取、远程代码执行等多个历史高危漏洞(CVE-2024-10099、CVE-2024-21574、CVE-2024-21575、CVE-2024-21576、CVE-2024-21577),攻击者可利用上述漏洞实施远程代码执行攻击,获取服务器权限,进而窃取系统数据。咱们登录好后,会在comfyui下面生成一个login的文件夹,里面会生成一个password的文件,其实这里面就是存的咱们注册的账号密码了。---长安十二时辰。
2025-07-25 14:05:18
405
原创 ComfyUI怎样通过接口调用?如何接入dify?
有兴趣的同学可以研究下这个json文件,它其实就是comfyui工作流的一个一个节点,包含节点的参数,咱们可以将这些参数做成接口的参数,动态的将参数传进进接口中去。第二种:dify默认给咱们提供了comfyui的调用工具,咱们将导出的json文件填到右侧的json文件填写处即可。这就是我在使用comfyui的时候是如何使用的,大家在使用的过程中有遇到什么问题欢迎关注留言,大家一起讨论学习。使用的时候需要将咱们测试好的工作流导出为API形式的json文件,供咱们调用。 ---长安十二时辰。
2025-07-22 15:30:58
740
1
原创 纯离线(无网络环境)下部署dify,来看这篇
,但是最近遇到的一个客户网络环境比较特殊,是一个纯内网环境,也需要部署一个dify,接下来咱们来操作一下。命令格式如上,最好是 REPOSTORY:TAG格式的,打包了一个dify_all.tar名字的镜像包。对应的版本可以从GitHub上面下载,不过上面安装dify的时候已经下载下来了,直接复制下来就可以了。先找一台和客户服务器系统最好一样的服务器,提前部署一份dify,留作镜像打包使用。这是我在部署过程中的步骤,大家在部署过程中有遇到什么问题,欢迎留言,大家一起讨论学习。2、部署好后打包咱们的镜像。
2025-07-15 16:21:05
557
原创 Duix.Heygem数字人效果还不错
我这边的镜像地址没有按照git上面的说明上面去配置,我这个也能用,速度也挺快的就没配置,需要的话也可以将git上面的地址加进去。路径 只需选择到哪个文件夹下密码即可,后面的DockerDesktopWSL会自动配置好。解决完这个之后,咱们再来搭建下Duix.Heygem数字人吧,看下这个效果怎么样。大家在使用的过程中有遇到什么问题,或者有什么想实现的欢迎留言,大家一起讨论学习。readme贴心的提供了中文版的,有很详细的说明,照着步骤走就可以了。安装包里面我还带了一个这个安装包,安装下就可以直接使用了。
2025-07-10 16:24:02
477
原创 wsl中无法使用systemctl?看我怎么解决的
想部署一个数字人项目heygem,我想着这次就不用Ubuntu系统了,使用win10,然后利用win的子系统,装一个ubuntu使用,这样就跟Linux一样了,这样还方便点,想用win就用win,想用Linux就用Linux。想着新系统,就再找个版本新的win10系统吧,防止以后再出什么问题。再重启下,应该就可以了。一直不识别wsl命令,查了好长时间文档,原来是win10的版本有点低了。自己把Ubuntu系统卸载了重新安装,所有步骤重新来一遍,也没有解决。终于解决了,前前后后耗费了快三天时间了。
2025-07-10 09:35:02
458
原创 MimicMotion 让你的图片动起来
若不想去GitHub上面地址下载的话可以去我的网盘下载。MimicMotion 的核心在于其置信度感知的姿态引导技术,确保视频帧的高质量和时间上的平滑过渡。大家在使用的过程中有遇到什么问题,或者有什么想实现的功能欢迎留言,大家一起讨论学习。,Animate-X是由阿里推出的,两款的功能大致相同。如果是捕捉的是自己视频的动作,上传的图片是自己的图片,相信效果会不错。就算失败,我也想知道,自己倒在距离终点多远的地方。我的天呐,不忍直视,不过动作帧倒捕捉的挺好的。4090显卡跑了大概5分钟左右。
2025-07-04 10:12:05
277
原创 拿到一台新服务器,怎么跑AI项目
咱们来装下conda,这是一个python环境管理工具,想跑AI项目,这个基本上是必备的了,能很好的帮助我们管理各个ai环境。家风不仅仅是一种行为,而且是潜藏在这种行为背后的,一个更底层的价值理念,是他们看待这个世界的态度。公司新采购一台AI服务器,花大本钱装了个A6000显卡,今天来记录下新服务的使用步骤。大家在使用的过程中有遇到什么问题,或者有什么想实现的欢迎留言,大家一起讨论学习。conda 的安装比较简单,一直回车,等需要输入的时候,输入yes即可。这个没装,没关系,咱们来着手安装下。
2025-07-01 08:54:58
266
原创 大疆机场项目前后端、emqx、minio迁移,来看这篇文章
折腾半天,原来是老minio中的问题给新minio同步文件的时候可能漏传了几个文件,有的文件可以下载,有的不能下载。如果我重新部署emqx的话,最好端口不变,映射的互联网地址不变,内网ip变了不影响,如果互联网地址变了的话需要重新拿遥控器去绑定机场。机场项目的前后端倒没有和emqx服务在一起部署,但是机场的文件服务器minio和emqx在同一台服务部署着的,所以要迁移的话肯定这两块都得迁移。公司部署emqx的服务器突然出现问题,无法使用,但是机场项目需要的emqx在上面部署着呢,导致机场显示离线状态。
2025-06-27 08:53:08
497
原创 sonic一张人物图片和音频生成面部表情和动作视频工作流
git源码里面含有工作流,当然我已经下载好了,若需要可后台回复'sonic'可拿到工作流跟模型下载链接。大家在体验的过程中有遇到什么问题,或者有什么想实现的功能欢迎留言,大家一起讨论学习。我这个24G显存,生成3秒钟视频跑了大概140秒左右。comfyui的manger中搜索sonic,下载安装即可。,当然也可以直接下载win版的。接着咱们可以去下载节点。4、下载模型,模型文件放到models下面,文件结构如下。,今天咱们来实际操作下sonic的工作流。6、接着就可以进行测试了。话不多说,咱们开始开干。
2025-06-25 11:31:12
183
原创 语音克隆,数字人必备
下面是原上传音频的内容。支持语气(高兴、悲伤等),多语言,加速慢速,还可将克隆的音频设置成哼唱的。发现一个好用的语音克隆工作流,大家在做数字人视频的时候可以克隆自己的声音,或者别的好听的声音。大家在搭建的过程中有遇到什么问题,或者有什么想实现的功能欢迎留言,大家一起讨论学习。若服务器受网络限制可以先在本地下载好源码,再移到服务器上面安装。2、接着可以去comfyui的manger中安装此插件。上面是要克隆的内容,想说什么话就写到这里就行了。4、重启后就可以去体验下了。话不多说,咱们搭建下。
2025-06-24 09:58:28
262
原创 一键将web端打包成桌面端、手机端应用
4、打开后如图,左侧两个token分别代表beta版token和classic版token。支持mac、win、linux,同时也支持手机端安卓、iOS。不影响上传文件,我以前用python打包的win端软件发现不能上传文件,但是这个不影响。大家在使用的过程中有遇到什么问题,或者有什么想咨询的欢迎留言,大家一起讨论学习。3、接着需要登录GitHub网站,去申请GitHub token。8、可以点击预览看下效果,感觉可以的话点击发布等待打包成功即可。填写需要打包的网页地址,上传图片,选择需要打包的平台即可。
2025-06-18 16:19:26
1022
原创 WanVideo一个好用的图生视频工作流
没关系,其实节点都是一个GitHub上面的开源项目,咱们打开comfyui的日志,找到安装的节点的地址。检测完后会就会列出缺失的节点,咱们挨个安装即可。3、导入后 可以看到很多节点是红色的,没关系,这代表这该节点未安装。大家在体验的过程中有遇到什么问题,或者有什么想咨询欢迎留言,大家一起讨论学习。发现一个好用的图生视频工作流,只需一张图片即可生成一个3秒的视频。5、最后重启comfyui,即可使用该工作流了。接下来看拿到工作流后怎么快速安装相应的节点。等待系统检测缺少的节点。我以我的公众号头像来做的测试。
2025-06-12 14:59:04
468
3
原创 DreamO字节开源图像编辑框架
DreamO是由字节跳动联合北京大学深圳研究生院电子与计算机工程学院共同研发的统一图像定制生成框架,支持多样化的编辑任务。2、若受到网络原因,也可以通过git clone的方式安装下载。有comfyui版的就太好了,咱们可以利用comfyui生成接口,融入到我们字节的系统中。如果大家在搭建的过程中有遇到什么问题,或者有什么想复现的项目欢迎留言,大家一起讨论学习。打开comfyui里面中manager(管理器),搜索DreamO,安装插件。看下介绍的核心功能,还是很厉害的,今天咱们来体验下。
2025-06-09 14:42:30
260
原创 脑洞大开,将文本存入视频中
发现一个脑洞大开的项目memvid,作者为pdf文件占用空间太大,突发奇想将10000个pdf文件中的文本存到了二维码中,再将二维码压缩成了视频帧存放到视频中,大大减少了空间的占用,同时也有效提升了检索的时间。这个是要从huggingface上面下载模型文件,连接超时了,没关系,咱们把huggingface的代理加到代码中。大家在体验的过程中有遇到什么问题,或者有什么想复现的项目欢迎私信、留言,大家一起讨论学习,共同成长。参考作者的视频是先跑examples/book-chat.py,先来试试这个。
2025-06-05 11:22:08
352
原创 一键试衣,6G显存可跑
先来看下效果,使用动画人物也可换衣,但是运动装全身图像效果不是很好,我就不展示了,感兴趣的小伙伴可以亲自去尝试下。大家在搭建的过程中有什么问题,或者有什么想实现的功能欢迎留言讨论,大家一起学习、进步。模型文件已下载好,后台回复“CatVTON” 可拿到demo中的工作流和模型文件。1、首先去comfyui manager中下载该插件,comfyui可参考。衣服可以在购物网站上下载一张,人物可以是自己的照片。发现一个好玩的一键换衣的工作流,推荐给大家。作者参考的是开源项目,做成了工作流形式。
2025-06-04 15:40:13
376
原创 Fooocus 一款好用的文生图软件,4G显存可跑
Fooocus 是一款对标**Midjourney**的图像生成软件,并且可以本地部署,目前star数量已经来到了45.2k,说明非常受大家欢迎的。点击run.bat后如果没有模型文件,会默认下载模型文件,下载完成后自动打开网页。看下效果"a flying gril, Ghibli style"针对不同的显卡,要求的显存不同,20以上的显卡只需4G即可运行。软件还内置了几十种风格,默认勾选了三种风格,可根据自己需要勾选。win有一键安装包,下载后解压点击run.bat即可。看下软件对硬件的要求。
2025-06-03 16:02:52
267
2
原创 字节开源BAGEL可文生图、图像理解、图像编辑
BAGEL是由字节跳动开源的通用多模态大模型,一个原生支持多模态输入输出 + 思维链推理 + MoE 架构优化的跨模态超级 AI。说没没有安装torch,好,那我先去官方安装torch。安装好torch后再去安装requirements.txt中的各个包,这次顺利安装。安装好后将上面下载好的模型文件复制到comfyui的models/bagel下面。又报错了,但是这次是显存不够,我的24G显存竟然带不起来,尴尬了。下载速度还是很快的,但是就是模型文件太大了。摸索了半天,直接降低版本就可以了。
2025-05-29 11:41:25
405
原创 PairDrop像苹果电脑一样的跨设备传输工具
我平时传输文件都是通过微信传输助手,看到什么好看的文章,发送文件都是通过微信传。有时候会在别人的电脑上面传输文件,那就通过网页版传输助手传输,感觉这样跨设备传输还比较方便,但是微信文件传输助手有大小限制,怎么办呢?PairDrop,一款跨设备文件传输工具,就像苹果设备一样,可以直接在不同设备之间传输文件,github上面已经7.3Kstar了。pairDrop在本地部署的话可以局域网内传输,当然若要在互联网上面传输将地址映射互联网就可以了,而且没有200M的限制。直接下载下来了,还不错。
2025-05-28 09:37:34
396
原创 minerU,PDF文件转markdown神器
minerU是由上海AI实验室OpenDataLab团队研发的智能数据提取工具,可以一键将pdf文档转换为josn或者markdown文档,效果不错,今天咱们来体验下。检查了一圈,哦...原来漏了一步,忘记装pytorch了。这就是我搭建测试的整个过程,大家在搭建的过程中有遇到什么问题,或者有什么想实现的功能欢迎公众号留言,大家一起讨论学习。4、下载模型文件,需要从modelscope上面下载,先安装modelscope。进入到demo/pdfs文件下面,里面有提供的demo,可以测试用。
2025-05-27 09:35:22
643
原创 一键文本生成图像
FLUX 模型是由 Black Forest Labs 团队推出的一系列文本生成图像模型,lack Forest Labs(黑森林实验室)是一家由Stable Diffusion原班人马创立的AI研究机构,专注于开发图像与视频生成模型。如果大家在搭建的过程中有遇到什么问题,或者有什么想实现的功能,欢迎公众号留言,大家一起讨论学习。提示词很重要,提示词很重要,提示词很重要。2、点击工作流-->打开,打开刚刚保存的json文件。生成速度还是很快的,换个其他的试试。,也可以安装win版的,都可以。
2025-05-26 09:40:17
193
原创 BiliNote帮你总结视频内容的工具
BiliNote,可利用大模型自动总结视频内容,并且可以降内容以markdown形式导出,目前支持B站,Yutube,快手,抖音,本地视频。如果有本地部署的ollama,可以添加ollama,点击测试连通性,测试成功就可以在下方添加大模型了。大家在搭建的过程中有遇到什么问题,或者有什么好玩的项目想复现可以公众号留言,大家一起讨论学习。4、看到8000端口启动起来了就说明启动成功了,接着浏览器打开前端页面。2、支持docker部署,咱们就用docker试下。哈哈,效果不错,想体验的大家可以去试下。
2025-05-23 10:03:09
1002
原创 DICE-Talk备情感表达的数字人工具
我的cuda版本为12.4,所以下载的如下版本。GitHub上面复现的是2.2.2版本的,不过没关系,2.4.1版本的我也复现成功了。由复旦大学与腾讯联合研发的DICE-Talk说话人视频生成工具于近日正式发布,生成数字人视频的时候可以带情感、表情。5、接着下载huggingface上面的模型文件了,如果连接不上huggingface可以先设置代理。大家在复现的过程中有遇到什么问题,或者有什么想复现的项目欢迎公众号留言。2、创建环境,后台回复“conda”可拿到我已经下载好的anaconda网盘链接。
2025-05-22 09:30:33
204
原创 手搭一个自己的mcp服务
前面写了好几篇关于mcp的文章了,但是如果想利用mcp实现自己的业务需求怎么办呢?没关系,亲手搭建一个自己的mcp服务,今天咱们就来自己实践一下。上网搜了一下,自己搭建mcp服务有基于前端node.js的,有基于java的,有基于python的。修改自己启动的mcp服务,点击connect,连接成功后点击tools就可以查看自己的mcp服务了。如果大家在搭建的过程中有什么问题,或者有什么想实现的功能欢迎公众号留言,大家一起讨论学习。5、这些没问题了,咱们以高德的天气查询为例来自己写个天气查询的mcp服务。
2025-05-21 11:29:23
645
4
原创 sonic一张人物图片和音频生成面部表情和动作视频
Sonic是由腾讯和浙江大学联合开发的开源数字人技术框架。它能够通过音频驱动肖像图片生成生动的面部表情和口型动作,从而制作出高度逼真的数字人口播视频,广泛应用于虚拟主播、数字客服等场景,具有高效、低成本的特点。
2025-05-19 10:40:16
314
原创 LLaMA-Factory训练自己的大模型
LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。通过 LLaMA Factory,可以在无需编写任何代码的前提下,在本地完成上百种预训练模型的微调。
2025-05-13 09:28:56
442
原创 Ubuntu源码版comfyui的安装
Comfyui也出桌面版了,但是想让大家多个人都使用怎么办呢?也有方法,安装Linux版,启动后会生成个网页地址,打开就能用了。
2025-05-12 11:13:48
501
原创 FunASR阿里开源的语音识别工具
FunASR是一个由阿里云智能团队开源的语音识别工具。它旨在通过发布工业级语音识别模型的训练和微调,促进学术研究和工业应用之间的交流,推动语音识别生态的发展。
2025-05-09 10:06:17
709
原创 实时语音翻译seamless-streaming,支持100多个国家语言
facebook也推出了实时语音翻译系统,支持一百多个国家语音,经实测效果很不错,使用了5G左右显存。
2025-05-08 11:06:59
486
原创 seamless_communication,facebook推出的开源语音翻译项目
Seamless Communication是由Facebook Research开发的一个开源项目,旨在提供先进的语音和文本翻译功能,支持多国语音。
2025-05-07 10:29:44
288
原创 Animate-X 让你的图像动起来
Animate-X是由阿里巴巴出的通用角色动画生成项目:上传一张静态图像跟动作视频,就能让静态图像模仿动作视频的动作动起来,不仅支持对人类角色,还适用于拟人角色。
2025-05-06 09:06:33
418
2
navicat 连oracle oci环境 12.1.0.2.0 win x64版本
2024-01-31
如何让一张图片亮的地方更亮,暗的地方更暗?
2021-06-02
TA创建的收藏夹 TA关注的收藏夹
TA关注的人