开源 AI人脸替换工具离线版V6.2 一张图实现视频或者图片换脸,完全免费!附演示和教程视频

开源 AI人脸替换工具离线版V6.2 一张图实现视频或者图片换脸,完全免费!附演示和教程视频

这是热心网友万能君做的一个整合包,整合包里面已经包含了几个换脸项目和一些高清修复功能等,具体可以看下图截图所示。要顺利使用这个工具,必须做好以下几点第一个 这个工具只支持CPU+N卡。如果需要使用N卡,一定要先安装好驱动和CUDA。第二个 一定要安装好运行库。https://www.jian27.com/html/2290.html第三个 所...
开源 4387089 10064
开源 UltraPixel 文生图 超高分辨率出图 细节非常丰富 远超Stable-diffusion等 一键整合包 附视频演示 v20241028增强版

开源 UltraPixel 文生图 超高分辨率出图 细节非常丰富 远超Stable-diffusion等 一键整合包 附视频演示 v20241028增强版

UltraPixel是一个由华为诺亚方舟实验室联合香港科技大学共同开发的开源项目,旨在生成具有丰富细节的高质量图像,其分辨率范围可以从1K一直延伸至6K。该项目不仅优化了细节处理,还显著提升了整体图像效果,将超高清图像合成推向了新的高峰。项目背景与目的随着人工智能技术的不断发展,生成高分辨率图像成为了一个研究热点。然而,现有的图像生成模型在生...
开源 1474 4
开源 免费 pyVideoTrans v2.91 视频翻译开源软件 自动识别并生成字幕后,翻译 + 配音 绿色免安装

开源 免费 pyVideoTrans v2.91 视频翻译开源软件 自动识别并生成字幕后,翻译 + 配音 绿色免安装

这个工具我用来很长一段时间了,只是我居然一直忘记给大伙分享出来,直到昨天群里有人在问这样的工具。我才想起来把这个分享出来给大伙。虽然这个工具的标题叫视频翻译,实际上远远不只这些功能,我一直用这个工具来做字幕识别,比如我以前的教程那些字幕很多都是这个工具帮我做的。识别率也很高,超级方便。本来想今天一早就分享出来,但是事情比较多,又是瞎折腾的一天...
开源 4960 21
复旦、百度联手推出全新AI模型Hallo2 AI数字人 一键整合包,可生成高清4K数字人视频

复旦、百度联手推出全新AI模型Hallo2 AI数字人 一键整合包,可生成高清4K数字人视频

Hallo是一个由复旦大学、百度公司、苏黎世联邦理工学院和南京大学共同开发的AI对口型肖像图像动画技术,该技术能够基于语音音频输入生成逼真且动态的肖像图像视频。以下是该项目的详细介绍:项目背景:肖像图像动画技术:该技术旨在从单个静态图像和相应的语音音频中生成一个说话的人像,在视频游戏和虚拟现实、电影和电视制作、社交媒体和数字营销等领域具有巨大...
开源 2251 15
开源 神器 Stability Matrix v2.12.2 一款功能强大、易于使用的Stable Diffusion管理工具

开源 神器 Stability Matrix v2.12.2 一款功能强大、易于使用的Stable Diffusion管理工具

Stability Matrix是由Lykos AI开发的一款革命性工具,专为简化Stable Diffusion的使用和管理而设计。作为一款多平台包管理器和推理用户界面,它极大地提升了Stable Diffusion的易用性和用户体验。核心功能多平台支持:Stability Matrix支持macOS、Windows和Linux系统,确保用...
软件 1583 1
开源 DCT-Net_Webui v20241009 修改增强版 一款将图片/视频转绘漫画效果工具 支持批量处理 附三倍快乐演示

开源 DCT-Net_Webui v20241009 修改增强版 一款将图片/视频转绘漫画效果工具 支持批量处理 附三倍快乐演示

视频转动漫的工具貌似有不少,之前我也分享了,但是今天分享的这个,操作是极其简单,我顺手还做了个批量处理。这样就更方便了。Q群一个小伙伴提供了一台远程4060显卡的机器给我远程测试,所以也顺手把N卡包也整合好了。N卡的效率确实是超级高啊,我用CPU跑10秒的视频大概要3-5分钟,但是N卡的话 一分钟不到就搞定了。确实是爽。下面是截图一下给你们看...
开源 3724 4
新一代开源 免费 AI换脸神器 FaceFusion 3.0 20241007支持AMD显卡+N卡 速度更快,效果更惊艳 操作更简单 附视频演示

新一代开源 免费 AI换脸神器 FaceFusion 3.0 20241007支持AMD显卡+N卡 速度更快,效果更惊艳 操作更简单 附视频演示

FaceFusion这个AI换脸的项目已经太久没有更新了。作者终于在昨天更新了3.0,更新幅度大得惊人。这么久不更新,原来是一直在憋大招,这个CD冷却也太久了。。。我第一次时间就去做整合包了。本以为这还不是有手就行的事,但是有点难度。因为3.0更新太大了,所以之前版本的模型还有一些东西根本用不上了,我只能慢慢去研究了。搞半天最后把我的系统的c...
开源 281125 3249
diffusers-image-outpaint  超强AI人工智能扩图工具 一键整合包

diffusers-image-outpaint 超强AI人工智能扩图工具 一键整合包

Diffusers Image Outpaint 是一个在 Hugging Face 上的开源项目,它为图像外绘(image outpainting)提供了强大的工具和解决方案。一、项目背景与目标在图像处理领域,有时我们需要对图像进行扩展或修复,尤其是在图像的边缘部分进行外绘,以创造出更完整或更具创意的图像效果。Diffusers Image...
开源 3244 9
开源 免费 换脸工具 roop_unleashed v4.3.1 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示

开源 免费 换脸工具 roop_unleashed v4.3.1 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示

昨天分享了roop的整合包支持AMD显卡来运行,今天分享的这个工具是roop的一个分支,虽然roop的作者已经弃更了,但是还有其他人继续更新。这就有产生了一个新的项目roop_unleashed。估计是这个项目出来并没有多久,所以知道的人不是很多,这2天我心血来潮就把这个项目也做了一个整合包,这个roop_unleashed是支持N卡的,但是...
开源 19811 70
EzAudio: High-quality Text-to-Audio Generator AI文本生成音乐 音效 一键整合包 20240929修改增强

EzAudio: High-quality Text-to-Audio Generator AI文本生成音乐 音效 一键整合包 20240929修改增强

超级实用的一个AI开源工具,可以输入文本来生成各种声音,感觉这个很有实用场景啊,群里小伙伴推荐的一个项目。我花了点时间做成了整合包。腾讯AI实验室与约翰霍普金斯大学强强联手,共同推出了EzAudio这一革命性的文本到音频生成模型。EzAudio以其前所未有的高效能与卓越音质,为人工智能与音频技术的融合树立了新的里程碑。EzAudio之所以能在...
软件 2084 0
开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v0.94 整合包 附全部模型

开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v0.94 整合包 附全部模型

下面文字是作者原话这是一个离线运行的本地语音识别转文字工具,基于 fast-whipser 开源模型,可将视频/音频中的人类声音识别并转为文字,可输出json格式、srt字幕带时间戳格式、纯文字格式。可用于自行部署后替代 openai 的语音识别接口或百度语音识别等,准确率基本等同openai官方api接口。部署或下载后,双击 start.e...
开源 2569 6
HivisionIDPhotos v1.2.7 一个专注于证件照智能制作的开源项目 一键整合包 支持批量处理 附视频演示

HivisionIDPhotos v1.2.7 一个专注于证件照智能制作的开源项目 一键整合包 支持批量处理 附视频演示

HivisionIDPhotos 是一个专注于证件照智能制作的开源项目,由Zeyi-Lin开发并维护。该项目旨在通过先进的图像处理和机器学习技术,为用户提供一种高效、便捷的证件照制作解决方案。项目结合了轻量级抠图、多尺寸规格生成、智能换底等多种功能,让用户能够轻松制作出符合标准的证件照。核心功能轻量级抠图:HivisionIDPhotos采用...
开源 2191 4
PuLID-flux模型 AI整合包 字节 开源的图像生成ID定制化项目,通过对比对齐技术引领纯净高效新纪元

PuLID-flux模型 AI整合包 字节 开源的图像生成ID定制化项目,通过对比对齐技术引领纯净高效新纪元

PuLID是一个由ByteDance Inc.开发的开源项目,专注于通过对比对齐技术实现纯净且高效的图像生成ID定制化。该项目由Zinan Guo、Yanze Wu、Zhuowei Chen、Lang Chen和Qian He等研究人员共同贡献,其中Zinan Guo和Yanze Wu为等量贡献者,Yanze Wu为通讯作者。PuLID项目的...
开源 2559 13
Flux 文生图模型 一键整合包 解压即可食用 出图效果超级惊艳 附图片演示

Flux 文生图模型 一键整合包 解压即可食用 出图效果超级惊艳 附图片演示

Flux文生图模型是由Black Forest Labs(黑森林实验室)开发的一款高质量文本到图像生成模型。该模型在多个维度上展现了卓越性能,特别是在文本引导的图像生成、多主体场景构建以及精细的手部细节生成等方面,实现了显著的提升,为文生图领域设定了新的技术标杆。Flux模型的核心特点包括:高性能与高质量:Flux模型采用了先进的混合架构,融...
开源 4651 59
开源AI 免费抠图工具,可以批量抠图rembg v2.0.59 抠图速度超快 附教程+视频效果演示 一键整合包

开源AI 免费抠图工具,可以批量抠图rembg v2.0.59 抠图速度超快 附教程+视频效果演示 一键整合包

我基于rembg 开源项目打包制作,因为我没有N卡,所以没有测试N卡是否可以运行,但是我已经安装了支持N卡的代码,大概率是可以用N卡运行的,我用cpu测试没有问题。部分运行代码参考了一些网友的代码。下面是截图下面是放一些抠图的对比图片这是我批量抠图的演示,因为选的都是一个模型,所以效果确实一般,但是实际上还可以更精细,我已经把所有模型都下载下...
软件,开源 6275 27
开源 CogVideoX 文字生成视频 整合包

开源 CogVideoX 文字生成视频 整合包

CogVideoX是智谱AI推出的一款开源视频生成模型,该项目在视频生成领域引起了广泛关注。以下是对CogVideoX开源项目的详细介绍:一、项目背景与简介CogVideoX作为智谱AI的创新成果,旨在通过深度学习技术将文本或图像转换为高质量的视频内容。该项目不仅推动了视频生成技术的边界,还为创作者提供了全新的创作工具和平台。CogVideo...
开源 2501 3
EchoMimic 一个由阿里巴巴推出的开源AI数字人项目 一键整合包

EchoMimic 一个由阿里巴巴推出的开源AI数字人项目 一键整合包

EchoMimic是一个由阿里巴巴推出的开源AI数字人项目,该项目在数字人技术领域内实现了显著的创新与突破。以下是对EchoMimic的详细介绍:一、项目背景与意义随着人工智能、深度学习、计算机视觉以及自然语言处理技术的飞速发展,数字人技术逐渐成为连接现实世界与虚拟世界的重要桥梁。EchoMimic项目的诞生,旨在通过先进的技术手段,将静态图...
开源 1785 0
开源 Deep-Live-Cam v1.3.0 AI人工智能 图片视频换脸+直播换脸 整合包 支持AMD+英伟达N卡

开源 Deep-Live-Cam v1.3.0 AI人工智能 图片视频换脸+直播换脸 整合包 支持AMD+英伟达N卡

Deep-Live-Cam是一款由hacksider开发并维护的创新性软件,旨在为快速发展的AI生成媒体行业贡献一份力量。该软件的主要功能是通过深度学习技术,实现实时的人脸替换与增强,为艺术家、设计师以及内容创作者提供了一个强大的工具,帮助他们以全新的方式创作和表达。项目概述Deep-Live-Cam的核心价值在于其广泛的应用场景。艺术家可以...
开源 3706 0
开源 ReHiFace-S 一款集高保真、实时性、易用性于一身的换脸神器 附视频演示 整合包

开源 ReHiFace-S 一款集高保真、实时性、易用性于一身的换脸神器 附视频演示 整合包

这个项目我已经做好了几天了,在群里也是分享了,经过几天的运行测试后,现在已经非常稳定了,所以今天抽空整理下分享出来。换脸的效果还是很不错的,你们可以下面的视频演示就知道了。虽然我之前也已经分享了几个换脸的工具了,但是谁又会在意多一个呢?多一个选择总是好的。这个操作是极其简单的。选择人脸,选择视频点下提交就可以换脸了。特别适合那些电脑基础差的小...
开源 4464 34
神器 Civitai-Web-Scraper C站图片下载工具 整合包

神器 Civitai-Web-Scraper C站图片下载工具 整合包

Civitai-Web-Scraper是一款专为挖掘CivitAI平台上丰富的人工智能生成图像及其灵感提示而设计的开源工具。该项目由ScreamingHawk在GitHub上开源,旨在帮助艺术家、设计师、AI研究人员以及普通爱好者轻松访问和获取CivitAI网站上的AI创作内容。主要功能与特点:一键式抓取:Civitai-Web-Scrape...
开源 2042 4
腾讯开源GFPGAN图片无损放大,一键懒人包

腾讯开源GFPGAN图片无损放大,一键懒人包

GFPGAN是一个由腾讯PCG应用研究中心(ARC)开发的开源项目,专注于现实世界中的人脸修复算法。它利用预训练的人脸生成对抗网络(GAN)中的丰富先验信息来进行盲脸修复,尤其擅长处理低分辨率或损坏的人脸图像。GFPGAN主要特点:实用性:旨在为实际应用中的人脸恢复提供实用算法。先验信息:利用GAN(如StyleGAN2)中的丰富和多样先验信...
软件 2009 10
PhotoMaker v2 整合包 高效地定制化生成任意风格的逼真人类照片!附视频教程

PhotoMaker v2 整合包 高效地定制化生成任意风格的逼真人类照片!附视频教程

PhotoMaker是一个由腾讯ARC实验室和南开大学MCG-NKU联合开发的前沿图像生成工具,该项目在CVPR 2024会议上进行了展示。PhotoMaker旨在通过堆叠的ID嵌入技术,实现对真实人类照片的定制化编辑与生成。其核心功能在于能够迅速根据用户提供的参考图像(ID图像),结合文本提示,生成具有高度身份一致性(ID fidelity...
开源 2770 4
开源 AI EmotiVoice 易魔声 文本生成语音  一款功能强大且现代的开源文本转语音(TTS)引擎

开源 AI EmotiVoice 易魔声 文本生成语音 一款功能强大且现代的开源文本转语音(TTS)引擎

EmotiVoice(易魔声)是一款功能强大且现代的开源文本转语音(TTS)引擎,由网易有道开源并维护。该软件以其中英文双语支持和超过2000种不同的音色而闻名,为用户提供了极为丰富的声音选择。以下是对EmotiVoice(易魔声)的详细介绍:一、核心功能双语言支持:EmotiVoice支持中英文两种语言的文本转语音,满足了不同用户的语言需求...
软件 2175 5
LivePortrait 整合包 AI表情同步(表情迁移),支持N卡。附视频演示

LivePortrait 整合包 AI表情同步(表情迁移),支持N卡。附视频演示

LivePortrait是一款由快手科技与中国科学技术大学和复旦大学合作开发的先进AI驱动的肖像动画框架,其项目地址位于https://github.com/KwaiVGI/LivePortrait。该软件旨在通过创新的图像处理技术,将静态的照片转化为栩栩如生的动态视频,为用户带来更加生动有趣的视觉体验。核心特点高效性:LivePortrai...
开源 2011 2