复旦、百度联手推出全新AI模型Hallo2 AI数字人 一键整合包,可生成高清4K数字人视频

复旦、百度联手推出全新AI模型Hallo2 AI数字人 一键整合包,可生成高清4K数字人视频

Hallo是一个由复旦大学、百度公司、苏黎世联邦理工学院和南京大学共同开发的AI对口型肖像图像动画技术,该技术能够基于语音音频输入生成逼真且动态的肖像图像视频。以下是该项目的详细介绍:项目背景:肖像图像动画技术:该技术旨在从单个静态图像和相应的语音音频中生成一个说话的人像,在视频游戏和虚拟现实、电影和电视制作、社交媒体和数字营销等领域具有巨大...
开源 4239 23
diffusers-image-outpaint  超强AI人工智能扩图工具 一键整合包

diffusers-image-outpaint 超强AI人工智能扩图工具 一键整合包

Diffusers Image Outpaint 是一个在 Hugging Face 上的开源项目,它为图像外绘(image outpainting)提供了强大的工具和解决方案。一、项目背景与目标在图像处理领域,有时我们需要对图像进行扩展或修复,尤其是在图像的边缘部分进行外绘,以创造出更完整或更具创意的图像效果。Diffusers Image...
开源 6580 12
免费 开源 AI视频换脸工具,换脸离线包 RoopGPU v1.3.2 支持AMD显卡 附视频演示

免费 开源 AI视频换脸工具,换脸离线包 RoopGPU v1.3.2 支持AMD显卡 附视频演示

roop 这个项目,原作者已经放弃了,转去做facefusion了。我这2天在整理我的网站上的一些开源项目,然后想更新下这个项目的最终版本。原来分享的不是最终版,估计想最终版也许值得珍藏。就去研究了下。发现这个版本居然是支持A卡来跑的。速度还不错,就花了点时间做成了整合包。今天分享出来,整合包代码全部开源,我没有加密任何文件,有很多人喜欢把启...
软件,开源 39407 155
开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v0.94 整合包 附全部模型

开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v0.94 整合包 附全部模型

下面文字是作者原话这是一个离线运行的本地语音识别转文字工具,基于 fast-whipser 开源模型,可将视频/音频中的人类声音识别并转为文字,可输出json格式、srt字幕带时间戳格式、纯文字格式。可用于自行部署后替代 openai 的语音识别接口或百度语音识别等,准确率基本等同openai官方api接口。部署或下载后,双击 start.e...
开源 3369 6
开源 Tailor v0.1.5  一款功能强大的视频智能裁剪、生成及优化工具

开源 Tailor v0.1.5 一款功能强大的视频智能裁剪、生成及优化工具

Tailor 是一款功能强大的视频智能裁剪、生成及优化工具。这款软件集成了最先进的人工智能技术,为用户提供了前所未有的视频处理体验。Tailor涵盖了视频剪辑、视频生成和视频优化三大核心功能,共包含10种不同的处理方法。在视频剪辑方面,Tailor拥有精准的人脸识别技术,能够自动捕捉视频中的精彩人脸瞬间,并允许用户轻松选择关注的人脸进行裁剪,...
软件 2994 13
PuLID-flux模型 AI整合包 字节 开源的图像生成ID定制化项目,通过对比对齐技术引领纯净高效新纪元

PuLID-flux模型 AI整合包 字节 开源的图像生成ID定制化项目,通过对比对齐技术引领纯净高效新纪元

PuLID是一个由ByteDance Inc.开发的开源项目,专注于通过对比对齐技术实现纯净且高效的图像生成ID定制化。该项目由Zinan Guo、Yanze Wu、Zhuowei Chen、Lang Chen和Qian He等研究人员共同贡献,其中Zinan Guo和Yanze Wu为等量贡献者,Yanze Wu为通讯作者。PuLID项目的...
开源 3895 13
Flux 文生图模型 一键整合包 解压即可食用 出图效果超级惊艳 附图片演示

Flux 文生图模型 一键整合包 解压即可食用 出图效果超级惊艳 附图片演示

Flux文生图模型是由Black Forest Labs(黑森林实验室)开发的一款高质量文本到图像生成模型。该模型在多个维度上展现了卓越性能,特别是在文本引导的图像生成、多主体场景构建以及精细的手部细节生成等方面,实现了显著的提升,为文生图领域设定了新的技术标杆。Flux模型的核心特点包括:高性能与高质量:Flux模型采用了先进的混合架构,融...
开源 7839 59
开源 AI声音克隆,用任意声音说话,解压即可使用 clone-voice v0.908 附模型

开源 AI声音克隆,用任意声音说话,解压即可使用 clone-voice v0.908 附模型

大伙好,我是剑二十七,好像早几天有小伙伴在问是否有声音克隆工具,今天找了一个,而且作者很贴心做成了 可执行文件,解压即可使用。真是超级方便。效果也不错。关键是我没有N卡也可以运行,效率也不错。下面看截图下面是实操过程截图点击开始生成 其他都是默认我没有去录音自己的声音,用的是默认的样品下面是生成后的声音 你们听听。今天比较匆忙 没有...
软件,开源 10091 28
应群友要求,我把开源 AI人脸替换工具离线版之前发布的一些版本整理一下再分享出来

应群友要求,我把开源 AI人脸替换工具离线版之前发布的一些版本整理一下再分享出来

群里一些小伙伴老在讲什么之前的老版本如何如何好用,如何得心应手。说实话我自己没有什么感觉。估计他们这些都是幻觉。但是你们要是喜欢之前的版本,我也是可以再分享出来,时间也是过得好快啊。截图如下 版本如下估计差不多了吧,应该没什么遗漏了。喜欢老版本的可以去下载试试。如果全部收藏的话 大概有170多G。。。你们看截图写在最后的最后,如果对这个工具使...
软件 8168 15
本群第一个自练 flux lora模型 苗疆倩影

本群第一个自练 flux lora模型 苗疆倩影

群内大牛icolor 自练了一个lora模型,首发在里布上。我也觉得非常牛X了本LORA由近300张苗族服饰、头饰等高清美图,经36000步近12小时炼制而成,经过本人测试后精选其一分享给大家使用。本人算力有限,在本地forge中使用dve Q8以及dve NF4模型进行测试,本LORA对人物服饰、脸型、肤色、整体色调色彩均有加强,可使用原版...
素材 2368 2
开源 CogVideoX 文字生成视频 整合包

开源 CogVideoX 文字生成视频 整合包

CogVideoX是智谱AI推出的一款开源视频生成模型,该项目在视频生成领域引起了广泛关注。以下是对CogVideoX开源项目的详细介绍:一、项目背景与简介CogVideoX作为智谱AI的创新成果,旨在通过深度学习技术将文本或图像转换为高质量的视频内容。该项目不仅推动了视频生成技术的边界,还为创作者提供了全新的创作工具和平台。CogVideo...
开源 3375 3
EchoMimic 一个由阿里巴巴推出的开源AI数字人项目 一键整合包

EchoMimic 一个由阿里巴巴推出的开源AI数字人项目 一键整合包

EchoMimic是一个由阿里巴巴推出的开源AI数字人项目,该项目在数字人技术领域内实现了显著的创新与突破。以下是对EchoMimic的详细介绍:一、项目背景与意义随着人工智能、深度学习、计算机视觉以及自然语言处理技术的飞速发展,数字人技术逐渐成为连接现实世界与虚拟世界的重要桥梁。EchoMimic项目的诞生,旨在通过先进的技术手段,将静态图...
开源 3056 1
Fooocus v2.5.5 又一款上手快,门槛低的开源AI绘画工具 效率不错 支持AMD显卡

Fooocus v2.5.5 又一款上手快,门槛低的开源AI绘画工具 效率不错 支持AMD显卡

这个开源项目我之前也分享过,但是最近又更新了。文件是在是太大了就一个基本能运行的压缩包 还只是包含了一个模型就是差不多15G,我上传上来都是要半天啊。实在是无语的很。如果你的显卡是N卡就继续看下去,如果是A卡就没有必要看下去了。这个软件只支持n卡。可惜我的显卡也是A卡,所以我只能脑补一些情况。但是我为了小伙伴的福利,还是坚持在网上搜了下其他人...
开源 3217 10
开源 ReHiFace-S 一款集高保真、实时性、易用性于一身的换脸神器 附视频演示 整合包

开源 ReHiFace-S 一款集高保真、实时性、易用性于一身的换脸神器 附视频演示 整合包

这个项目我已经做好了几天了,在群里也是分享了,经过几天的运行测试后,现在已经非常稳定了,所以今天抽空整理下分享出来。换脸的效果还是很不错的,你们可以下面的视频演示就知道了。虽然我之前也已经分享了几个换脸的工具了,但是谁又会在意多一个呢?多一个选择总是好的。这个操作是极其简单的。选择人脸,选择视频点下提交就可以换脸了。特别适合那些电脑基础差的小...
开源 6576 35
神器 开源 CodeFormer v20240114 图片+视频+人脸高清修复 解压即用

神器 开源 CodeFormer v20240114 图片+视频+人脸高清修复 解压即用

CodeFormer是一个基于AI技术的深度学习项目,由南洋理工大学和商汤科技联合研究中心共同开发。该项目专注于人脸复原领域,通过深度学习模型提升模糊或受损人脸图像的质量。CodeFormer结合了VQGAN和Transformer两种先进的神经网络架构,其中VQGAN利用向量量化技术将图像编码为一系列离散的向量,并通过解码器恢复成图像,而T...
软件 3472 4
开源 TotalAIChat V1.0.0.1 一款集成了国内多个主流AI聊天机器人的综合型软件

开源 TotalAIChat V1.0.0.1 一款集成了国内多个主流AI聊天机器人的综合型软件

TotalAIChat是一款功能强大的集成型聊天工具,由EffiDataEase团队开发并维护。该软件基于Qt6框架,结合QWebViewEngine与C++编程语言,为用户提供了前所未有的AI聊天体验。它巧妙地集成了国内八大主流聊天机器人,包括问心一言、腾讯元宝、通义千问、豆包、Kimi、开工、360以及讯飞,使得用户能够在一个统一的界面中...
开源 1870 0
腾讯开源GFPGAN图片无损放大,一键懒人包

腾讯开源GFPGAN图片无损放大,一键懒人包

GFPGAN是一个由腾讯PCG应用研究中心(ARC)开发的开源项目,专注于现实世界中的人脸修复算法。它利用预训练的人脸生成对抗网络(GAN)中的丰富先验信息来进行盲脸修复,尤其擅长处理低分辨率或损坏的人脸图像。GFPGAN主要特点:实用性:旨在为实际应用中的人脸恢复提供实用算法。先验信息:利用GAN(如StyleGAN2)中的丰富和多样先验信...
软件 2675 10
AI 视频质量增强工具 Perfectly Clear Video v4.6.1.2690 x64

AI 视频质量增强工具 Perfectly Clear Video v4.6.1.2690 x64

这个工具有个图片质量增强,也是非常强大好用的,今天突然发现居然还有个同款视频增强我马上分享出来,亲测了一下,确实效果也不错神器 人脸自动识别 图像后期处理调色 Perfectly Clear WorkBench v4.6.0.2618 附模型Perfectly Clear Video Mac/WIN 是一款适用于Mac苹果电脑和Windows...
软件 3148 11
吾爱大神出品 本地语音转文字 STT Powered by Faster Whisper 绿色免安装

吾爱大神出品 本地语音转文字 STT Powered by Faster Whisper 绿色免安装

以下为作者说明背景最近接到一个需求,需要把录音转换为文字,一看网上几款常用的工具,想不到都是收费的;论坛里面找了找,发现基本上都需要云端api,仅有的几个本地的都需要使用GPU中的cuda计算。因此,开发了这么一款语言转文字的小工具,基于Faster Whisper模型,在cpu上也能达到不错的效果。使用方式双击文件打开,在左上角选择模型,左...
软件 2001 0
吾爱大神原创 离线照片人像提取工具 批量人像抠图

吾爱大神原创 离线照片人像提取工具 批量人像抠图

吾爱大神原创作品软件背景介绍:1、软件采用 .net framework 4.6.1框架,如果无法打开,自行下载安装框架2、软件可以离线使用,无需联网担心隐私问题3、软件是基于百度飞桨PaddleSeg人像切割开源模型4、软件适合小白和影楼需要处理很多照片的朋友软件功能介绍:1、批量人像提取2、批量设置人像背景(先设置背景,后选择要处理的图像...
软件 2198 0
PhotoMaker v2 整合包 高效地定制化生成任意风格的逼真人类照片!附视频教程

PhotoMaker v2 整合包 高效地定制化生成任意风格的逼真人类照片!附视频教程

PhotoMaker是一个由腾讯ARC实验室和南开大学MCG-NKU联合开发的前沿图像生成工具,该项目在CVPR 2024会议上进行了展示。PhotoMaker旨在通过堆叠的ID嵌入技术,实现对真实人类照片的定制化编辑与生成。其核心功能在于能够迅速根据用户提供的参考图像(ID图像),结合文本提示,生成具有高度身份一致性(ID fidelity...
开源 3860 6
AI虚拟聊天软件-ChatAI虚拟女友 现已改名为语友 最新v1.08

AI虚拟聊天软件-ChatAI虚拟女友 现已改名为语友 最新v1.08

一款AI虚拟聊天软件--ChatAI虚拟女友,算是沾了chatgpt的春风吧首次打开,会提示你当前还有没有虚拟伴侣,需要去添加伴侣,然后首页右上角可以设置自己的头像和切换AI智能的模式然后打开发现页-添加伴侣,有现代美女、古装美女、二次元美女、机甲、女仆、秘书、空姐、历史人物等等,点击就能看到该任务的信息,大部分还可以选择换装选好直接点击创建...
安卓 5890 27
开源 MDX23  v1.0.1 一款超强AI背景音人声分离工具

开源 MDX23 v1.0.1 一款超强AI背景音人声分离工具

MVSEP-MDX23-music-separation-model 是一个专为2023年音乐分离挑战赛(MDX'23)设计的音频分离模型,它能够将音乐分解为四个独立的音轨:“低音”、“鼓声”、“人声”和“其他”。该模型在挑战赛中取得了第三名的好成绩(Leaderboard C),证明了其在音乐分离领域的强大实力。此模型基于Demuc...
开源 2074 0
开源 Waifu2x Caffe v1.2.0.4 一个功能强大且效果优秀的图像无损放大处理工具

开源 Waifu2x Caffe v1.2.0.4 一个功能强大且效果优秀的图像无损放大处理工具

waifu2x-caffe 是一个开源软件项目,旨在通过使用深度学习技术来提高图像的分辨率和质量。这个项目最初是由日本工程师lltcggie开发的,基于 Caffe 深度学习框架实现。waifu2x-caffe 的主要功能是将低分辨率的图像放大至高分辨率,并提升图像的视觉质量,尤其在处理动漫风格的图像方面表现出色。这个软件的强大之处在于其通过...
开源 7330 0
开源 AI EmotiVoice 易魔声 文本生成语音  一款功能强大且现代的开源文本转语音(TTS)引擎

开源 AI EmotiVoice 易魔声 文本生成语音 一款功能强大且现代的开源文本转语音(TTS)引擎

EmotiVoice(易魔声)是一款功能强大且现代的开源文本转语音(TTS)引擎,由网易有道开源并维护。该软件以其中英文双语支持和超过2000种不同的音色而闻名,为用户提供了极为丰富的声音选择。以下是对EmotiVoice(易魔声)的详细介绍:一、核心功能双语言支持:EmotiVoice支持中英文两种语言的文本转语音,满足了不同用户的语言需求...
软件 3395 6