PhotoMaker是一个由腾讯ARC实验室和南开大学MCG-NKU联合开发的前沿图像生成工具,该项目在CVPR 2024会议上进行了展示。PhotoMaker旨在通过堆叠的ID嵌入技术,实现对真实人类照片的定制化编辑与生成。其核心功能在于能够迅速根据用户提供的参考图像(ID图像),结合文本提示,生成具有高度身份一致性(ID fidelity)且风格多样的照片。
PhotoMaker具有多项关键特性:首先,它支持在几秒内完成快速定制化,无需额外的LoRA训练,极大提升了用户体验;其次,确保了令人印象深刻的身份一致性,同时提供多样化的输出和灵活的文本控制性;此外,PhotoMaker还可以作为适配器(Adapter),与其他基础模型及LoRA模块协同工作,扩展了其应用场景和兼容性。
随着版本的更新,PhotoMaker V2在保持高质量生成和编辑能力的同时,进一步提升了ID一致性。同时,它提供了与ControlNet、T2I-Adapter等插件的集成脚本,为用户提供了更强大的控制能力。用户可以通过自定义脚本来实现功能的升级,如与LCM结合加速处理速度,或与IP-Adapter-FaceID等工具结合以进一步提高ID一致性。
PhotoMaker的安装和使用相对简便,通过conda环境管理和pip安装即可快速部署。此外,项目还提供了详细的文档和示例代码,帮助用户快速上手并生成满意的结果。
总之,PhotoMaker是一个功能强大、易于使用的图像定制化工具,适用于需要高度身份一致性和多样化输出的各种应用场景。
下面是演示
原始图
输出
原始图
输出
原图
输出
群内小伙伴傻木 优化版
8G最低
保存的图片是TXT后缀名,哪里出问题了?
电脑基础知识太差的问题
送给大家的七夕礼物