AIGC
EasyPhoto-智能AI照片生成器
EasyPhoto是 SD-WebUI 的插件,用于生成 AI 肖像。 特点
是一款用于生成 AI 肖像画的 SD-WebUI 插件。支持使用预设模板图片和上传自己的图片进行推理,支持多人生成。
部署
官方教程:
安装插件
安装 SD-WebUI
安装controln…
Fooocus-结合SD和MJ特点的AIGC工具
Fooocus是对 Stable Diffusion 和 Midjourney 设计的重新思考,集合了两者的优点。 特点
Fooocus 是一款图像生成软件,它是离线、开源和免费的。它不需要手动调整,用户只需关注提示和图像。该工具包含了许多内部优化和质量改进…
StableVideo-文本驱动的一致性感知扩散视频编辑
本文简单记录介绍一下 StableVideo。 StableVideo 是一个基于文本驱动的一致性感知扩散视频编辑工具。
一、什么是 StableVideo
可以在修改视频中的对象的同时能随着时间的推移保持其外观一致性。
二、StableVideo 功能…
FaceChain-制作一张个人数字孪生照片吧
FaceChain是一个深度学习工具,用于生成个人的数字孪生。只需一张肖像照片,就可以创建自己的数字孪生并开始生成不同场景的个人照片。 特点
好玩......
部署
官方教程:
1、使用 ModelScope 提供的 notebook 环境,ModelScope…
ShortGPT-AI自动化内容创作
ShortGPT用于自动化内容创作。它简化了视频创作、素材获取、语音合成和编辑任务。 特点
ShortGPT 是一个用于自动化短视频内容创作的实验性 AI 框架,可以帮助创作者快速制作、管理和交付内容。它简化了视频制作、素材获取、语音合成和编辑任务。
部署
Text…
AnimateDiff-为文生图添加动画效果
本文简单记录介绍一下 AnimateDiff。 AnimateDiff 可以个性化为文生图添加动画效果,支持 SD WebUI 插件。
一、什么是 AnimateDiff
AnimateDiff 可以让用户无需特定调整就能够为个性化的文本到图像扩散模型添加动画效果…
FreeDrag-比DragGAN更稳定有效的交互式图像编辑模型
本文简单记录介绍一下 FreeDrag。 FreeDrag 是一种新的交互式基于点的图像编辑框架,与 DragGAN 相比摆脱了繁琐和不稳定的点跟踪过程。
一、什么是 FreeDrag
一种新的交互式基于点的图像编辑框架,基于 StyleGAN2…
I-JEPA-初步拥有世界模型的图像AI
本文简单记录介绍一下 I-JEPA。 I-JEPA 是一种基于图像联合嵌入预测架构的自监督学习方法。
一、什么是 I-JEPA#
是一种自我监督学习的方法,是基于图像的联合嵌入预测架构,可以从同一图像的其他部分的表示中预测图像的一部分的表示。
二、I…
CoDi-Any2Any的生成模型
本文简单记录介绍一下 CoDi。 CoDi 可以从任何输入模态生成任何组合的输出模态,例如语言、图像、视频或音频。
一、什么是 CoDi#
CoDi 可以从任何输入模态,比如语言、图像、视频或音频的任何组合中产生任何语言、图像、视频或音频输出模态的组合…
DragGAN-交互式的图像任意点精确控制模型
前言 本文简单记录介绍一下 DragGAN。
LangGPT 是一种让能交互式选择图像的任何点精确移动的生成对抗网络模型,白话就是秒杀 PS的方法。
正文
一、什么是 DragGAN
DragGAN 可以通过用户交互的方式 “拖动” 图像的任何点以精确到达目标点…
OpenChatVideoEditor-开源的短视频生成和编辑工具
工具分享# OpenChatVideoEditor,一款开源的短视频生成和编辑工具。
特点#
1)一键生成可用的短视频,包括:配音、背景音乐、字幕等。
2)算法和数据均基于开源项目,方便技术交流和学习。
3)支持多种输入数据,方便对各种各样的数据,一键转短视频,目前支持:…
扩散模型浅析
扩散模型是基于迭代运算的图像生成模型。
本文记录了扩散模型的工作原理和对模型结构的学习情况。