banner
hughie

hughie

热爱技术的小菜鸟, 记录一下所学所感

AI

cover

EasyPhoto-智能AI照片生成器

​ EasyPhoto是 SD-WebUI 的插件,用于生成 AI 肖像。 特点 是一款用于生成 AI 肖像画的 SD-WebUI 插件。支持使用预设模板图片和上传自己的图片进行推理,支持多人生成。 部署 官方教程: 安装插件 安装 SD-WebUI 安装controln…
ChatGPT-AutoExpert-提升ChatGPT对话能力的插件
​ ChatGPT-AutoExpert是一套定制指令,旨在提升 GPT-4 和 GPT-3.5-Turbo 对话模型的能力。 特点 ChatGPT-AutoExpert 的目标是为用户提供准确、丰富上下文的信息和更好的学习体验,具有自动改进问题、斜杠命令…
Auto-i18n-使用ChatGPT的自动多语言翻译工具
​ Auto-i18n是一个使用 ChatGPT 自动将 Markdown 文件批量翻译为多语言的工具。 特点 Auto-i18n 实现了博客文章 i18n (Internationalization) 的完全自动化。仅需将博文推送至 GitHub 仓库,即可借助…
cover

Fooocus-结合SD和MJ特点的AIGC工具

​ Fooocus是对 Stable Diffusion 和 Midjourney 设计的重新思考,集合了两者的优点。 特点 Fooocus 是一款图像生成软件,它是离线、开源和免费的。它不需要手动调整,用户只需关注提示和图像。该工具包含了许多内部优化和质量改进…
cover

StableVideo-文本驱动的一致性感知扩散视频编辑

​ 本文简单记录介绍一下 StableVideo。 ​ StableVideo 是一个基于文本驱动的一致性感知扩散视频编辑工具。 一、什么是 StableVideo 可以在修改视频中的对象的同时能随着时间的推移保持其外观一致性。 二、StableVideo 功能…
cover

facefusion-人脸融合

​ facefusion下一代换脸和脸部增强工具。 特点 facefusion 可以选择不同的参数来实现人脸增强、人脸交换等功能。 部署 官方教程 需要 python3.9+,CUDA11.8, onnxruntime 官方教程自动下载预训练模型到项目中,也可以手动下载Re…
VITS-fast-fine-tuning-快速克隆自定义角色的声音
​ 本文简单记录介绍一下 VITS-fast-fine-tuning。 ​ VITS-fast-fine-tuning 是一个 VITS 的微调训练库,可以快速克隆出想要的角色声音。 一、什么是 VITS-fast-fine-tuning 快速克隆音频中角色的声音。 二…
cover

FaceChain-制作一张个人数字孪生照片吧

​ FaceChain是一个深度学习工具,用于生成个人的数字孪生。只需一张肖像照片,就可以创建自己的数字孪生并开始生成不同场景的个人照片。 特点 好玩...... 部署 官方教程: 1、使用 ModelScope 提供的 notebook 环境,ModelScope…
cover

HQTrack-高性能视频对象跟踪和分割的框架

​ 本文简单记录介绍一下 HQTrack。 ​ HQTrack 是一个用于高性能视频目标跟踪和分割的框架。 一、HQTrack 介绍# 一个用于高性能视频目标跟踪和分割的框架,可以同时跟踪多个目标对象并输出准确的对象掩码。 二、HQTrack 使用# 1、下载项目:git…
cover

ShortGPT-AI自动化内容创作

​ ShortGPT用于自动化内容创作。它简化了视频创作、素材获取、语音合成和编辑任务。 特点 ShortGPT 是一个用于自动化短视频内容创作的实验性 AI 框架,可以帮助创作者快速制作、管理和交付内容。它简化了视频制作、素材获取、语音合成和编辑任务。 部署 Text…
cover
cover
cover

RealChar-免费使用的人物虚拟化交流工具

​ RealChar是一个可以创建、定制和实时与之对话的 AI 角色 / 伴侣的平台。 特点# 易于使用:不需要编写代码即可创建自己的 AI 角色。 可定制:可以定制 AI 角色的个性、背景甚至声音。 实时:可以与 AI 角色实时对话或发送信息。 多平台:可以在网络…
cover

AnimateDiff-为文生图添加动画效果

​ 本文简单记录介绍一下 AnimateDiff。 ​ AnimateDiff 可以个性化为文生图添加动画效果,支持 SD WebUI 插件。 一、什么是 AnimateDiff AnimateDiff 可以让用户无需特定调整就能够为个性化的文本到图像扩散模型添加动画效果…
cover
cover
cover

FreeDrag-比DragGAN更稳定有效的交互式图像编辑模型

​ 本文简单记录介绍一下 FreeDrag。 ​ FreeDrag 是一种新的交互式基于点的图像编辑框架,与 DragGAN 相比摆脱了繁琐和不稳定的点跟踪过程。 一、什么是 FreeDrag 一种新的交互式基于点的图像编辑框架,基于 StyleGAN2…
cover
cover

gpt-code-ui-搭建一个基于ChatGPT的Code Interpreter

​ gpt-code-ui这是 OpenAI 的ChatGPT 代码解释器的开源实现。只需向 OpenAI 模型询问要做什么,它就会为您生成和执行代码。 特点# 可以执行文件上传并要求修改文件内容、保存文件并打印下载链接之类的操作,只需向 GPT-4/GPT-3.5…
cover
cover

Queryable-在iphone上使用CLIP进行照片搜索

​ Queryable可以在手机上使用自然语言离线模糊搜索照片。 特点# Queryable 是一个开源的 iOS 应用程序,利用 OpenAI 的 CLIP 模型在相册中进行离线搜索。Queryable 使用自然语言语句搜索照片。离线运行,隐私友好。 原理# 这个工具基于…
cover
cover

SuperAGI-快速可靠地构建和运行有用的自主AI代理

​ SuperAGI 是一个开源的自主 AI 代理框架,使开发人员能够快速可靠地构建、管理和运行有用的自主代理。 特点# 提供、生成和部署自主 AI 代理、使用工具扩展代理功能、无缝运行并发代理、图形用户界面、动作控制台、多个向量数据库、多模式代理、代理轨迹微调、性能遥测…
FreeGPT-接入g4f自由使用GPT资源的web网页
​ FreeGPT使用 g4f api 的 WebUI 项目,可以让用户体验 ChatGPT 的强大功能,具有用户友好的界面和完全免费的特点。 特点# 后台使用gpt4free的 api 接口,直接使用 GPT4/3.5 以及其他对话模型。 部署# 安装 freegpt C…
cover

MobileSAM-比FastSAM还要Faster的SAM

​ MobileSAM比 FastSAM 更小,速度更快,并且与 SAM 的处理流程更接近。 特点# MobileSAM 比当前的 FastSAM 小约 7 倍,快约 5 倍,特点就是又快又好。 部署# 安装项目 Copy git clone git@github.com…
Ownership of this blog data is guaranteed by blockchain and smart contracts to the creator alone.