带有 JoyCaption 的多 GPU 批量字幕。 JoyCaption 使用 Meta-Llama-3.1–8B 和 google/siglip-so400m-patch14–384 以及微调的图像字幕神经网络。
链接:https://www.patreon.com/posts/110613301
批量字幕编辑器的链接:https://www.patreon.com/posts/108992085
在 Python、Torch 和 Bitsandbytes 中编码多 GPU 确实是一个挑战。
我们的APP使用JoyCaption图像字幕微调模型。
我们的应用程序甚至在多 GPU 模式(9.5 GB VRAM)下也支持 bitsandbytes 4 位模型加载
在 8x RTX A6000(云)和 RTX 3090 TI RTX 3060(我的电脑)上测试
在 Windows、RunPod 和 Massed Compute 上一键安装
出色的字幕质量,自动将图像分配到每个 GPU,功能很多。您可以使用跳过带字幕的图像选项来恢复字幕。
有关完整详细信息,请查看屏幕截图
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3