JoyCaption によるマルチ GPU バッチ キャプション。 JoyCaption は、Meta-Llama-3.1–8B、google/siglip-so400m-patch14–384、および微調整された画像キャプション ニューラル ネットワークを使用します。
リンク: https://www.patreon.com/posts/110613301
バッチキャプションエディターへのリンク: https://www.patreon.com/posts/108992085
Python、Torch、ビットサンドバイトでマルチ GPU をコーディングするのは本当に挑戦でした。
私たちのアプリは、JoyCaption 画像キャプションの微調整モデルを使用しています。
当社のアプリは、マルチ GPU モード (9.5 GB VRAM) でもビットサンドバイト 4 ビット モデルの読み込みをサポートしています
8x RTX A6000 (クラウド) および RTX 3090 TI RTX 3060 (私の PC) でテスト済み
Windows、RunPod、Massed Compute にワンクリックでインストール
優れたキャプション品質、各GPUへの画像の自動配信など、多くの機能を備えています。キャプション付き画像をスキップするオプションを使用してキャプションを再開できます。
詳細については、スクリーンショットをご覧ください
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3