「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > 初めて完全にマルチ GPU をサポートし、Gradio インターフェイスを備えた非常に高度なバッチ画像キャプション アプリが公開されました

初めて完全にマルチ GPU をサポートし、Gradio インターフェイスを備えた非常に高度なバッチ画像キャプション アプリが公開されました

2024 年 8 月 28 日に公開

JoyCaption によるマルチ GPU バッチ キャプション。 JoyCaption は、Meta-Llama-3.1–8B、google/siglip-so400m-patch14–384、および微調整された画像キャプション ニューラル ネットワークを使用します。

リンク: https://www.patreon.com/posts/110613301

バッチキャプションエディターへのリンク: https://www.patreon.com/posts/108992085

Python、Torch、ビットサンドバイトでマルチ GPU をコーディングするのは本当に挑戦でした。

私たちのアプリは、JoyCaption 画像キャプションの微調整モデルを使用しています。

当社のアプリは、マルチ GPU モード (9.5 GB VRAM) でもビットサンドバイト 4 ビット モデルの読み込みをサポートしています

8x RTX A6000 (クラウド) および RTX 3090 TI RTX 3060 (私の PC) でテスト済み

Windows、RunPod、Massed Compute にワンクリックでインストール



