開発におけるオープンソース AI モデルの使用

2024 年 11 月 9 日に公開

ブラウズ：508

El uso de los modelos de IA open source en el desarrollo

昨年、画像生成であれチャットボットであれ、ユーザーの生活を楽にする人工知能を搭載したツールが多数登場し、巨大でプロフェッショナルな機能を実行するツールにまで拡張されました。プロセス。

私は、chatgpt、gemini、dall-e、midjourney に至るまで、これらのツールの多くを研究、学習、テストしてきました。それらはすべて非常にうまく機能しますが、これらのツールを使用してアプリケーションを拡張したい場合、それらには無料またはオープンな代替ソース。

これにより、研究をさらに一歩進めることができ、安定拡散 ui (画像生成、https://github.com/AUTOMATIC1111/stable-diffusion-webui) と * に出会いました。 ollama *(Chatbot、https://ollama.com/)、どちらもオープンソースツールで、サービスを API として実行して、当社のアプリケーションからサービスを利用できるようになります。これで私は到着しました私はオープンソースの代替案をさらに進めていますが、これが機能するには、アプリケーションで使用できるようにこれらのツールを実行し続ける必要があります。

これをアプリケーションに導入する方法を理解するには、これらのツールがどのように機能するかを理解することが重要です。基本的に、ツールが行うことは、LLM または大規模言語モデルである「safetensors」拡張子を持つファイルを使用することです。これらのモデルは、実行するようにトレーニングされています。トレーニングする人のニーズに応じたさまざまな機能 (例: 画像生成、翻訳、コード開発、チャットボットなど)。

LLM モデルと「セーフテンソル」ファイルについて少し理解すると、次の質問が得られます。これらのファイルをアプリケーションで使用する方法です。ここで、オープンソースの人工知能の Web サイト/データベースである HugginFace が登場します。彼らは、私たちが必要とする 2 つの非常に便利なコンポーネント「Transformers」と「Diffusers」を備えた独自の Python ライブラリを作成しました。

*Transformers *(https://huggingface.co/docs/transformers/index) は、特殊なテキストモデルを使用できるようにするコンポーネントです。たとえば、オーディオからテキストへの変換、またはその逆の変換など、メタフレームとしてのチャットボックスなど。

変圧器をインポート

import torch

model_id = "meta-llama/Llama-3.1-8B"

pipeline = transformers.pipeline(
    "text-generation", model=model_id, model_kwargs={"torch_dtype": torch.bfloat16}, device_map="auto"
)

pipeline("Hey how are you doing today?")

ディフューザー (https://huggingface.co/docs/diffusers/index) は、安定した拡散などの画像生成に特化したモデルを利用できるようにするコンポーネントです。

from diffusers import AutoPipelineForText2Image
import torch

pipe = AutoPipelineForText2Image.from_pretrained("stabilityai/sdxl-turbo", torch_dtype=torch.float16, variant="fp16")
pipe.to("cuda")

prompt = "A cinematic shot of a baby racoon wearing an intricate italian priest robe."

image = pipe(prompt=prompt, num_inference_steps=1, guidance_scale=0.0).images[0]

このプロセスは LLM モデル推論として知られており、この情報に基づいて、Python を使用してさまざまなアプリケーションに人工知能の適用を開始できます。

nodejs などの別の言語でもモデル推論を使用しようとしましたが、実際には Python ほどうまく機能しません。ただし、LLM には強力なハードウェアが必要であることに言及することが重要です。モデル推論により、ChatGPT または Gemini API を使用して節約できる分を、適切なハードウェアの購入に費やすことができます。

これが私の最初の記事です。ソフトウェア開発における LLM モデルの使用に関する私の道が、この道の手順をスキップするのに役立つことを願っています。

リリースステートメントこの記事は次の場所に転載されています: https://dev.to/miguelbc7/el-uso-de-los-modelos-de-ia-open-source-en-el-desarrollo-3j9h?1 侵害がある場合は、 Study_golang@163 .comdelete に連絡してください

最新のチュートリアルもっと>

さまざまな数の列を持つデータベーステーブルを結合するにはどうすればよいですか？
異なる列とのテーブルを組み合わせた ] は、データベーステーブルを異なる列とマージしようとする場合に課題に遭遇する可能性があります。簡単な方法は、列が少ないテーブルに欠落している列にnull値を追加することです。たとえば、表Aと表Bの2つの表Aと表Bがあります。表Aは、テーブルBよりも多...

プログラミング 2025-03-28に投稿されました
FlexBoxと垂直スクロールをフルハイトレイアウトで効果的に組み合わせるにはどうすればよいですか？
FlexBoxと垂直スクロールをフルハイトレイアウトに統合するフルハイトアプリケーションを操作する場合、FlexBoxと垂直スクロールバーを組み合わせた場合、一般的な要件になります。ただし、フレックスボックスレイアウトのインタラクティブな性質により、課題を引き起こす可能性があります。こ...

プログラミング 2025-03-28に投稿されました
データ挿入時の「一般エラー: 2006 MySQL サーバーが消えました」を修正するにはどうすればよいですか?
レコードの挿入中に「一般エラー: 2006 MySQL サーバーが消えました」を解決する方法はじめに:MySQL データベースにデータを挿入すると、「一般エラー: 2006 MySQL サーバーが消えました。」というエラーが発生することがあります。このエラーは、通常、MySQL 構成内の 2 つの変...

プログラミング 2025-03-28に投稿されました
セル編集後にカスタムJTableセルレンダリングを維持するにはどうすればよいですか？
セル編集後のjtableセルレンダリングの維持は、カスタムセルのレンダリングと編集機能を実装することでユーザーエクスペリエンスを向上させることができます。ただし、操作を編集した後でも目的のフォーマットが保存されることを保証することが重要です。このようなシナリオでは、編集がコミットされた後...

プログラミング 2025-03-28に投稿されました
順序付けられていないコレクションにタプルの一般的なハッシュ関数を実装する方法は？
std :: unordered_mapとunordered_setコンテナは、ハスド値に基づいて効率的なルックアップと元素の挿入を提供します。ただし、カスタムハッシュ関数を定義せずにこれらのコレクションのキーとしてタプルを使用すると、予期しない動作につながる可能性があります。 st...

プログラミング 2025-03-28に投稿されました
PHPでタイムゾーンを効率的に変換する方法は？
php での効率的なタイムゾーン変換は、タイムゾーンの取り扱いは簡単なタスクになる可能性があります。このガイドは、異なるタイムゾーン間で日付と時間を変換するための簡単な実装方法を提供します。たとえば、 //ユーザーのタイムゾーンを定義します date_default_timezone_s...

プログラミング 2025-03-28に投稿されました
Silverlight linqクエリで「クエリパターンの実装が見つからなかった」エラーを取得するのはなぜですか？
Queryパターンの実装不在：「silverlightアプリケーションで「&&&&] を解決する」cleryパターンの不在、linqを使用してデータベース接続を確立しようとする試みは、「クエリパターンの実装」を見つけることができませんでした。このエラーは通常、LINQネームスペースが省略...

プログラミング 2025-03-28に投稿されました
JavaScriptオブジェクトにキーを動的に設定する方法は？
JavaScriptオブジェクト変数の動的キーを作成する方法この構文jsObj['key' i] = 'example' 1; はjavascriptで、アレイは特殊なタイプのオブジェクトです。この特別な動作は標準のオブジェクトによって模倣されていませんが、四角いブラケット演算子は...

プログラミング 2025-03-28に投稿されました
オブジェクトフィット：IEとEdgeでカバーが失敗します、修正方法は？
object-fit：カバーがIEとEDGEで失敗します。 CSSでは、一貫した画像の高さを維持するために、ブラウザ全体でシームレスに動作します。ただし、IEとEdgeでは、独特の問題が発生します。ブラウザをスケーリングすると、画像は高さをズームするのではなく幅でサイズを変更し、外観を歪め...

プログラミング 2025-03-28に投稿されました
Node-MYSQLを使用して単一のクエリで複数のSQLステートメントを実行するにはどうすればよいですか？
node-mysql in node.jsでのマルチステートメントクエリサポート、ノード-Mysqlパッケージを使用してnode-mysqlを使用してnode-mysqlを使用して、1つのクエリを使用してnode-mysqlの記録を使用して、1つのクエリで複数のsqlステートメントを...

プログラミング 2025-03-28に投稿されました
PHPの配列からランダムな要素をどのように抽出しますか？
配列からのランダム選択は、配列からランダムなアイテムを取得することができます。次の配列を検討してください： $items = [523, 3452, 334, 31, 5346]; この配列からランダムなアイテムを取得するために、array_rand（）関数を利用することは効果的なソリューシ...

プログラミング 2025-03-28に投稿されました
Java文字列に複数のサブストリングを効率的に交換するにはどうすればよいですか？
java で複数のサブストリングを弦の複数のサブストリングを置き換えると、文字列内の複数のサブストリングを置き換える必要性に直面すると、弦楽列の方法を繰り返し担当するブルートのアプローチに頼ることに魅力的です。ただし、これは大きな文字列や多数の文字列を使用する場合は非効率的です。正規表...

プログラミング 2025-03-28に投稿されました
オブジェクトがPythonに特定の属性を持っているかどうかを確認する方法は？
メソッドオブジェクト属性の存在を決定するメソッドこの問い合わせは、オブジェクト内の特定の属性の存在を検証する方法を求めています。未定義のプロパティにアクセスしようとする試みがエラーを提起する次の例を考えてみましょう： >>> a = SomeClass() >&g...

プログラミング 2025-03-28に投稿されました
マウスクリック時にDiv内のすべてのテキストをプログラム的に選択するにはどうすればよいですか？
マウスクリックでプログラムをプログラム的に選択する質問テキストコンテンツのdiv要素が与えられた場合、ユーザーは1つのマウスクリックでdiv内のテキスト全体をプログラム的に選択できますか？これにより、ユーザーは選択したテキストを簡単にドラッグアンドドロップしたり、直接コピーしたりできます。...

プログラミング 2025-03-28に投稿されました
Javaのフルスクリーン専用モードでユーザー入力を処理する方法は？
ハンドリングユーザー入力は、java intuling in full screenの排他的モードでのフルスクリーンの排他的モードでのハンドリングを排他的モードで実行するとき、通常のイベント処理メカニズムは予想されるように機能しない場合があります。この記事では、このモードでキーボード...

プログラミング 2025-03-28に投稿されました