「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > テクノロジー周辺機器 > Mozilla Ocho チームによる Whisperfile はローカルで簡単な ASR を提供します

Mozilla Ocho チームによる Whisperfile はローカルで簡単な ASR を提供します

2024 年 11 月 8 日に公開
ブラウズ:203

Whisperfile by Mozilla Ocho team delivers local and easy ASR

llamafile プロジェクトに馴染みのない人のために説明すると、Mozilla Ocho チームは、C/ C プログラミング言語。 Llamafile は、llama.cpp によって提供される Meta の LLaMA モデルの推論を使用し、それを Cosmopolitan Libc による C の一度ビルドすればどこでも実行できる変換と組み合わせます。 Cosmopolitan Libc では、Linux、Mac、および Windows マシン上で C を実行するためのインタプリタや仮想マシンも必要なくなります。

llamafile プロジェクトへの最新の追加である Whisperfile については、Mozilla の Hugging Face プロファイルで詳しく説明されています。彼らのページによると、「Whisperfile は、Georgi Gerganov らが作成した Whisper.cpp ソフトウェアに基づいて、llamafile プロジェクトの一部として Mozilla Ocho によって作成された OpenAI の Whisper の高性能実装です。」このプロジェクトでは、チームはモデルに必要なすべての重みを、Cosmopolitan Libc にある機能を維持する「whisperfiles」にパッケージ化し、モデルをほとんどのシステムで実行できるようにしました。

チームの GitHub プロファイルには、わずか 3 つのステップからなる簡単なインストール プロセスが詳しく説明されています。ユーザーがモデルをダウンロードし、ソフトウェアを構築し、プログラムを実行すると、3 つの異なるモデルから選択して音声の文字起こしを開始できます。モデルは小型のものから大型のものまであり、転写プロセスでは速度と引き換えに精度が求められます。さらに、Whisperfile は、多言語モデルと「--translate」フラグを使用して、さまざまな言語を英語に翻訳できます。

llamafile、Whisperfile、およびインストール プロセスの詳細については、以下のリソースを参照してください。

リリースステートメント この記事は次の場所に転載されています: https://www.notebookcheck.net/Whisperfile-by-Mozilla-Ocho-team-delivers-local-and-easy-ASR.878500.0.html 権利侵害がある場合は、study_golang@163 までご連絡ください。 .comを削除してください
最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3