最近、PHI3でDSPYをテストしました。Coproを使用して迅速な指示を改善し、最高のスコアを達成することを目指しています。私は意図的にアサーションを使用しませんでした。
ここに私が好きなことがあります:
私は、文法のために注釈された23の言語出版物からの文を含むCola Datasetを使用しました。 dspyはうまく機能する指示を生成し、文法的正しさを確保する:
元の命令:文が正しいかどうかを確認します(1)かどうか(0)
最適化された命令:指定された文が文法的に正しい場合は「1」を出力し、誤った「0」を出力することにより、標準の英語文法ルールを順守するかどうかを判断します。
Bootstrapfewshotと署名オプティマイザーの両方が素晴らしい出発点です。
改善できるもの:
dspyは、「トレーニングが完了すると、署名を手動で編集するためのより良い指示とプレフィックスがあります。」ただし、コンパイル後のツールは予測する準備ができている必要があると思います。命令オプティマイザーは、他の言語とのより良い互換性など、微調整を容易にするために、より柔軟にする必要があります。あるいは、必要に応じてプロンプトを微調整するための署名オプティマイザーのプログラムを作成することは有益です。
それはクールな概念ですが、フレームワークとしてはまだ改善が必要だと思います。興味深いプロジェクト/共通の関心がある場合は、私とつながりましょう。
gihub repo
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3