Keras トレーニング データの不一致
公式の TensorFlow ガイドに従って Keras でニューラル ネットワークを構築しているときに、モデルが60,000 のエントリがあるにもかかわらず、トレーニング中に利用可能なデータセットの一部です。
バッチ サイズについて
モデルのフィッティング中に表示される数字 1875 は、トレーニング サンプルを示すものではなく、むしろバッチの数。 model.fit メソッドにはオプションの引数、batch_size があり、トレーニング中に同時に処理されるデータ ポイントの数を決定します。
batch_size を指定しない場合、デフォルト値は 32 です。この場合、合計 60,000 画像のデータセットの場合、バッチ数は次のようになります:
60000 / 32 = 1875
したがって、データ ポイントは 60,000 個ありますが、モデルは実際には各バッチ 1875 バッチでトレーニングします。 32 個のデータポイントが含まれています。これは、メモリ フットプリントを削減し、トレーニング速度を向上させるための一般的な方法です。
バッチ サイズの調整
バッチ処理を行わずにトレーニング中にデータセット全体を使用するには、 model.fitメソッドのbatch_sizeは60000です。ただし、これによりトレーニングの速度が低下し、より多くのメモリが必要になる可能性があります。
または、batch_size を調整して、トレーニング効率とメモリ使用率の間の妥協点を見つけることもできます。たとえば、1024 または 2048 に設定しても、パフォーマンスをあまり犠牲にすることなくバッチ数を大幅に減らすことができます。
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3