Keras-Trainingsdatendiskrepanz
Beim Befolgen des offiziellen TensorFlow-Leitfadens zum Aufbau eines neuronalen Netzwerks mit Keras ist Ihnen aufgefallen, dass das Modell nur a verwendet Teil des verfügbaren Datensatzes während des Trainings, obwohl 60.000 Einträge vorhanden sind.
Batch verstehen Größe
Die während der Modellanpassung angezeigte Zahl 1875 ist kein Hinweis auf Trainingsmuster, sondern eher auf die Anzahl der Chargen. Die model.fit-Methode verfügt über ein optionales Argument, „batch_size“, das die Anzahl der Datenpunkte bestimmt, die während des Trainings gleichzeitig verarbeitet werden.
Wenn Sie keine „batch_size“ angeben, ist der Standardwert 32. In diesem Fall ist Bei einem Gesamtdatensatz von 60.000 Bildern beträgt die Anzahl der Stapel:
60000 / 32 = 1875
Obwohl Sie über 60.000 Datenpunkte verfügen, trainiert das Modell tatsächlich auf 1875 Stapeln, wobei jeder Stapel 32 Datenpunkte enthält. Dies ist eine gängige Praxis, um den Speicherbedarf zu reduzieren und die Trainingsgeschwindigkeit zu verbessern.
Anpassen der Stapelgröße
Um den gesamten Datensatz während des Trainings ohne Stapelverarbeitung zu verwenden, können Sie Folgendes angeben: batch_size von 60000 in der model.fit-Methode. Dies kann jedoch möglicherweise das Training verlangsamen und mehr Speicher erfordern.
Alternativ können Sie die Batchgröße anpassen, um einen Kompromiss zwischen Trainingseffizienz und Speichernutzung zu finden. Sie könnten ihn beispielsweise auf 1024 oder 2048 festlegen, was die Anzahl der Stapel immer noch erheblich reduzieren würde, ohne zu große Einbußen bei der Leistung hinnehmen zu müssen.
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3