Discrepância de dados de treinamento Keras
Ao seguir o guia oficial do TensorFlow para construir uma rede neural com Keras, você percebeu que o modelo usa apenas um parte do conjunto de dados disponível durante o treinamento, apesar de ter 60.000 entradas.
Compreendendo o lote Tamanho
O número 1875 exibido durante o ajuste do modelo não é uma indicação de amostras de treinamento, mas sim o número de lotes. O método model.fit possui um argumento opcional, batch_size, que determina o número de pontos de dados que são processados simultaneamente durante o treinamento.
Se você não especificar um batch_size, o valor padrão será 32. Nesse caso, com um conjunto de dados total de 60.000 imagens, o número de lotes se torna:
60000 / 32 = 1875
Portanto, embora você tenha 60.000 pontos de dados, o modelo na verdade treina em 1.875 lotes, cada lote contendo 32 pontos de dados. Essa é uma prática comum para reduzir o consumo de memória e melhorar a velocidade do treinamento.
Ajustando o tamanho do lote
Para usar todo o conjunto de dados durante o treinamento sem lote, você pode especificar um batch_size de 60.000 no método model.fit. No entanto, isso pode potencialmente retardar o treinamento e exigir mais memória.
Como alternativa, você pode ajustar o batch_size para encontrar um compromisso entre a eficiência do treinamento e a utilização da memória. Por exemplo, você poderia configurá-lo para 1024 ou 2048, o que ainda reduziria significativamente o número de lotes sem sacrificar muito o desempenho.
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3