"Se um trabalhador quiser fazer bem o seu trabalho, ele deve primeiro afiar suas ferramentas." - Confúcio, "Os Analectos de Confúcio. Lu Linggong"
Primeira página > Programação > Por que meu modelo Keras treina apenas em uma parte do meu conjunto de dados?

Por que meu modelo Keras treina apenas em uma parte do meu conjunto de dados?

Publicado em 2024-11-18
Navegar:474

 Why does my Keras model only train on a portion of my dataset?

Discrepância de dados de treinamento Keras

Ao seguir o guia oficial do TensorFlow para construir uma rede neural com Keras, você percebeu que o modelo usa apenas um parte do conjunto de dados disponível durante o treinamento, apesar de ter 60.000 entradas.

Compreendendo o lote Tamanho

O número 1875 exibido durante o ajuste do modelo não é uma indicação de amostras de treinamento, mas sim o número de lotes. O método model.fit possui um argumento opcional, batch_size, que determina o número de pontos de dados que são processados ​​simultaneamente durante o treinamento.

Se você não especificar um batch_size, o valor padrão será 32. Nesse caso, com um conjunto de dados total de 60.000 imagens, o número de lotes se torna:

60000 / 32 = 1875

Portanto, embora você tenha 60.000 pontos de dados, o modelo na verdade treina em 1.875 lotes, cada lote contendo 32 pontos de dados. Essa é uma prática comum para reduzir o consumo de memória e melhorar a velocidade do treinamento.

Ajustando o tamanho do lote

Para usar todo o conjunto de dados durante o treinamento sem lote, você pode especificar um batch_size de 60.000 no método model.fit. No entanto, isso pode potencialmente retardar o treinamento e exigir mais memória.

Como alternativa, você pode ajustar o batch_size para encontrar um compromisso entre a eficiência do treinamento e a utilização da memória. Por exemplo, você poderia configurá-lo para 1024 ou 2048, o que ainda reduziria significativamente o número de lotes sem sacrificar muito o desempenho.

Tutorial mais recente Mais>

Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.

Copyright© 2022 湘ICP备2022001581号-3