Qual é a diferença entre FP e BF Aqui uma boa explicação para você

Primeira página > Programação > Qual é a diferença entre FP e BF Aqui uma boa explicação para você

Qual é a diferença entre FP e BF Aqui uma boa explicação para você

Publicado em 17/08/2024

Navegar:683

What is the difference between FPand BF Here a good explanation for you

Representação de ponto flutuante:

FP16 (Half Precision): No FP16, um número de ponto flutuante é representado usando 16 bits. Consiste em 1 bit de sinal, 5 bits para o expoente e 10 bits para a fração (mantissa). Este formato fornece maior precisão para representar valores fracionários dentro de seu intervalo.

BF16 (BFloat16): BF16 também usa 16 bits, mas com uma distribuição diferente. Possui 1 bit de sinal, 8 bits para o expoente e 7 bits para a mantissa. Este formato sacrifica alguma precisão na parte fracionária para acomodar uma gama mais ampla de expoentes.

Intervalo numérico:

FP16 tem um intervalo menor, mas maior precisão dentro desse intervalo devido à sua mantissa de 10 bits.
BF16 tem um intervalo mais amplo, mas menor precisão para valores fracionários devido ao seu expoente de 8 bits e mantissa de 7 bits.

Exemplos:

Vamos usar exemplos para ilustrar as diferenças entre FP16 e BF16 com 3 casos de exemplo. O TensorFlow é usado para fazer os testes e o código compartilhados na parte inferior:

Valor original: 0,0001 — Ambos os métodos podem representar
FP16: 0,00010001659393 (Binário: 0|00001|1010001110, Hex: 068E) — 10 mantissas e 5 expoentes
BF16: 0,00010013580322 (Binário: 0|01110001|1010010, Hex: 38D2) — 7 mantissa e 8 expoentes

Como você pode ver, eles têm expoentes e mantissa diferentes e, portanto, são capazes de representar de forma diferente. Mas podemos ver que o FP16 representou isso com mais precisão e com um valor mais próximo.

Valor original: 1e-08 (0,00000001)
FP16: 0,00000000000000 (Binário: 0|00000|0000000000, Hex: 0000)
BF16: (Binário: 0|01100100| 0101100, hexadecimal: 322C)

Este é um caso muito interessante. FP16 falha e torna o resultado 0, mas BF16 é capaz de representá-lo com uma formatação especial.

Valor original: 100000,00001
FP16: inf (Binário: 0|11111|0000000000, Hex: 7C00)
BF16: 99840.0000000000000 (Binário: 0|10001111 |1000011, hexadecimal: 47C3 )

No caso acima, FP16 falha pois todos os bits do expoente ficam cheios e não são suficientes para representar o valor. Mas BF16 funciona

Casos de uso:

FP16 é comumente usado em treinamento e inferência de aprendizado profundo, especialmente para tarefas que exigem alta precisão na representação de pequenos valores fracionários dentro de um intervalo limitado.

BF16 está se tornando popular em arquiteturas de hardware projetadas para tarefas de aprendizado de máquina que se beneficiam de uma gama mais ampla de valores representáveis, mesmo ao custo de alguma precisão na parte fracionária. É particularmente útil ao lidar com gradientes grandes ou quando a estabilidade numérica em uma ampla faixa é mais importante do que a precisão de valores pequenos.

Resumindo

FP16 oferece maior precisão para valores fracionários dentro de uma faixa menor, tornando-o adequado para tarefas que exigem representação precisa de números pequenos. O BF16, por outro lado, oferece uma faixa mais ampla ao custo de alguma precisão, tornando-o vantajoso para tarefas que envolvem um espectro mais amplo de valores ou onde a estabilidade numérica em uma ampla faixa é crucial. A escolha entre FP16 e BF16 depende dos requisitos específicos da tarefa de aprendizado de máquina em questão.

Conclusão final

Devido a todas as razões acima, ao fazer o treinamento Stable Diffusion XL (SDXL), FP16 e BF16 requerem taxas de aprendizagem ligeiramente diferentes e acho que BF16 funciona melhor.

O código usado para gerar os exemplos acima

import tensorflow as tf
import struct

def float_to_binary(f):
    return ''.join(f'{b:08b}' for b in struct.pack('>f', f))

def display_fp16(value):
    fp16 = tf.cast(tf.constant(value, dtype=tf.float32), tf.float16)
    fp32 = tf.cast(fp16, tf.float32)
    binary = format(int.from_bytes(fp16.numpy().tobytes(), 'big'), '016b')
    sign = binary[0]
    exponent = binary[1:6]
    fraction = binary[6:]
    return f"FP16: {fp32.numpy():14.14f} (Binary: {sign}|{exponent}|{fraction}, Hex: {fp16.numpy().view('uint16'):04X})"

def display_bf16(value):
    bf16 = tf.cast(tf.constant(value, dtype=tf.float32), tf.bfloat16)
    bf32 = tf.cast(bf16, tf.float32)
    binary = format(int.from_bytes(bf16.numpy().tobytes(), 'big'), '016b')
    sign = binary[0]
    exponent = binary[1:9]
    fraction = binary[9:]
    return f"BF16: {bf32.numpy():14.14f} (Binary: {sign}|{exponent}|{fraction}, Hex: {bf16.numpy().view('uint16'):04X})"

values = [0.0001, 0.00000001, 100000.00001]

for value in values:
    print(f"\nOriginal value: {value}")
    print(display_fp16(value))
    print(display_bf16(value))

Declaração de lançamento Este artigo foi reproduzido em: https://dev.to/furkangozukara/what-is-the-difference-between-fp16-and-bf16-here-a-good-explanation-for-you-gag?1Se houver algum violação, entre em contato com [email protected] para excluir

Tutorial mais recente Mais>

Como criar variáveis dinâmicas no Python?
Criação variável dinâmica em python A capacidade de criar variáveis dinamicamente pode ser uma ferramenta poderosa, especialmente ao trabalhar...

Programação Postado em 2025-07-17
Como limitar o intervalo de rolagem de um elemento dentro de um elemento pai de tamanho dinâmico?
implementando limites de altura CSS para elementos de rolagem vertical em uma interface interativa, o controle do comportamento de rolagem dos...

Programação Postado em 2025-07-17
Como recuperar com eficiência a última linha para cada identificador exclusivo no PostGresql?
postGresql: Extraindo a última linha para cada identificador exclusivo em postgresql, você pode encontrar situações em que você precisa extrai...

Programação Postado em 2025-07-17
Encontre o método do elemento de script que atualmente executa o JavaScript
como fazer referência ao elemento de script que carregava o script atualmente executando compreendendo o problema em certos cenários, os desen...

Programação Postado em 2025-07-17
Como posso iterar de maneira síncrona e imprimir valores de duas matrizes de tamanho igual no PHP?
iterando e imprimindo valores de duas matrizes do mesmo tamanho ao criar uma caixa selecionada usando duas matrizes de tamanho igual, um contend...

Programação Postado em 2025-07-17
Como posso selecionar programaticamente todo o texto dentro de uma div em mouse clique?
selecionando programaticamente o texto div no mouse click question dado um elemento Div com conteúdo de texto, como o usuário pode selecionar ...

Programação Postado em 2025-07-17
Existe uma diferença de desempenho entre usar um loop for-Each e um iterador para travessia de coleção em Java?
para cada loop vs. iterator: eficiência na coleção Traversal Introduction quando travessing uma coleção em java, the ARIDES quando trave...

Programação Postado em 2025-07-17
Como repetir com eficiência caracteres de string para recuo em C#?
repetindo uma string para o indentação Ao recuperar uma string com base na profundidade de um item, é conveniente ter uma maneira eficiente de...

Programação Postado em 2025-07-17
Os parâmetros de modelo podem na função C ++ 20 ConstEval depender dos parâmetros da função?
funções constEval e parâmetros de modelos dependentes de argumentos da função em c 17, um parâmetro de modelo não pode depender de um argument...

Programação Postado em 2025-07-17
Tarefa assíncroada vs. assíncrona em asp.net: Por que o método assíncrono void às vezes joga exceções?
Entendendo a distinção entre a tarefa assíncrona e async em asp.net em ASP.NET APLICAÇÕES, ASYNCHRONOUS PROGRATIONS APRESENCIA UM REMAÇÃO CRUC...

Programação Postado em 2025-07-17
Como analisar números na notação exponencial usando decimal.parse ()?
analisando um número da notação exponencial ao tentar analisar uma string expressa em anotação exponencial usando Decimal.parse ("1.2345e...

Programação Postado em 2025-07-17
Como evitar vazamentos de memória ao fatiar a linguagem?
vazamento de memória em go slies Compreendendo os vazamentos de memória nas fatias Go pode ser um desafio. Este artigo tem como objetivo forne...

Programação Postado em 2025-07-17
Usuário Formato de tempo local e Guia de exibição de deslocamento de fuso horário
exibindo data/hora no formato de localidade do usuário com o time offset abordagem: A abordagem recomendada é lidar com a formatação de dat...

Programação Postado em 2025-07-17
Como posso lidar com os nomes de arquivos UTF-8 nas funções do sistema de arquivos do PHP?
lidando com utf-8 nomes de arquivos nas funções do sistema de arquivos do PHP Ao criar pastas que contêm caracteres utf-8 usando a função mkdi...

Programação Postado em 2025-07-17
Como analisar as matrizes json em Go usando o pacote `json`?
analisando as matrizes json em go com o pacote json Problem: como você pode analisar uma string json representando um array em Go usando o p...

Programação Postado em 2025-07-17

Classificação Mais>

Aprenda japonês Aprender coreano Aprenda chinês Aprender língua estrangeira Jogo Problema comum Periféricos de tecnologia IA Tutorial de software Programação Artigo