Quelle est la différence entre FP et BF Voici une bonne explication pour vous

Page de garde > La programmation > Quelle est la différence entre FP et BF Voici une bonne explication pour vous

Quelle est la différence entre FP et BF Voici une bonne explication pour vous

Publié le 2024-08-17

Parcourir:572

What is the difference between FPand BF Here a good explanation for you

Représentation à virgule flottante :

FP16 (demi-précision) : dans FP16, un nombre à virgule flottante est représenté à l'aide de 16 bits. Il se compose de 1 bit de signe, 5 bits pour l'exposant et 10 bits pour la fraction (mantisse). Ce format offre une plus grande précision pour représenter les valeurs fractionnaires dans sa plage.

BF16 (BFloat16) : BF16 utilise également 16 bits, mais avec une distribution différente. Il comporte 1 bit de signe, 8 bits pour l'exposant et 7 bits pour la mantisse. Ce format sacrifie une certaine précision dans la partie fractionnaire pour s'adapter à un plus large éventail d'exposants.

Plage numérique :

FP16 a une plage plus petite mais une précision plus élevée dans cette plage en raison de sa mantisse de 10 bits.
BF16 a une plage plus large mais une précision inférieure pour les valeurs fractionnaires en raison de son exposant de 8 bits et de sa mantisse de 7 bits.

Exemples :

Utilisons des exemples pour illustrer les différences entre FP16 et BF16 avec 3 exemples de cas. TensorFlow est utilisé pour partager les tests et le code en bas :

Valeur d'origine : 0,0001 — Les deux méthodes peuvent représenter
FP16 : 0,00010001659393 (binaire : 0|00001|1010001110, Hex : 068E) — 10 mantisses et 5 exposants
BF16 : 0,00010013580322 (binaire : 0|01110001|1010010, Hex : 38D2) — 7 mantisses et 8 exposants

Comme vous pouvez le voir, ils ont un exposant et une mantisse différents et sont donc capables de représenter différemment. Mais nous pouvons voir que le FP16 l'a représenté avec plus de précision et une valeur plus proche.

Valeur originale : 1e-08 (0,00000001)
FP16 : 0,00000000000000 (binaire : 0|00000|0000000000, Hex : 0000)
BF16 : 0,00000001001172 (B inaire : 0|01100100| 0101100, hexadécimal : 322C)

C'est un cas très intéressant. FP16 échoue et rend le résultat 0 mais BF16 est capable de le représenter avec un formatage spécial.

Valeur originale : 100000.00001
FP16 : inf (binaire : 0|11111|0000000000, Hex : 7C00)
BF16 : 99840.000000000000000 (binaire : 0|10001111|1 000011, hexadécimal : 47C3 )

Dans le cas ci-dessus, FP16 échoue car tous les bits d'exposant deviennent pleins et ne suffisent pas pour représenter la valeur. Cependant BF16 fonctionne

Cas d'utilisation :

FP16 est couramment utilisé dans la formation et l'inférence en apprentissage profond, en particulier pour les tâches qui nécessitent une grande précision dans la représentation de petites valeurs fractionnaires dans une plage limitée.

BF16 devient populaire dans les architectures matérielles conçues pour les tâches d'apprentissage automatique qui bénéficient d'une gamme plus large de valeurs représentables, même au prix d'une certaine précision dans la partie fractionnaire. C'est particulièrement utile lorsqu'il s'agit de gradients importants ou lorsque la stabilité numérique sur une large plage est plus importante que la précision de petites valeurs.

En résumé

FP16 offre une plus grande précision pour les valeurs fractionnaires dans une plage plus petite, ce qui le rend adapté aux tâches nécessitant une représentation précise de petits nombres. BF16, en revanche, offre une plage plus large au détriment d'une certaine précision, ce qui le rend avantageux pour les tâches impliquant un spectre de valeurs plus large ou lorsque la stabilité numérique sur une large plage est cruciale. Le choix entre FP16 et BF16 dépend des exigences spécifiques de la tâche d'apprentissage automatique à accomplir.

Conclusion finale

Pour toutes les raisons ci-dessus, lors de la formation Stable Diffusion XL (SDXL), FP16 et BF16 nécessitent des taux d'apprentissage légèrement différents et je trouve que BF16 fonctionne mieux.

Le code utilisé pour générer les exemples ci-dessus

import tensorflow as tf
import struct

def float_to_binary(f):
    return ''.join(f'{b:08b}' for b in struct.pack('>f', f))

def display_fp16(value):
    fp16 = tf.cast(tf.constant(value, dtype=tf.float32), tf.float16)
    fp32 = tf.cast(fp16, tf.float32)
    binary = format(int.from_bytes(fp16.numpy().tobytes(), 'big'), '016b')
    sign = binary[0]
    exponent = binary[1:6]
    fraction = binary[6:]
    return f"FP16: {fp32.numpy():14.14f} (Binary: {sign}|{exponent}|{fraction}, Hex: {fp16.numpy().view('uint16'):04X})"

def display_bf16(value):
    bf16 = tf.cast(tf.constant(value, dtype=tf.float32), tf.bfloat16)
    bf32 = tf.cast(bf16, tf.float32)
    binary = format(int.from_bytes(bf16.numpy().tobytes(), 'big'), '016b')
    sign = binary[0]
    exponent = binary[1:9]
    fraction = binary[9:]
    return f"BF16: {bf32.numpy():14.14f} (Binary: {sign}|{exponent}|{fraction}, Hex: {bf16.numpy().view('uint16'):04X})"

values = [0.0001, 0.00000001, 100000.00001]

for value in values:
    print(f"\nOriginal value: {value}")
    print(display_fp16(value))
    print(display_bf16(value))

Déclaration de sortie Cet article est reproduit sur : https://dev.to/furkangozukara/what-is-the-difference-between-fp16-and-bf16-here-a-good-explanation-for-you-gag?1S'il y en a infraction, veuillez contacter [email protected] pour supprimer

Dernier tutoriel Plus>

Comment puis-je générer efficacement des limaces adaptées à l'URL des chaînes Unicode en PHP?
Créant une fonction pour la génération efficace des limaces Création de limaces, des représentations simplifiées des chaînes Unicode utilisées...

La programmation Publié le 2025-04-26
Quelles ont été les restrictions sur l'utilisation de Current_timestamp avec des colonnes horodatotes dans MySQL avant la version 5.6.5?
Restrictions sur les colonnes horodat Clause actuelle_timestamp. Cette limitation s'est étendue aux entiers INT, BigInt et SmallInt lorsqu'...

La programmation Publié le 2025-04-26
Comment simplifier l'analyse JSON en PHP pour les tableaux multidimensionnels?
analysant JSON avec php essayer d'analyser les données JSON dans PHP peut être difficile, surtout lorsque vous traitez des tableaux multidim...

La programmation Publié le 2025-04-26
Pourquoi y a-t-il des rayures dans mon fond de dégradé linéaire, et comment puis-je les réparer?
bannissant les bandes d'arrière-plan à partir du gradient linéaire Lorsque vous utilisez la propriété linéaire-gradient pour un arrière-pl...

La programmation Publié le 2025-04-26
Raisons de CodeIgniter à se connecter à la base de données MySQL après le passage à MySQLI
Impossible de se connecter à la base de données MySQL: dépannage du message d'erreur Lorsque vous tentez de passer du pilote MySQL vers le...

La programmation Publié le 2025-04-26
Python Metaclass Principe de travail et création et personnalisation de classe
Que sont les métaclasses dans python? Les métaclasses sont responsables de la création d'objets de classe dans python. Tout comme les classe...

La programmation Publié le 2025-04-26
Implémentation dynamique réfléchissante de l'interface GO pour l'exploration de la méthode RPC
Réflexion pour l'implémentation d'interface dynamique dans go la réflexion dans go est un outil puissant qui permet l'inspection e...

La programmation Publié le 2025-04-26
Comment pouvez-vous utiliser des données de groupe par pour pivoter dans MySQL?
Pivoting des résultats de la requête en utilisant le groupe mysql par Dans une base de données relationnelle, les données pivotant se réfèrent...

La programmation Publié le 2025-04-26
Comment puis-je créer efficacement des dictionnaires en utilisant la compréhension Python?
Python Dictionary Comprehension Dans Python, les compréhensions du dictionnaire offrent un moyen concis de générer de nouveaux dictionnaires. Bi...

La programmation Publié le 2025-04-26
$Résoudre l'erreur \\ "Erreur de valeur de chaîne \\" Exception lorsque MySQL inserte emoji$
Résoudre l'erreur \\ "Erreur de valeur de chaîne \\" Exception lorsque MySQL inserte emoji
Résolution de la valeur de chaîne incorrecte Exception lors de l'insertion d'Emoji Lorsque vous essayez d'insérer une chaîne contena...

La programmation Publié le 2025-04-26
Comment puis-je sélectionner par programmation tout le texte dans un clic div sur la souris?
Sélection du texte div sur la souris Cliquez sur Question Étant donné un élément div avec du contenu de texte, comment l'utilisateur peut-...

La programmation Publié le 2025-04-26
Comment extraire des éléments du tableau 2D? Utilisation de l'index d'un autre tableau
Utilisation du tableau Numpy comme indices pour la 2ème dimension d'un autre tableau pour extraire des éléments spécifiques à partir d'...

La programmation Publié le 2025-04-26
Anomalies de valeur clé du tableau PHP: Comprendre le cas curieux de 07 et 08
Problème de valeur de clé du tableau php avec 07 & 08 Un tableau contient divers éléments avec des touches associées. Dans PHP, un problème in...

La programmation Publié le 2025-04-26
Comment combiner les données de trois tables MySQL dans un nouveau tableau?
mysql: création d'un nouveau tableau à partir de données et de colonnes de trois tables Question: Comment puis-je créer un nouveau tab...

La programmation Publié le 2025-04-26
Comment puis-je personnaliser les optimisations de compilation dans le compilateur Go?
Personnaliser les optimisations de compilation dans go compiller Le processus de compilation par défaut dans Go suit une stratégie d'optim...

La programmation Publié le 2025-04-26

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article