FP と BF の違いは何ですか。ここでわかりやすい説明をします

表紙 > プログラミング > FP と BF の違いは何ですか。ここでわかりやすい説明をします

FP と BF の違いは何ですか。ここでわかりやすい説明をします

2024 年 8 月 17 日に公開

ブラウズ：744

What is the difference between FPand BF Here a good explanation for you

浮動小数点表現:

FP16 (半精度): FP16 では、浮動小数点数が 16 ビットを使用して表現されます。符号ビット 1 ビット、指数部 5 ビット、小数部 (仮数部) 10 ビットで構成されます。この形式は、その範囲内の小数値をより高い精度で表現します。

BF16 (BFloat16): BF16 も 16 ビットを使用しますが、分布が異なります。 1 つの符号ビット、8 ビットの指数、7 ビットの仮数があります。この形式では、より広範囲の指数に対応するために、小数部分の精度がある程度犠牲になります。

数値範囲:

FP16 の範囲は狭いですが、仮数部が 10 ビットであるため、その範囲内の精度は高くなります。
BF16 の範囲は広いですが、指数が 8 ビットで仮数が 7 ビットであるため、小数値の精度が低くなります。

例:

3 つの例を使用して、FP16 と BF16 の違いを説明しましょう。 TensorFlow は、下部で共有されるテストとコードを作成するために使用されます:

元の値: 0.0001 — どちらのメソッドも
FP16: 0.00010001659393 (バイナリ: 0|00001|1010001110、16 進数: 068E) — 10 個の仮数と 5 個の指数
BF16: 0.00010013580322 (バイナリ: 0|01110001|1010010、16 進数: 38D2) — 7 つの仮数と 8 つの指数

ご覧のとおり、指数と仮数が異なるため、異なる方法で表現できます。 しかし、FP16 では、より近い値でより正確に表現されていることがわかります。

元の値: 1e-08 (0.00000001)
FP16: 0.00000000000000 (バイナリ: 0|00000|0000000000、16 進数: 0000)
BF16: 0.00000001001172 (バイナリ: 0|01100100| 0101100、16進数: 322C)

これは非常に興味深いケースです。 FP16 は失敗し、結果は 0 になりますが、BF16 は特別な形式でそれを表現できます。

元の値: 100000.00001
FP16: inf (バイナリ: 0|11111|0000000000、16 進数: 7C00)
BF16: 99840.00000000000000 (バイナリ: 0|10001111| 1000011、16 進数: 47C3 )

上記の場合、すべての指数ビットがいっぱいになり、値を表すのに十分ではないため、FP16 は失敗します。ただしBF16は動作します

ユースケース:

FP16 は、ディープラーニングのトレーニングと推論、特に限られた範囲内で小さな小数値を表現する際に高精度が必要なタスクによく使用されます。

BF16 は、小数部分の精度が多少犠牲になっても、より広範囲の表現可能な値の恩恵を受ける機械学習タスク用に設計されたハードウェアアーキテクチャで人気が高まっています。これは、大きな勾配を扱う場合、または小さな値の精度よりも広範囲にわたる数値の安定性が重要な場合に特に役立ちます。

要約すれば

FP16 は、より狭い範囲内の分数値の精度が高いため、小さな数値を正確に表現する必要があるタスクに適しています。一方、BF16 は、ある程度の精度を犠牲にしてより広い範囲を提供するため、より広範囲の値を扱うタスクや、広範囲にわたる数値の安定性が重要なタスクに有利です。 FP16 と BF16 のどちらを選択するかは、当面の機械学習タスクの特定の要件によって異なります。

最終結論

上記の理由により、安定拡散 XL (SDXL) トレーニングを行う場合、FP16 と BF16 ではわずかに異なる学習率が必要となり、BF16 の方が効果的であることがわかりました。

上記の例の生成に使用したコード

import tensorflow as tf
import struct

def float_to_binary(f):
    return ''.join(f'{b:08b}' for b in struct.pack('>f', f))

def display_fp16(value):
    fp16 = tf.cast(tf.constant(value, dtype=tf.float32), tf.float16)
    fp32 = tf.cast(fp16, tf.float32)
    binary = format(int.from_bytes(fp16.numpy().tobytes(), 'big'), '016b')
    sign = binary[0]
    exponent = binary[1:6]
    fraction = binary[6:]
    return f"FP16: {fp32.numpy():14.14f} (Binary: {sign}|{exponent}|{fraction}, Hex: {fp16.numpy().view('uint16'):04X})"

def display_bf16(value):
    bf16 = tf.cast(tf.constant(value, dtype=tf.float32), tf.bfloat16)
    bf32 = tf.cast(bf16, tf.float32)
    binary = format(int.from_bytes(bf16.numpy().tobytes(), 'big'), '016b')
    sign = binary[0]
    exponent = binary[1:9]
    fraction = binary[9:]
    return f"BF16: {bf32.numpy():14.14f} (Binary: {sign}|{exponent}|{fraction}, Hex: {bf16.numpy().view('uint16'):04X})"

values = [0.0001, 0.00000001, 100000.00001]

for value in values:
    print(f"\nOriginal value: {value}")
    print(display_fp16(value))
    print(display_bf16(value))

リリースステートメントこの記事は次の場所に転載されています: https://dev.to/furkangozukara/what-is-the-difference-between-fp16-and-bf16-here-a-good-explanation-for-you-gag?1もしあれば権利侵害、削除するには、[email protected] までご連絡ください。

最新のチュートリアルもっと>

GOでSQLクエリを構築するときに、テキストと値を安全に連結するにはどうすればよいですか？
go sql queries のテキストと値を連結するgoのテキストsqlクエリを構築する際に、特に文字列を使用した場合、文字列を使用した場合に、文字列を使用する場合、アプローチはGOでは有効ではなく、文字列としてパラメーターをキャストしようとすると、タイプのミスマッチエラーが発生しま...

プログラミング 2025-04-03に投稿されました
$PHP \の機能の再定義制限を克服する方法は？$
PHP \の機能の再定義制限を克服する方法は？
PHPの関数の再定義制限をPHPで克服することは、同じ名前の関数を複数回定義することはノーではありません。提供されたコードスニペットで見られるように、そうすることは、恐ろしい「再び削除できない」エラーになります。 $ b）{ $ a * $ b; } を返しますが、PHPツールベ...

プログラミング 2025-04-03に投稿されました
なぜ `body {margin：0; } `常にCSSの上限を削除しますか？
css の扱います。多くの場合、「ボディ{マージン：0;}」などの提供されたコードは、目的の結果を生成しません。これは、コンテンツの親要素が正のパディング値を持っている場合に発生する可能性があります。特定のマージンの問題に対処することをお勧めします。親要素にパディングがある場合、それを...

プログラミング 2025-04-03に投稿されました
Python読み取りCSVファイルUnicodedeCodeError究極のソリューション
unicode decodeエラーがcsvファイルreading 内蔵csvモジュールを使用してpythonにcsvファイルを読み込もうとする場合、エラーが発生する可能性があります： SyntaxError: (unicode error) 'unicodeescape' codec ...

プログラミング 2025-04-03に投稿されました
PHPを使用してXMLファイルから属性値を効率的に取得するにはどうすればよいですか？
XMLファイルから属性値をPHP の取得します。提供されている例のような属性を含むXMLファイルを使用する場合： $xml = simplexml_load_file($file); foreach ($xml->Var[0]->attributes() as $att...

プログラミング 2025-04-03に投稿されました
PHPのファイルシステム機能でUTF-8ファイル名を処理するにはどうすればよいですか？
PHPのファイルシステム関数のUTF-8ファイル名を処理する PHPのMKDIR関数を使用してUTF-8文字を含むフォルダーを作成するとき、に遭遇するwindows explorerに遭遇する可能性があります。 urlエンコードファイル名この問題を解決するには、urlencod...

プログラミング 2025-04-03に投稿されました
Node-MYSQLを使用して単一のクエリで複数のSQLステートメントを実行するにはどうすればよいですか？
node-mysql in node.jsでのマルチステートメントクエリサポート、ノード-Mysqlパッケージを使用してnode-mysqlを使用してnode-mysqlを使用して、1つのクエリを使用してnode-mysqlの記録を使用して、1つのクエリで複数のsqlステートメントを...

プログラミング 2025-04-03に投稿されました
「JSON」パッケージを使用してGOでJSONアレイを解析する方法は？
json arrays in jsonパッケージ問題：次のGOコードを検討してください：タイプjsontype struct { 配列[]文字列 } func main（）{ datajson：= `[" 1 "、" 2 "...

プログラミング 2025-04-03に投稿されました
McRyptからOpenSSLに暗号化を移行し、OpenSSLを使用してMcRyptで暗号化されたデータを復号化できますか？
暗号化ライブラリをMcRyptからOpenSSL にアップグレードして、暗号化ライブラリをMcRyptからOpenSLにアップグレードできますか？ OpenSSLでは、McRyptで暗号化されたデータを復号化することは可能ですか？ 2つの異なる投稿は矛盾する情報を提供します。もしそうなら...

プログラミング 2025-04-03に投稿されました
AndroidはどのようにPHPサーバーに投稿データを送信しますか？
をAndroid に送信します。これは、サーバー側の通信を扱う際の一般的なシナリオです。 apache httpclient（deprecated） httpclient httpclient = new defulthttpclient（）; httppost httppost ...

プログラミング 2025-04-03に投稿されました
CSS「コンテンツ」プロパティを使用してFirefoxが画像を表示しないのはなぜですか？
firefox のコンテンツURLを使用して画像を表示します。これは、提供されたCSSクラスで見ることができます： .googlePic { content: url('../../img/googlePlusIcon.PNG'); margin-top: -6.5%;...

プログラミング 2025-04-03に投稿されました
java.net.urlconnectionとmultipart/form-dataエンコードを使用して追加のパラメーターを使用してファイルをアップロードする方法は？
http requests を使用してファイルをhttpサーバーにアップロードしながら、追加のパラメーター、java.net.urlconnection、およびmultipart/dataエンコーディングを送信します。プロセスの内訳は次のとおりです。エンコーディングには、要求本体を複数...

プログラミング 2025-04-03に投稿されました
Pythonのリクエストと偽のユーザーエージェントでWebサイトブロックをバイパスする方法は？
Pythonのリクエストと偽のユーザーエージェントでブラウザの動作をシミュレートする方法これは、Webサイトが実際のブラウザと自動化されたスクリプトを区別するアンチボット測定を実装できるためです。これらのブロックをバイパスするために、開発者はブラウザの動作を模倣してカスタムユーザーエージェ...

プログラミング 2025-04-03に投稿されました
オブジェクトフィット：IEとEdgeでカバーが失敗します、修正方法は？
object-fit：カバーがIEとEDGEで失敗します。 CSSでは、一貫した画像の高さを維持するために、ブラウザ全体でシームレスに動作します。ただし、IEとEdgeでは、独特の問題が発生します。ブラウザをスケーリングすると、画像は高さをズームするのではなく幅でサイズを変更し、外観を歪め...

プログラミング 2025-04-03に投稿されました
プログラムを終了する前に、C ++のヒープ割り当てを明示的に削除する必要がありますか？
プログラム出口にもかかわらず、Cでの明示的な削除次の例を考慮してください。 a* a = new a（）; a-> dosomething（）; a; 0を返します。 } この例では、「削除」ステートメントは、「a」ポインターに割り当てられたヒープメモ...

プログラミング 2025-04-03に投稿されました