」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 程式設計 > FP和BF有什麼區別這裡給你很好的解釋

FP和BF有什麼區別這裡給你很好的解釋

發佈於2024-08-17
瀏覽:175

What is the difference between FPand BF Here a good explanation for you

浮點表示:

FP16(半精度):在 FP16 中,浮點數使用 16 位元表示。它由 1 個符號位、5 位指數和 10 位分數(尾數)組成。此格式提供了更高的精度來表示其範圍內的小數值。

BF16 (BFloat16):BF16 也使用 16 位,但分佈不同。它有 1 個符號位、8 位指數、7 位尾數。這種格式犧牲了小數部分的一些精確度以適應更廣泛的指數。

數值範圍:

FP16 由於其 10 位元尾數而具有較小的範圍,但在該範圍內精度較高。
BF16 由於其 8 位指數和 7 位尾數而具有較寬的範圍,但小數值的精度較低。

範例:

以下透過3個案例來說明FP16和BF16的差異。使用TensorFlow來做測試和程式碼共享在底層:

原始值:0.0001 — 兩種方法都可以表示
FP16: 0.00010001659393 (二進位:0|00001|1010001110,十六進位:0|00001|1010001110,十六進位:68E) —個尾數和5 個指數
BF16: 0.00010013580322 (二進位: 0|01110001|1010010, 十六進位: 38D2) — 7 個尾數和8 個指數

&&]&&]

正如您所看到的,它們具有不同的指數和尾數,因此能夠以不同的方式表示。 但是我們可以看到FP16更準確地表達了它,並且值更接近。

原始值:1e-08 (0.00000001)
FP16:0.00000000000000(二進位:0|00000|0000000000, :0 |01100100| 0101100,十六進位:322C)

這是一個非常有趣的案例。

FP16 失敗 並使結果為 0,但 BF16 能夠以特殊格式表示它。

原始值:100000.00001FP16:inf(二進位:0|11111|0000000000,十六進位:7C00)
BF16:99840.000001000 011,十六進位:47C3 )

在上述情況下,

FP16 失敗,因為所有指數位都已滿且不足以表示該值。然而 BF16 有效

用例:

FP16常用於深度學習訓練和推理,特別是對於需要高精度表示有限範圍內的小分數值的任務。

BF16 在專為機器學習任務設計的硬體架構中變得越來越流行,這些任務受益於更廣泛的可表示值,即使是以犧牲小數部分的一些精度為代價。當處理大梯度或當大範圍內的數值穩定性比小值的精確度更重要時,它特別有用。

總之

FP16 為較小範圍內的小數值提供了更高的精度,使其適合需要精確表示小數的任務。另一方面,BF16 以犧牲一定精確度為代價提供了更廣泛的範圍,這使得它有利於涉及更廣泛值範圍或在大範圍內的數值穩定性至關重要的任務。 FP16 和 BF16 之間的選擇取決於手邊機器學習任務的特定要求。

定論

由於上述原因,在進行 Stable Diffusion XL (SDXL) 訓練時,FP16 和 BF16 所需的學習率略有不同,我發現 BF16 效果更好。

用於產生上述範例的程式碼

將張量流導入為 tf 導入結構體 def float_to_binary(f): return ''.join(f'{b:08b}' for b in struct.pack('>f', f)) def display_fp16(值): fp16 = tf.cast(tf.constant(值, dtype=tf.float32), tf.float16) fp32 = tf.cast(fp16, tf.float32) 二進位 = 格式(int.from_bytes(fp16.numpy().tobytes(), '大'), '016b') 符號=二進位[0] 指數 = 二進位[1:6] 分數 = 二進位[6:] return f"FP16: {fp32.numpy():14.14f} (二進位: {sign}|{exponent}|{fraction}, 十六進位: {fp16.numpy().view('uint16'):04X })" def display_bf16(值): bf16 = tf.cast(tf.constant(值, dtype=tf.float32), tf.bfloat16) bf32 = tf.cast(bf16, tf.float32) 二進位 = 格式(int.from_bytes(bf16.numpy().tobytes(), '大'), '016b') 符號=二進位[0] 指數 = 二進位[1:9] 分數 = 二進位[9:] return f"BF16: {bf32.numpy():14.14f} (二進位: {sign}|{exponent}|{fraction}, 十六進位: {bf16.numpy().view('uint16'):04X })" 值 = [0.0001, 0.00000001, 100000.00001] 對於值中的值: print(f"\n原始值: {value}") 列印(display_fp16(值)) 列印(display_bf16(值))
import tensorflow as tf
import struct

def float_to_binary(f):
    return ''.join(f'{b:08b}' for b in struct.pack('>f', f))

def display_fp16(value):
    fp16 = tf.cast(tf.constant(value, dtype=tf.float32), tf.float16)
    fp32 = tf.cast(fp16, tf.float32)
    binary = format(int.from_bytes(fp16.numpy().tobytes(), 'big'), '016b')
    sign = binary[0]
    exponent = binary[1:6]
    fraction = binary[6:]
    return f"FP16: {fp32.numpy():14.14f} (Binary: {sign}|{exponent}|{fraction}, Hex: {fp16.numpy().view('uint16'):04X})"

def display_bf16(value):
    bf16 = tf.cast(tf.constant(value, dtype=tf.float32), tf.bfloat16)
    bf32 = tf.cast(bf16, tf.float32)
    binary = format(int.from_bytes(bf16.numpy().tobytes(), 'big'), '016b')
    sign = binary[0]
    exponent = binary[1:9]
    fraction = binary[9:]
    return f"BF16: {bf32.numpy():14.14f} (Binary: {sign}|{exponent}|{fraction}, Hex: {bf16.numpy().view('uint16'):04X})"

values = [0.0001, 0.00000001, 100000.00001]

for value in values:
    print(f"\nOriginal value: {value}")
    print(display_fp16(value))
    print(display_bf16(value))
版本聲明 本文轉載於:https://dev.to/furkangozukara/what-is-the-difference-between-fp16-and-bf16-here-a-good-explanation-for-you-gag?1如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • ## 您可以在不使用 JavaScript 的情況下使用 CSS 建立餅圖分段嗎?
    ## 您可以在不使用 JavaScript 的情況下使用 CSS 建立餅圖分段嗎?
    使用 CSS 在圓中分段使用 border-radius 在 CSS 中建立圓是一種常見的做法。但是,我們可以透過分段(類似餅圖)來實現類似的效果嗎?本文深入研究了僅透過 HTML 和 CSS 實現此目的的方法,不包括使用 JavaScript。 產生相等大小的段相等大小段的一種方法涉及產生以下內容...
    程式設計 發佈於2024-11-06
  • 從頭開始建立一個小型向量存儲
    從頭開始建立一個小型向量存儲
    With the evolving landscape of generative AI, vector databases are playing crucial role in powering generative AI applications. There are so many vect...
    程式設計 發佈於2024-11-06
  • 如何在Chrome使用AI實驗API
    如何在Chrome使用AI實驗API
    要在 Chrome 中使用實驗性 AI API,請依照下列步驟操作: 硬體需求 4GB 記憶體 GPU可用 至少 22GB 空間 Windows 10.11 或 macOS Ventura 或更新版本(無 Linux 規格) 尚不支持: Chrome作業系統 Chrome iOS C...
    程式設計 發佈於2024-11-06
  • 評論:Adam Johnson 的《Boost Your Django DX》
    評論:Adam Johnson 的《Boost Your Django DX》
    書評很微妙。您不想破壞它,但您也想讓潛在讀者體驗所期待的內容。這是提供背景和保持興趣之間的巧妙平衡。我試圖在這篇評論中達到這種平衡,為您提供足夠的內容來吸引您,而不透露太多。 一個小背景故事:我第一次從 Djangonaut Space 的好朋友 Tim 那裡聽說這本書,並將其添加到我的閱讀清單中...
    程式設計 發佈於2024-11-06
  • 如何將陣列元素分組並組合多維數組中另一列的值?
    如何將陣列元素分組並組合多維數組中另一列的值?
    按列將數組元素分組並組合另一列中的值給定一個包含兩列嵌套數組的數組,任務是將基於特定列的子數組,並將每個組中另一列的值連接起來,產生以逗號分隔的清單。 考慮以下範例陣列:$array = [ ["444", "0081"], ["44...
    程式設計 發佈於2024-11-06
  • 三個新加入的例外功能
    三個新加入的例外功能
    從 JDK 7 開始,異常處理已擴展為三個新功能:自動資源管理、多重捕獲和更準確的重新拋出。 多重catch可讓您使用同一個catch子句擷取多個異常,避免程式碼重複。 要使用多重捕獲,請指定由 | 分隔的異常清單。在 catch 子句中。每個參數都是隱式最終參數。 用法範例:catch(f...
    程式設計 發佈於2024-11-06
  • 如何修復執行 ES6 程式碼時出現「意外的令牌匯出」錯誤?
    如何修復執行 ES6 程式碼時出現「意外的令牌匯出」錯誤?
    「排除意外的令牌匯出錯誤」嘗試在專案中執行ES6 程式碼時,可能會出現「意外的令牌導出”錯誤。此錯誤表示所使用的環境不支援 ES6 模組中使用的匯出關鍵字語法。 錯誤詳細資料以下程式碼片段舉例說明了錯誤的來源: export class MyClass { constructor() { ...
    程式設計 發佈於2024-11-06
  • 即使卸載後,VSCode 擴充功能也不會從檔案系統中刪除,我建立了一個解決方案!
    即使卸載後,VSCode 擴充功能也不會從檔案系統中刪除,我建立了一個解決方案!
    所以這是基於 vscode 的編輯器的問題。即使您卸載了擴充功能,它也會保留在檔案系統中,並隨著時間的推移堵塞您的系統。我創建了一個簡單的解決方案。執行此 python 腳本將刪除 vscode 上未安裝的擴充功能。 它適用於 VS Code、VS Code Insiders,也適用於 VSCod...
    程式設計 發佈於2024-11-06
  • 透過 GitHub Actions 按計畫更新網站內容
    透過 GitHub Actions 按計畫更新網站內容
    我想分享我建立一個自我永續的內容管理系統的旅程,該系統不需要傳統意義上的內容資料庫。 問題 該網站的內容(部落格文章和書籤)儲存在 Notion 資料庫中: 附書籤的資料庫 –  Notion UI 我試圖解決的問題是不必在添加每個書籤後手動部署網站。最重要的是 - 保持託管盡可能...
    程式設計 發佈於2024-11-06
  • 如何在 Laravel 5 應用程式的共享託管環境中清除快取?
    如何在 Laravel 5 應用程式的共享託管環境中清除快取?
    如何從 Laravel 5 中的共享託管伺服器清除快取清除快取對於維護 Laravel 應用程式的效能和效率至關重要。但是,在您可能無法存取 CLI 的共享託管環境中,清除快取可能是一個挑戰。 清除視圖快取的解決方法在這種情況下,您可以透過在 CLI 之外呼叫 Artisan 命令來解決此問題。要清...
    程式設計 發佈於2024-11-06
  • 如何加速 Matplotlib 繪圖以提高效能?
    如何加速 Matplotlib 繪圖以提高效能?
    為什麼 Matplotlib 這麼慢? 在評估 Python 繪圖庫時,考慮效能很重要。 Matplotlib 是一個廣泛使用的函式庫,它看起來可能很緩慢,引發了關於加快速度或探索替代選項的問題。讓我們深入研究這個問題並探索可能的解決方案。 提供的範例展示了具有多個子圖和資料更新的圖。使用 Matp...
    程式設計 發佈於2024-11-06
  • 使用畫布調整影像大小時如何克服鋸齒狀邊緣和模糊結果?
    使用畫布調整影像大小時如何克服鋸齒狀邊緣和模糊結果?
    解決在JavaScript 中使用Canvas 調整影像大小時的平滑問題在JavaScript 中使用Canvas 調整影像大小有時會導致明顯的鋸齒狀邊緣或模糊。為了實現平滑的調整大小,可以採用一種稱為向下步進的技術。 在大多數瀏覽器中,預設使用線性內插法來調整大小。雙三次插值可產生更平滑的結果,涉...
    程式設計 發佈於2024-11-06
  • 如何解決 MySQL C# 中的文字編碼問題?
    如何解決 MySQL C# 中的文字編碼問題?
    修復MySQL C# 中的文字編碼問題使用實體框架在C# 中處理MySQL 資料庫時,使用者可能會遇到文字編碼問題,特別是帶有特殊字符,例如“ë”,渲染不正確。本文探討了解決此常見問題的最合適的解決方案。 要修正編碼問題,必須執行以下操作:驗證排序規則設定: 確保所涉及的資料庫或表的排序規則與UTF...
    程式設計 發佈於2024-11-06
  • 如何將美麗搜尋與 Node.js 集成
    如何將美麗搜尋與 Node.js 集成
    作為 Node.js 開發人員,建立能夠提供快速且準確的搜尋結果的應用程式非常重要。使用者期望立即得到相關的回應,但實現起來可能具有挑戰性,特別是在處理大型資料集時。 這就是美麗搜尋的用武之地——一個為輕鬆滿足這些需求而構建的搜尋引擎。 什麼是美麗搜尋? Meilisearch ...
    程式設計 發佈於2024-11-06
  • 平行 JavaScript 機
    平行 JavaScript 機
    作者:Vladas Saulis,PE Prodata,克萊佩達,立陶宛 2024 年 5 月 18 日 抽象的 本文提出了一種新的程式設計模型,可以以簡單且自動平衡的方式利用多核心 CPU 系統。該模型還提出了一種更簡單的程式設計範例,用於在大多數大規模平行計算領域(例如天氣預報、核子物理、搜尋引...
    程式設計 發佈於2024-11-06

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3