FP와 BF의 차이점은 무엇입니까? 여기에 좋은 설명이 있습니다.

첫 장 > 프로그램 작성 > FP와 BF의 차이점은 무엇입니까? 여기에 좋은 설명이 있습니다.

FP와 BF의 차이점은 무엇입니까? 여기에 좋은 설명이 있습니다.

2024-08-17에 게시됨

검색:624

What is the difference between FPand BF Here a good explanation for you

부동 소수점 표현:

FP16(반정밀도): FP16에서는 부동 소수점 숫자가 16비트를 사용하여 표현됩니다. 부호 비트 1개, 지수 5비트, 분수(가수) 10비트로 구성됩니다. 이 형식은 해당 범위 내의 분수 값을 표현하는 데 더 높은 정밀도를 제공합니다.

BF16 (BFloat16): BF16도 16비트를 사용하지만 배포 방식이 다릅니다. 부호 비트 1개, 지수 8비트, 가수 7비트를 갖습니다. 이 형식은 더 넓은 범위의 지수를 수용하기 위해 분수 부분의 정밀도를 어느 정도 희생합니다.

숫자 범위:

FP16은 범위가 더 작지만 10비트 가수로 인해 해당 범위 내에서 정밀도가 높습니다.
BF16은 8비트 지수와 7비트 가수로 인해 범위는 더 넓지만 분수 값에 대한 정밀도는 낮습니다.

예:

예제를 사용하여 FP16과 BF16의 차이점을 3가지 사례로 설명하겠습니다. TensorFlow는 하단에서 테스트와 코드를 공유하는 데 사용됩니다.

원래 값: 0.0001 — 두 메서드 모두 다음을 나타낼 수 있습니다.
FP16: 0.00010001659393(이진수: 0|00001|1010001110, 16진수: 068E) — 가수 10개와 지수 5개
BF16: 0.00010013580322 (2진수: 0|01110001|1010010, 16진수: 38D2) — 가수 7개와 지수 8개

보시다시피 지수와 가수가 다르기 때문에 다르게 표현할 수 있습니다. 하지만 FP16이 더 가까운 값으로 더 정확하게 표현한 것을 확인할 수 있습니다.

원래 값: 1e-08(0.00000001)
FP16: 0.00000000000000(2진수: 0|00000|0000000000, 16진수: 0000)
BF16: 0.000000010011 72(바이너리: 0|01100100| 0101100, 16진수: 322C)

이것은 매우 흥미로운 사례입니다. FP16이 실패하고 결과가 0이 되었지만 BF16은 이를 특수한 형식으로 표현할 수 있습니다.

원래 값: 100000.00001
FP16: inf(2진수: 0|11111|0000000000, 16진수: 7C00)
BF16: 99840.00000000000000(2진수: 0|100011 11|1000011, 16진수: 47C3 )

위의 경우 FP16은 실패합니다. 모든 지수 비트가 가득 차서 값을 표현할 만큼 충분하지 않기 때문입니다. 그러나 BF16은 작동합니다

사용 사례:

FP16은 딥 러닝 훈련 및 추론에 일반적으로 사용되며, 특히 제한된 범위 내에서 작은 분수 값을 표현하는 데 높은 정밀도가 필요한 작업에 사용됩니다.

BF16은 분수 부분의 정밀도를 희생하더라도 더 넓은 범위의 표현 가능한 값의 이점을 누릴 수 있는 기계 학습 작업용으로 설계된 하드웨어 아키텍처에서 인기를 얻고 있습니다. 이는 큰 기울기를 처리할 때나 넓은 범위의 수치적 안정성이 작은 값의 정밀도보다 더 중요한 경우에 특히 유용합니다.

요약

FP16은 더 작은 범위 내의 분수 값에 대해 더 높은 정밀도를 제공하므로 작은 숫자를 정확하게 표현해야 하는 작업에 적합합니다. 반면에 BF16은 약간의 정밀도를 희생하면서 더 넓은 범위를 제공하므로 더 넓은 범위의 값을 포함하거나 넓은 범위에 걸친 수치 안정성이 중요한 작업에 유리합니다. FP16과 BF16 사이의 선택은 현재 머신러닝 작업의 특정 요구 사항에 따라 달라집니다.

최종 결론

위의 모든 이유로 인해 SDXL(Stable Diffusion XL) 교육을 수행할 때 FP16과 BF16에는 약간 다른 학습 속도가 필요하며 BF16이 더 잘 작동하는 것으로 나타났습니다.

위 예제를 생성하는 데 사용된 코드

import tensorflow as tf
import struct

def float_to_binary(f):
    return ''.join(f'{b:08b}' for b in struct.pack('>f', f))

def display_fp16(value):
    fp16 = tf.cast(tf.constant(value, dtype=tf.float32), tf.float16)
    fp32 = tf.cast(fp16, tf.float32)
    binary = format(int.from_bytes(fp16.numpy().tobytes(), 'big'), '016b')
    sign = binary[0]
    exponent = binary[1:6]
    fraction = binary[6:]
    return f"FP16: {fp32.numpy():14.14f} (Binary: {sign}|{exponent}|{fraction}, Hex: {fp16.numpy().view('uint16'):04X})"

def display_bf16(value):
    bf16 = tf.cast(tf.constant(value, dtype=tf.float32), tf.bfloat16)
    bf32 = tf.cast(bf16, tf.float32)
    binary = format(int.from_bytes(bf16.numpy().tobytes(), 'big'), '016b')
    sign = binary[0]
    exponent = binary[1:9]
    fraction = binary[9:]
    return f"BF16: {bf32.numpy():14.14f} (Binary: {sign}|{exponent}|{fraction}, Hex: {bf16.numpy().view('uint16'):04X})"

values = [0.0001, 0.00000001, 100000.00001]

for value in values:
    print(f"\nOriginal value: {value}")
    print(display_fp16(value))
    print(display_bf16(value))

릴리스 선언문 이 기사는 https://dev.to/furkangozukara/what-is-the-difference-between-fp16-and-bf16-here-a-good-explanation-for-you-gag?1에서 재현됩니다. 침해, 삭제하려면 [email protected]으로 문의하세요.

최신 튜토리얼 더>

Homebrew에서 GO를 설정하면 명령 줄 실행 문제가 발생하는 이유는 무엇입니까?
발생하는 문제를 해결하려면 다음을 수행하십시오. 1. 필요한 디렉토리 만들기 mkdir $ home/go mkdir -p $ home/go/src/github.com/user 2. 환경 변수 구성

프로그램 작성 2025-04-27에 게시되었습니다
$\ "일반 오류 : 2006 MySQL Server가 사라졌습니다 \"데이터를 삽입 할 때?$
\ "일반 오류 : 2006 MySQL Server가 사라졌습니다 \"데이터를 삽입 할 때?
를 해결하는 방법 "일반 오류 : 2006 MySQL Server가 사라졌습니다. 이 오류는 일반적으로 MySQL 구성의 두 변수 중 하나로 인해 서버에 대한 연결이 손실 될 때 발생합니다. 솔루션 : 이 오류를 해결하기위한 키는 Wait_Ti...

프로그램 작성 2025-04-27에 게시되었습니다
파이썬에서 문자열에서 이모티콘을 제거하는 방법 : 일반적인 오류 수정에 대한 초보자 가이드?
Codecs 가져 오기. 가져 오기 re text = codecs.decode ( '이 개 \ u0001f602'.encode ('utf-8 '),'utf-8 ') 인쇄 (텍스트) # 이모티콘으로 emoji_patter...

프로그램 작성 2025-04-27에 게시되었습니다
Java는 여러 반환 유형을 허용합니까 : 일반적인 방법을 자세히 살펴보십시오.
public 목록 getResult (문자열 s); 여기서 foo는 사용자 정의 클래스입니다. 이 방법 선언은 두 가지 반환 유형을 자랑하는 것처럼 보입니다. 목록과 E. 그러나 이것이 사실인가? 일반 방법 : 미스터리 메소드는 단일...

프로그램 작성 2025-04-27에 게시되었습니다
입력 : "경고 : mysqli_query ()는 왜 매개 변수 1이 mysqli, 주어진 리소스"오류가 발생하고이를 수정하는 방법을 기대 하는가? 출력 : 오류를 해결하는 분석 및 수정 방법 "경고 : MySQLI_QUERY () 매개 변수는 리소스 대신 MySQLI 여야합니다."
mysqli_query () mysqli_query ()는 매개 변수 1이 mysqli, 리소스가 주어진 리소스, mysqli_query () 함수를 사용하여 mysql query를 실행하려고 시도 할 때 "경고 : mysqli_query (...

프로그램 작성 2025-04-27에 게시되었습니다
JavaScript 객체에서 키를 동적으로 설정하는 방법은 무엇입니까?
jsobj = 'example'1; jsObj['key' i] = 'example' 1; 배열은 특수한 유형의 객체입니다. 그것들은 숫자 특성 (인치) + 1의 수를 반영하는 길이 속성을 유지합니다. 이 특별한 동작은 표준 객체에...

프로그램 작성 2025-04-27에 게시되었습니다
자바 스크립트 객체의 키를 알파벳순으로 정렬하는 방법은 무엇입니까?
object.keys (...) . .sort () . 정렬 된 속성을 보유 할 새 개체를 만듭니다. 정렬 된 키 어레이를 반복하고 리소셔 함수를 사용하여 원래 객체에서 새 객체에 해당 값과 함께 각 키를 추가합니다. 다음 코드는 프로세...

프로그램 작성 2025-04-27에 게시되었습니다
PHP를 사용하여 XML 파일에서 속성 값을 효율적으로 검색하려면 어떻게해야합니까?
옵션> 1 varnum "varnum"을 복원 할 수 있습니다. stumped. 이 기능은 XML 요소의 속성에 대한 액세스를 연관 배열로 제공합니다. $ xml = simplexml_load_file ($ file);...

프로그램 작성 2025-04-27에 게시되었습니다
두 날짜 사이의 일 수를 계산하는 JavaScript 방법
const date1 = 새로운 날짜 ( '7/13/2010'); const date2 = new 날짜 ('12/15/2010 '); const difftime = math.abs (date2 -date1); const diff...

프로그램 작성 2025-04-27에 게시되었습니다
Spring Security 4.1 이상에서 CORS 문제를 해결하기위한 안내서
Spring Security 4.1 이후 Cors 지원을 활성화하기위한보다 간단한 접근 방식이 있습니다. webmvcconfigureradapter { @override public void addcorsmappings (corsregistry Registry) {...

프로그램 작성 2025-04-27에 게시되었습니다
McRypt에서 OpenSSL로 암호화를 마이그레이션하고 OpenSSL을 사용하여 McRypt 암호화 데이터를 해제 할 수 있습니까?
질문 : McRypt에서 OpenSSL로 내 암호화 라이브러리를 업그레이드 할 수 있습니까? 그렇다면 어떻게? 대답 : 대답 : 예, McRypt에서 암호화 라이브러리를 OpenSSL로 업그레이드 할 수 있습니다. OpenSSL을 사용하여 McRyp...

프로그램 작성 2025-04-27에 게시되었습니다
$Point-In-Polygon 감지에 더 효율적인 방법 : Ray Tracing 또는 Matplotlib \ 's Path.contains_points?$
Point-In-Polygon 감지에 더 효율적인 방법 : Ray Tracing 또는 Matplotlib \ 's Path.contains_points?
Ray Tracing MethodThe ray tracing method intersects a horizontal ray from the point under examination with the polygon's sides. 교차로의 수를 계산하고 지점이 패...

프로그램 작성 2025-04-27에 게시되었습니다
동시에 비동기 작업을 동시에 실행하고 JavaScript에서 오류를 올바르게 처리하는 방법은 무엇입니까?
동시 동시 대기 업무 수행 실행 비동기 작업을 수행 할 때 문제가 발생합니다. getValue2async (); 이 구현은 다음 작업을 시작하기 전에 각 작업의 완료를 순차적으로 기다립니다. 동시 실행을 가능하게하려면 수정 된 접근 방식...

프로그램 작성 2025-04-27에 게시되었습니다
PYTZ가 처음에 예상치 못한 시간대 오프셋을 표시하는 이유는 무엇입니까?
import pytz pytz.timezone ( 'Asia/Hong_kong') std> discrepancy source 역사 전반에 걸쳐 변동합니다. PYTZ가 제공하는 기본 시간대 이름 및 오프...

프로그램 작성 2025-04-27에 게시되었습니다
Firefox Back 버튼을 사용할 때 JavaScript 실행이 중단되는 이유는 무엇입니까?
원인 및 솔루션 : 이 동작은 브라우저 캐싱 자바 스크립트 리소스에 의해 발생합니다. 이 문제를 해결하고 후속 페이지 방문에서 스크립트가 실행되도록하기 위해 Firefox 사용자는 Window.onload 이벤트에서 호출되도록 빈 기능을 설정해야합니다. ...

프로그램 작성 2025-04-26에 게시되었습니다