AVX2를 사용하여 벡터 화 로그 함수의 효율적인 구현을위한 팁 - 프로그램 작성 - luping.net

"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.

온라인 도구

소프트웨어 튜토리얼

사이트 탐색

프로그램 작성

첫 장 > 프로그램 작성 > AVX2를 사용하여 벡터 화 로그 함수의 효율적인 구현을위한 팁

AVX2를 사용하여 벡터 화 로그 함수의 효율적인 구현을위한 팁

2025-04-21에 게시되었습니다

검색:535

How Can We Efficiently Implement a Vectorized Logarithm Function Using AVX2?

avx2

에서 효율적인 벡터화 된 로그가 구현

(__m256d a) 그러나 다른 컴파일러에서 사용할 수 있습니다.

구현 접근 방식

[a)에 대한 일반적인 전략은 Mantissa의 계산을 계산하는 것입니다. 이를 통해 Mantissa의 Log2에 대한 다항식 근사치를 사용할 수 있습니다. [0.5, 1.0)의 범위로 조정하십시오. 이것은 우리가 사용하는 다항식 근사가 더 정확할 수 있도록합니다.

조정 된 mantissa의 log2를 계산하기 위해 다항식 근사치를 사용합니다. 우리는 시리즈 확장 또는 최소 기술을 사용하여 다항식을 장착 할 수 있습니다.

조합 :

계산 된 지수와 mantissa의 log2의 다항식 근사치를 추가하여 최종 log2 결과를 얻습니다. 정확도는 단일 고차 다항식 대신 두 개의 다항식의 비율을 사용할 수 있습니다. 이 기술은 반올림 오차를 줄이고 높은 정밀도를 유지합니다.

또한 입력 값이 양수이고 유한 한 것으로 알려진 경우 언더 플로, 오버플로 또는 거절 값에 대한 검사를 건너 뛸 수 있습니다. 이 최적화는 구현 속도를 크게 높일 수 있습니다.

성능 고려 사항

How Can We Efficiently Implement a Vectorized Logarithm Function Using AVX2?

명령 대기 시간 : 현대 하드웨어는 오랫동안 지시 대기 시간이 있습니다. 성능을 최적화하기 위해, 우리는 다항식 용어의 병렬 실행을 허용하는 Estrin의 체계와 같은 빠른 다항식 평가 체계를 사용할 수 있습니다.

fma :

가용성 다중 정보 (FMA) 교육은 매우 효율적입니다. 구현에서 FMA를 사용함으로써, 우리는 다항식 평가 프로세스를 가속화 할 수 있습니다.

특정 범위의 Mantissa 값에 비해 매우 높은 정확도를 달성 할 수 있습니다.

기존 구현과 비교

제안 된 구현은 AVX2 지원으로 모든 플랫폼에서 사용할 수있는 빠르고 효율적인 벡터 로그 2 기능을 제공하는 것을 목표로합니다. 다른 컴파일러에서도 사용할 수있는 동안 Intel Compilers의 SVML 구현과 비교할 수있는 고성능을 목표로합니다.

최신 튜토리얼 더>

$PHP \의 기능 재정의 제한을 극복하는 방법은 무엇입니까?$
PHP \의 기능 재정의 제한을 극복하는 방법은 무엇입니까?
return $ a * $ b; } 그러나 PHP 도구 벨트에는 숨겨진 보석이 있습니다. runkit_function_rename () runkit_function_rename ( 'this', 'that'); run...

프로그램 작성 2025-04-29에 게시되었습니다
동적 인 크기의 부모 요소 내에서 요소의 스크롤 범위를 제한하는 방법은 무엇입니까?
문제 : 고정 된 사이드 바로 조정을 유지하면서 사용자의 수직 스크롤과 함께 이동하는 스크롤 가능한 맵 디브가있는 레이아웃을 고려합니다. 그러나 맵의 스크롤은 뷰포트의 높이를 초과하여 사용자가 페이지 바닥 글에 액세스하는 것을 방지합니다. ...

프로그램 작성 2025-04-29에 게시되었습니다
파이썬에서 문자열에서 이모티콘을 제거하는 방법 : 일반적인 오류 수정에 대한 초보자 가이드?
Codecs 가져 오기. 가져 오기 re text = codecs.decode ( '이 개 \ u0001f602'.encode ('utf-8 '),'utf-8 ') 인쇄 (텍스트) # 이모티콘으로 emoji_patter...

프로그램 작성 2025-04-29에 게시되었습니다
JavaScript 객체에서 키를 동적으로 설정하는 방법은 무엇입니까?
jsobj = 'example'1; jsObj['key' i] = 'example' 1; 배열은 특수한 유형의 객체입니다. 그것들은 숫자 특성 (인치) + 1의 수를 반영하는 길이 속성을 유지합니다. 이 특별한 동작은 표준 객체에...

프로그램 작성 2025-04-29에 게시되었습니다
자바 스크립트 객체의 키를 알파벳순으로 정렬하는 방법은 무엇입니까?
object.keys (...) . .sort () . 정렬 된 속성을 보유 할 새 개체를 만듭니다. 정렬 된 키 어레이를 반복하고 리소셔 함수를 사용하여 원래 객체에서 새 객체에 해당 값과 함께 각 키를 추가합니다. 다음 코드는 프로세...

프로그램 작성 2025-04-29에 게시되었습니다
두 날짜 사이의 일 수를 계산하는 JavaScript 방법
const date1 = 새로운 날짜 ( '7/13/2010'); const date2 = new 날짜 ('12/15/2010 '); const difftime = math.abs (date2 -date1); const diff...

프로그램 작성 2025-04-29에 게시되었습니다
Object-Fit : IE 및 Edge에서 표지가 실패, 수정 방법?
이 문제를 해결하기 위해 문제를 해결하는 영리한 CSS 솔루션을 사용합니다. -50%); 높이 : 100%; 너비 : 자동; // 수직 블록의 경우 높이 : 자동; 너비 : 100%; // 수평 블록의 경우 이 조합은 절대 포지셔닝을 사용하여 중앙에서 ...

프로그램 작성 2025-04-29에 게시되었습니다
동시에 비동기 작업을 동시에 실행하고 JavaScript에서 오류를 올바르게 처리하는 방법은 무엇입니까?
동시 동시 대기 업무 수행 실행 비동기 작업을 수행 할 때 문제가 발생합니다. getValue2async (); 이 구현은 다음 작업을 시작하기 전에 각 작업의 완료를 순차적으로 기다립니다. 동시 실행을 가능하게하려면 수정 된 접근 방식...

프로그램 작성 2025-04-29에 게시되었습니다
$Point-In-Polygon 감지에 더 효율적인 방법 : Ray Tracing 또는 Matplotlib \ 's Path.contains_points?$
Point-In-Polygon 감지에 더 효율적인 방법 : Ray Tracing 또는 Matplotlib \ 's Path.contains_points?
Ray Tracing MethodThe ray tracing method intersects a horizontal ray from the point under examination with the polygon's sides. 교차로의 수를 계산하고 지점이 패...

프로그램 작성 2025-04-29에 게시되었습니다
HTML 서식 태그
HTML 서식 요소 **HTML Formatting is a process of formatting text for better look and feel. HTML provides us ability to format text without...

프로그램 작성 2025-04-29에 게시되었습니다
10 시원한 JavaScript 드로잉 및 캔버스 라이브러리
이 기사는 그리기 및 캔버스 기능을위한 여러 자바 스크립트 라이브러리를 탐색하여 웹 개발자가 동적 그래픽으로 응용 프로그램을 향상시킬 수 있도록 권한을 부여합니다. 이 강력한 도구를 탐구합시다! 18/05/2013 업데이트 : 캔버스 쿼리 추가. source &...

프로그램 작성 2025-04-29에 게시되었습니다
익명의 JavaScript 이벤트 처리기를 깨끗하게 제거하는 방법은 무엇입니까?
익명 이벤트 리스너를 제거하는 데 익명의 이벤트 리스너 추가 요소를 추가하면 유연성과 단순성을 제공하지만 유연성과 단순성을 제공하지만, 그것들을 제거 할 시간이되면, 요소 자체를 교체하지 않고 도전 할 수 있습니다. 요소? element.addevent...

프로그램 작성 2025-04-29에 게시되었습니다
Spring Security 4.1 이상에서 CORS 문제를 해결하기위한 안내서
Spring Security 4.1 이후 Cors 지원을 활성화하기위한보다 간단한 접근 방식이 있습니다. webmvcconfigureradapter { @override public void addcorsmappings (corsregistry Registry) {...

프로그램 작성 2025-04-29에 게시되었습니다
MySQL에서 데이터를 피벗하여 그룹을 어떻게 사용할 수 있습니까?
select d.data_timestamp, sum (data_id = 1 that data_value else 0 End), 'input_1'로 0 End), sum (data_id = 2 an Els.] d.data_timestamp ...

프로그램 작성 2025-04-29에 게시되었습니다
크롬에서 상자 텍스트를 선택하는 방법은 무엇입니까?
초기 시도 한 가지 일반적인 접근 방식은 다음과 같습니다. 주) & lt;/옵션 & gt; & lt; 옵션> select .lt {text-align : center; } <option value=""&a...

프로그램 작성 2025-04-29에 게시되었습니다

분류 더>

일본어를 배우다 한국어를 배우다 중국어를 배우다 외국어를 배우다 게임 일반적인 문제 기술 주변기기 일체 포함 소프트웨어 튜토리얼 프로그램 작성 기사

중국어 공부

1 "걷다"를 중국어로 어떻게 말하나요? 走路 중국어 발음, 走路 중국어 학습
2 "비행기를 타다"를 중국어로 어떻게 말하나요? 坐飞机 중국어 발음, 坐飞机 중국어 학습
3 "기차를 타다"를 중국어로 어떻게 말하나요? 坐火车 중국어 발음, 坐火车 중국어 학습
4 "버스를 타다"를 중국어로 어떻게 말하나요? 坐车 중국어 발음, 坐车 중국어 학습
5 운전을 중국어로 어떻게 말하나요? 开车 중국어 발음, 开车 중국어 학습
6 수영을 중국어로 뭐라고 하나요? 游泳 중국어 발음, 游泳 중국어 학습
7 자전거를 타다 중국어로 뭐라고 하나요? 骑自行车 중국어 발음, 骑自行车 중국어 학습
8 중국어로 안녕하세요를 어떻게 말해요? 你好중국어 발음, 你好중국어 학습
9 감사합니다를 중국어로 어떻게 말하나요? 谢谢중국어 발음, 谢谢중국어 학습
10 How to say goodbye in Chinese? 再见Chinese pronunciation, 再见Chinese learning

도구 더>

이미지 base64 디코딩

중국어 병음

유니코드 인코딩

JS 난독화 암호화 압축

URL 16진수 암호화 도구

UTF-8 인코딩 변환 도구

온라인 Ascii 인코딩 및 디코딩 도구

MD5 암호화 도구

해시/해시 텍스트 온라인 암호화 및 암호 해독 도구

온라인 SHA 암호화

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3