تحميل 8 أحرف من الذاكرة إلى متغير __m256 كتعويم دقيق واحد
في محاولة لتحسين خوارزمية للتمويه الغاوسي، يمكنك تسعى إلى استبدال استخدام المخزن المؤقت العائم بمتغير جوهري __m256. يهدف هذا السؤال إلى تحديد التعليمات المثالية لهذه المهمة.
تعليمات لبنية AVX2:
; rsi = new_image VPMOVZXBD ymm0, [rsi] ; or SX to sign-extend (Byte to DWord) VCVTDQ2PS ymm0, ymm0 ; convert to packed foat
إستراتيجيات إضافية:
تعليمات بنية AVX1:
VPMOVZXBD xmm0, [rsi] VPMOVZXBD xmm1, [rsi 4] VINSERTF128 ymm0, ymm0, xmm1, 1 ; put the 2nd load of data into the high128 of ymm0 VCVTDQ2PS ymm0, ymm0 ; convert to packed float
الاعتبارات الجوهرية:
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3