Intel Architecture Code Analyzerとして知られるIACAは、Intel CPUに対するコードスケジューリングを評価するための高度なツールです。 3つのモードで動作します:
指定された魔法のバイトパターンを挿入して、マーカーを手動で指定する:
/ * nasm usage */ MOV EBX、111;マーカーバイトを開始します DB 0x64、0x67、0x90;マーカーバイトを開始します .innermostlooplabel: ;ループ本体 ; ... jne .innermostlooplabel;条件付きブランチは、ループの上部に後ろに向かって行きます MOV EBX、222;エンドマーカーバイト DB 0x64、0x67、0x90; END MARKER BYTESスループット分析レポート --------------------------------- ブロックスループット:1.55サイクルスループットボトルネック:FrontEnd、port2_agu、port3_agu [ポート圧力の内訳] | 命令 ---------------------------- | ------------------------------------------------------------ | | vmovaps ymm1、ymmword ptr [rdi rax*1] | 0.5 cp | | 1.5 cp | vfmadd231ps ymm1、ymm2、ymmword ptr [rsi rax*1] | 1.5 cp | vmovaps ymmword ptr [rdx rax*1]、ymm1 | 1 cp | Raxを追加、0x20 | 0 cp | jnz 0xfffffffffffffffec
この出力から、IACAはHaswell Frontendとポート2と3のAGUをボトルネックとして識別します。ポート7によって処理されるストア命令を最適化するとパフォーマンスが向上する可能性があることを示唆しています。古いモデルを除く。免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3