conhecido como Analisador de código de arquitetura Intel, o IACA é uma ferramenta avançada para avaliar a programação de código contra o Intel CPUS. Ele opera em três modos:
invocação da linha de comando:
Relatório de análise de taxa de transferência ------------------------------ Taxa de transferência de bloco: 1.55 ciclos de rendimento de rendimento: frontend, port2_agu, port3_agu [Quebra de pressão da porta] | Instrução ---------------------------- | ----------------- | | vmovaps ymm1, ymmword ptr [rdi rax*1] | 0,5 cp | | 1,5 cp | vfmadd231ps ymm1, ymm2, ymmword ptr [rsi rax*1] | 1,5 cp | vmovaps ymmword ptr [rdx rax*1], ymm1 | 1 cp | Adicione Rax, 0x20 | 0 cp | JNZ 0xffffffffffffffff
desta saída, o IACA identifica o Frontend Haswell e a porta 2 e o AGU de 3 como gargalos. Isso sugere que otimizar a instrução da loja a ser processada pela porta 7 poderia melhorar o desempenho. Excluindo modelos mais antigos.Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3