Throughput (in cycles per iteration): 43.00 Bottleneck: unknown The following throughputs could be achieved if the given property were the only bottleneck: - DSB: 15.83 - Issue: 23.75 - Ports: 40.00 - Dependencies: 4.00 M - Macro-fused with previous instruction ┌───────────────────────┬────────┬───────┬───────────────────────────────────────────────────────────────────────┬───────┐ │ MITE MS DSB LSD │ Issued │ Exec. │ Port 0 Port 1 Port 2 Port 3 Port 4 Port 5 Port 6 Port 7 │ Notes │ ├───────────────────────┼────────┼───────┼───────────────────────────────────────────────────────────────────────┼───────┤ │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/MOVSXD_R64_M32.htmlmovsxd rax, dword ptr [rdx+rcx*4]]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/LEA_B_IS_R64.htmllea rax, ptr [rax+rax*2]]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/SHL_R64_I8.htmlshl rax, 0x6]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VMOVAPD_ZMM_M512.htmlvmovapd zmm28, zmmword ptr [rdi+rax*1]]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VMOVAPD_ZMM_M512.htmlvmovapd zmm29, zmmword ptr [rdi+rax*1+0x40]]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VMOVAPD_ZMM_M512.htmlvmovapd zmm30, zmmword ptr [rdi+rax*1+0x80]]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VMOVUPD_ZMM_M512.htmlvmovupd zmm3, zmmword ptr [rsp+0x40]]8;; │ 1 │ 1 │ 1 │ 0.4 0.6 │ │ ]8;;https://www.uops.info/html-instr/VSUBPD_ZMM_ZMM_ZMM.htmlvsubpd zmm14, zmm3, zmm28]8;; │ 1 │ 1 │ 1 │ 0.6 0.4 │ │ ]8;;https://www.uops.info/html-instr/VSUBPD_ZMM_ZMM_ZMM.htmlvsubpd zmm12, zmm26, zmm29]8;; │ 1 │ 1 │ 1 │ 0.4 0.6 │ │ ]8;;https://www.uops.info/html-instr/VSUBPD_ZMM_ZMM_ZMM.htmlvsubpd zmm31, zmm25, zmm30]8;; │ 1 │ 1 │ 1 │ 0.4 0.6 │ │ ]8;;https://www.uops.info/html-instr/VSUBPD_ZMM_ZMM_ZMM.htmlvsubpd zmm3, zmm23, zmm28]8;; │ 1 │ 1 │ 1 │ 0.4 0.6 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm15, zmm31, zmm31]8;; │ 1 │ 1 │ 1 │ 0.4 0.6 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_ZMM_ZMM.htmlvfmadd231pd zmm15, zmm12, zmm12]8;; │ 1 │ 1 │ 1 │ 0.4 0.6 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_ZMM_ZMM.htmlvfmadd231pd zmm15, zmm14, zmm14]8;; │ 3 │ 3 │ 3 │ 2.6 0.4 │ │ ]8;;https://www.uops.info/html-instr/VRCP14PD_ZMM_ZMM.htmlvrcp14pd zmm16, zmm15]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VCMPPD_K_ZMM_ZMM_I8.htmlvcmppd k1, zmm15, zmm0, 0x1]8;; │ 1 │ 1 │ 1 │ 0.6 0.4 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm15, zmm16, zmm20]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm18, zmm16, zmm16]8;; │ 1 │ 1 │ 1 │ 0.4 0.6 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm15, zmm18, zmm15]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VMOVUPD_ZMM_M512.htmlvmovupd zmm18, zmmword ptr [rsp+0x200]]8;; │ 1 │ 1 │ 1 │ 0.4 0.6 │ │ ]8;;https://www.uops.info/html-instr/VSUBPD_ZMM_ZMM_ZMM.htmlvsubpd zmm18, zmm18, zmm29]8;; │ 1 │ 1 │ 1 │ 0.4 0.6 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm16, zmm1, zmm16]8;; │ 1 │ 1 │ 1 │ 0.8 0.2 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm16, zmm16, zmm15]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VADDPD_ZMM_ZMM_ZMM.htmlvaddpd zmm15, zmm15, zmm2]8;; │ 1 │ 1 │ 1 │ 0.6 0.4 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm15, zmm16, zmm15]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VMOVUPD_ZMM_M512.htmlvmovupd zmm16, zmmword ptr [rsp+0x1c0]]8;; │ 1 │ 1 │ 1 │ 0.4 0.6 │ │ ]8;;https://www.uops.info/html-instr/VSUBPD_ZMM_ZMM_ZMM.htmlvsubpd zmm16, zmm16, zmm30]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_K_ZMM_ZMM.htmlvfmadd231pd zmm19{k1}, zmm15, zmm14]8;; │ 1 │ 1 │ 1 │ 0.8 0.2 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm14, zmm16, zmm16]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_ZMM_ZMM.htmlvfmadd231pd zmm14, zmm18, zmm18]8;; │ 1 │ 1 │ 1 │ 0.8 0.2 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_ZMM_ZMM.htmlvfmadd231pd zmm14, zmm3, zmm3]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VCMPPD_K_ZMM_ZMM_I8.htmlvcmppd k2, zmm14, zmm0, 0x1]8;; │ 3 │ 3 │ 3 │ 2.8 0.2 │ │ ]8;;https://www.uops.info/html-instr/VRCP14PD_ZMM_ZMM.htmlvrcp14pd zmm14, zmm14]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_K_ZMM_ZMM.htmlvfmadd231pd zmm11{k1}, zmm15, zmm12]8;; │ 1 │ 1 │ 1 │ 0.6 0.4 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_K_ZMM_ZMM.htmlvfmadd231pd zmm7{k1}, zmm15, zmm31]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm12, zmm14, zmm20]8;; │ 1 │ 1 │ 1 │ 0.4 0.6 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm15, zmm14, zmm14]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm12, zmm15, zmm12]8;; │ 1 │ 1 │ 1 │ 0.6 0.4 │ │ ]8;;https://www.uops.info/html-instr/VSUBPD_ZMM_ZMM_ZMM.htmlvsubpd zmm15, zmm24, zmm28]8;; │ 1 │ 1 │ 1 │ 0.4 0.6 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm14, zmm1, zmm14]8;; │ 1 │ 1 │ 1 │ 0.8 0.2 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm14, zmm14, zmm12]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VADDPD_ZMM_ZMM_ZMM.htmlvaddpd zmm12, zmm12, zmm2]8;; │ 1 │ 1 │ 1 │ 0.6 0.4 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm12, zmm14, zmm12]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VSUBPD_ZMM_ZMM_ZMM.htmlvsubpd zmm14, zmm22, zmm29]8;; │ 1 │ 1 │ 1 │ 0.6 0.4 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_K_ZMM_ZMM.htmlvfmadd231pd zmm17{k2}, zmm12, zmm3]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VSUBPD_ZMM_ZMM_ZMM.htmlvsubpd zmm3, zmm27, zmm30]8;; │ 1 │ 1 │ 1 │ 0.8 0.2 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_K_ZMM_ZMM.htmlvfmadd231pd zmm9{k2}, zmm12, zmm18]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm18, zmm3, zmm3]8;; │ 1 │ 1 │ 1 │ 0.8 0.2 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_ZMM_ZMM.htmlvfmadd231pd zmm18, zmm14, zmm14]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_ZMM_ZMM.htmlvfmadd231pd zmm18, zmm15, zmm15]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VCMPPD_K_ZMM_ZMM_I8.htmlvcmppd k1, zmm18, zmm0, 0x1]8;; │ 3 │ 3 │ 3 │ 2.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VRCP14PD_ZMM_ZMM.htmlvrcp14pd zmm18, zmm18]8;; │ 1 │ 1 │ 1 │ 0.8 0.2 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_K_ZMM_ZMM.htmlvfmadd231pd zmm5{k2}, zmm12, zmm16]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm12, zmm18, zmm20]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm16, zmm18, zmm18]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm12, zmm16, zmm12]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm16, zmm1, zmm18]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm16, zmm16, zmm12]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VADDPD_ZMM_ZMM_ZMM.htmlvaddpd zmm12, zmm12, zmm2]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm12, zmm16, zmm12]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_K_ZMM_ZMM.htmlvfmadd231pd zmm21{k1}, zmm12, zmm15]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VMOVUPD_ZMM_M512.htmlvmovupd zmm15, zmmword ptr [rsp+0x240]]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VSUBPD_ZMM_ZMM_ZMM.htmlvsubpd zmm15, zmm15, zmm28]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VMOVUPD_ZMM_M512.htmlvmovupd zmm16, zmmword ptr [rsp+0x80]]8;; │ 1 │ 1 │ 1 │ 0.8 0.2 │ │ ]8;;https://www.uops.info/html-instr/VSUBPD_ZMM_ZMM_ZMM.htmlvsubpd zmm16, zmm16, zmm29]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VMOVUPD_ZMM_M512.htmlvmovupd zmm18, zmmword ptr [rsp+0x180]]8;; │ 1 │ 1 │ 1 │ 0.4 0.6 │ │ ]8;;https://www.uops.info/html-instr/VSUBPD_ZMM_ZMM_ZMM.htmlvsubpd zmm18, zmm18, zmm30]8;; │ 1 │ 1 │ 1 │ 0.4 0.6 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_K_ZMM_ZMM.htmlvfmadd231pd zmm10{k1}, zmm12, zmm14]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm14, zmm18, zmm18]8;; │ 1 │ 1 │ 1 │ 0.4 0.6 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_ZMM_ZMM.htmlvfmadd231pd zmm14, zmm16, zmm16]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_ZMM_ZMM.htmlvfmadd231pd zmm14, zmm15, zmm15]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/VCMPPD_K_ZMM_ZMM_I8.htmlvcmppd k2, zmm14, zmm0, 0x1]8;; │ 3 │ 3 │ 3 │ 2.6 0.4 │ │ ]8;;https://www.uops.info/html-instr/VRCP14PD_ZMM_ZMM.htmlvrcp14pd zmm14, zmm14]8;; │ 1 │ 1 │ 1 │ 0.4 0.6 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_K_ZMM_ZMM.htmlvfmadd231pd zmm6{k1}, zmm12, zmm3]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm3, zmm14, zmm20]8;; │ 1 │ 1 │ 1 │ 0.6 0.4 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm12, zmm14, zmm14]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm3, zmm12, zmm3]8;; │ 1 │ 1 │ 1 │ 0.8 0.2 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm12, zmm1, zmm14]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm12, zmm12, zmm3]8;; │ 1 │ 1 │ 1 │ 0.8 0.2 │ │ ]8;;https://www.uops.info/html-instr/VADDPD_ZMM_ZMM_ZMM.htmlvaddpd zmm3, zmm3, zmm2]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VMULPD_ZMM_ZMM_ZMM.htmlvmulpd zmm3, zmm12, zmm3]8;; │ 1 │ 1 │ 1 │ 0.8 0.2 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_K_ZMM_ZMM.htmlvfmadd231pd zmm13{k2}, zmm3, zmm15]8;; │ 1 │ 1 │ 1 │ 0.2 0.8 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_K_ZMM_ZMM.htmlvfmadd231pd zmm8{k2}, zmm3, zmm16]8;; │ 1 │ 1 │ 1 │ 0.8 0.2 │ │ ]8;;https://www.uops.info/html-instr/VFMADD231PD_ZMM_K_ZMM_ZMM.htmlvfmadd231pd zmm4{k2}, zmm3, zmm18]8;; │ 1 │ 1 │ 1 │ 0.6 0.4 │ │ ]8;;https://www.uops.info/html-instr/INC_R64.htmlinc rcx]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/CMP_39_R64_R64.htmlcmp r11, rcx]8;; │ │ │ │ │ M │ ]8;;https://www.uops.info/html-instr/JNZ_Rel32.htmljnz ]8;; │ 1 │ 1 │ 1 │ 1 │ │ ]8;;https://www.uops.info/html-instr/JMP_Rel32.htmljmp ]8;; ├───────────────────────┼────────┼───────┼───────────────────────────────────────────────────────────────────────┼───────┤ │ 95 │ 95 │ 95 │ 39.6 1.6 5 5 40.4 3.4 │ │ Total └───────────────────────┴────────┴───────┴───────────────────────────────────────────────────────────────────────┴───────┘