[0] Code Region Iterations: 100 Instructions: 8800 Total Cycles: 4293 Total uOps: 10500 Dispatch Width: 6 uOps Per Cycle: 2.45 IPC: 2.05 Block RThroughput: 32.0 Instruction Info: [1]: #uOps [2]: Latency [3]: RThroughput [4]: MayLoad [5]: MayStore [6]: HasSideEffects (U) [1] [2] [3] [4] [5] [6] Instructions: 1 5 0.50 * movslq (%rdx,%rcx,4), %rax 1 1 0.50 leaq (%rax,%rax,2), %rax 1 1 0.50 shlq $6, %rax 2 8 0.50 * vmovapd (%rdi,%rax), %zmm28 2 8 0.50 * vmovapd 64(%rdi,%rax), %zmm29 2 8 0.50 * vmovapd 128(%rdi,%rax), %zmm30 2 8 0.50 * vmovupd 64(%rsp), %zmm3 1 4 0.50 vsubpd %zmm28, %zmm3, %zmm14 1 4 0.50 vsubpd %zmm29, %zmm26, %zmm12 1 4 0.50 vsubpd %zmm30, %zmm25, %zmm31 1 4 0.50 vsubpd %zmm28, %zmm23, %zmm3 1 4 0.50 vmulpd %zmm31, %zmm31, %zmm15 1 4 0.50 vfmadd231pd %zmm12, %zmm12, %zmm15 1 4 0.50 vfmadd231pd %zmm14, %zmm14, %zmm15 3 4 2.00 vrcp14pd %zmm15, %zmm16 1 4 1.00 vcmpltpd %zmm0, %zmm15, %k1 1 4 0.50 vmulpd %zmm20, %zmm16, %zmm15 1 4 0.50 vmulpd %zmm16, %zmm16, %zmm18 1 4 0.50 vmulpd %zmm15, %zmm18, %zmm15 2 8 0.50 * vmovupd 512(%rsp), %zmm18 1 4 0.50 vsubpd %zmm29, %zmm18, %zmm18 1 4 0.50 vmulpd %zmm16, %zmm1, %zmm16 1 4 0.50 vmulpd %zmm15, %zmm16, %zmm16 1 4 0.50 vaddpd %zmm2, %zmm15, %zmm15 1 4 0.50 vmulpd %zmm15, %zmm16, %zmm15 2 8 0.50 * vmovupd 448(%rsp), %zmm16 1 4 0.50 vsubpd %zmm30, %zmm16, %zmm16 1 4 0.50 vfmadd231pd %zmm14, %zmm15, %zmm19 {%k1} 1 4 0.50 vmulpd %zmm16, %zmm16, %zmm14 1 4 0.50 vfmadd231pd %zmm18, %zmm18, %zmm14 1 4 0.50 vfmadd231pd %zmm3, %zmm3, %zmm14 1 4 1.00 vcmpltpd %zmm0, %zmm14, %k2 3 4 2.00 vrcp14pd %zmm14, %zmm14 1 4 0.50 vfmadd231pd %zmm12, %zmm15, %zmm11 {%k1} 1 4 0.50 vfmadd231pd %zmm31, %zmm15, %zmm7 {%k1} 1 4 0.50 vmulpd %zmm20, %zmm14, %zmm12 1 4 0.50 vmulpd %zmm14, %zmm14, %zmm15 1 4 0.50 vmulpd %zmm12, %zmm15, %zmm12 1 4 0.50 vsubpd %zmm28, %zmm24, %zmm15 1 4 0.50 vmulpd %zmm14, %zmm1, %zmm14 1 4 0.50 vmulpd %zmm12, %zmm14, %zmm14 1 4 0.50 vaddpd %zmm2, %zmm12, %zmm12 1 4 0.50 vmulpd %zmm12, %zmm14, %zmm12 1 4 0.50 vsubpd %zmm29, %zmm22, %zmm14 1 4 0.50 vfmadd231pd %zmm3, %zmm12, %zmm17 {%k2} 1 4 0.50 vsubpd %zmm30, %zmm27, %zmm3 1 4 0.50 vfmadd231pd %zmm18, %zmm12, %zmm9 {%k2} 1 4 0.50 vmulpd %zmm3, %zmm3, %zmm18 1 4 0.50 vfmadd231pd %zmm14, %zmm14, %zmm18 1 4 0.50 vfmadd231pd %zmm15, %zmm15, %zmm18 1 4 1.00 vcmpltpd %zmm0, %zmm18, %k1 3 4 2.00 vrcp14pd %zmm18, %zmm18 1 4 0.50 vfmadd231pd %zmm16, %zmm12, %zmm5 {%k2} 1 4 0.50 vmulpd %zmm20, %zmm18, %zmm12 1 4 0.50 vmulpd %zmm18, %zmm18, %zmm16 1 4 0.50 vmulpd %zmm12, %zmm16, %zmm12 1 4 0.50 vmulpd %zmm18, %zmm1, %zmm16 1 4 0.50 vmulpd %zmm12, %zmm16, %zmm16 1 4 0.50 vaddpd %zmm2, %zmm12, %zmm12 1 4 0.50 vmulpd %zmm12, %zmm16, %zmm12 1 4 0.50 vfmadd231pd %zmm15, %zmm12, %zmm21 {%k1} 2 8 0.50 * vmovupd 576(%rsp), %zmm15 1 4 0.50 vsubpd %zmm28, %zmm15, %zmm15 2 8 0.50 * vmovupd 128(%rsp), %zmm16 1 4 0.50 vsubpd %zmm29, %zmm16, %zmm16 2 8 0.50 * vmovupd 384(%rsp), %zmm18 1 4 0.50 vsubpd %zmm30, %zmm18, %zmm18 1 4 0.50 vfmadd231pd %zmm14, %zmm12, %zmm10 {%k1} 1 4 0.50 vmulpd %zmm18, %zmm18, %zmm14 1 4 0.50 vfmadd231pd %zmm16, %zmm16, %zmm14 1 4 0.50 vfmadd231pd %zmm15, %zmm15, %zmm14 1 4 1.00 vcmpltpd %zmm0, %zmm14, %k2 3 4 2.00 vrcp14pd %zmm14, %zmm14 1 4 0.50 vfmadd231pd %zmm3, %zmm12, %zmm6 {%k1} 1 4 0.50 vmulpd %zmm20, %zmm14, %zmm3 1 4 0.50 vmulpd %zmm14, %zmm14, %zmm12 1 4 0.50 vmulpd %zmm3, %zmm12, %zmm3 1 4 0.50 vmulpd %zmm14, %zmm1, %zmm12 1 4 0.50 vmulpd %zmm3, %zmm12, %zmm12 1 4 0.50 vaddpd %zmm2, %zmm3, %zmm3 1 4 0.50 vmulpd %zmm3, %zmm12, %zmm3 1 4 0.50 vfmadd231pd %zmm15, %zmm3, %zmm13 {%k2} 1 4 0.50 vfmadd231pd %zmm16, %zmm3, %zmm8 {%k2} 1 4 0.50 vfmadd231pd %zmm18, %zmm3, %zmm4 {%k2} 1 1 0.25 incq %rcx 1 1 0.25 cmpq %rcx, %r11 1 1 0.50 jne .LBB5_11 1 1 0.50 jmp .LBB5_12 Resources: [0] - SKXDivider [1] - SKXFPDivider [2] - SKXPort0 [3] - SKXPort1 [4] - SKXPort2 [5] - SKXPort3 [6] - SKXPort4 [7] - SKXPort5 [8] - SKXPort6 [9] - SKXPort7 Resource pressure per iteration: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] - - 40.89 9.09 5.00 5.00 - 40.21 4.81 - Resource pressure by instruction: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] Instructions: - - - - - 1.00 - - - - movslq (%rdx,%rcx,4), %rax - - - 0.99 - - - 0.01 - - leaq (%rax,%rax,2), %rax - - - - - - - - 1.00 - shlq $6, %rax - - - 1.00 - 1.00 - - - - vmovapd (%rdi,%rax), %zmm28 - - 0.35 0.64 1.00 - - 0.01 - - vmovapd 64(%rdi,%rax), %zmm29 - - - 0.83 - 1.00 - 0.17 - - vmovapd 128(%rdi,%rax), %zmm30 - - - 0.99 1.00 - - 0.01 - - vmovupd 64(%rsp), %zmm3 - - 0.17 - - - - 0.83 - - vsubpd %zmm28, %zmm3, %zmm14 - - 0.17 - - - - 0.83 - - vsubpd %zmm29, %zmm26, %zmm12 - - 0.17 - - - - 0.83 - - vsubpd %zmm30, %zmm25, %zmm31 - - 0.32 - - - - 0.68 - - vsubpd %zmm28, %zmm23, %zmm3 - - 0.49 - - - - 0.51 - - vmulpd %zmm31, %zmm31, %zmm15 - - 0.66 - - - - 0.34 - - vfmadd231pd %zmm12, %zmm12, %zmm15 - - 0.35 - - - - 0.65 - - vfmadd231pd %zmm14, %zmm14, %zmm15 - - 2.00 - - - - 1.00 - - vrcp14pd %zmm15, %zmm16 - - - - - - - 1.00 - - vcmpltpd %zmm0, %zmm15, %k1 - - 0.66 - - - - 0.34 - - vmulpd %zmm20, %zmm16, %zmm15 - - 0.34 - - - - 0.66 - - vmulpd %zmm16, %zmm16, %zmm18 - - 0.50 - - - - 0.50 - - vmulpd %zmm15, %zmm18, %zmm15 - - 0.33 0.67 0.99 0.01 - - - - vmovupd 512(%rsp), %zmm18 - - 0.17 - - - - 0.83 - - vsubpd %zmm29, %zmm18, %zmm18 - - 0.66 - - - - 0.34 - - vmulpd %zmm16, %zmm1, %zmm16 - - 0.33 - - - - 0.67 - - vmulpd %zmm15, %zmm16, %zmm16 - - 0.67 - - - - 0.33 - - vaddpd %zmm2, %zmm15, %zmm15 - - 0.67 - - - - 0.33 - - vmulpd %zmm15, %zmm16, %zmm15 - - 0.01 0.99 0.01 0.99 - - - - vmovupd 448(%rsp), %zmm16 - - 0.02 - - - - 0.98 - - vsubpd %zmm30, %zmm16, %zmm16 - - 1.00 - - - - - - - vfmadd231pd %zmm14, %zmm15, %zmm19 {%k1} - - 0.65 - - - - 0.35 - - vmulpd %zmm16, %zmm16, %zmm14 - - 0.66 - - - - 0.34 - - vfmadd231pd %zmm18, %zmm18, %zmm14 - - 0.50 - - - - 0.50 - - vfmadd231pd %zmm3, %zmm3, %zmm14 - - - - - - - 1.00 - - vcmpltpd %zmm0, %zmm14, %k2 - - 2.00 - - - - 1.00 - - vrcp14pd %zmm14, %zmm14 - - - - - - - 1.00 - - vfmadd231pd %zmm12, %zmm15, %zmm11 {%k1} - - 1.00 - - - - - - - vfmadd231pd %zmm31, %zmm15, %zmm7 {%k1} - - 0.67 - - - - 0.33 - - vmulpd %zmm20, %zmm14, %zmm12 - - 0.33 - - - - 0.67 - - vmulpd %zmm14, %zmm14, %zmm15 - - 0.49 - - - - 0.51 - - vmulpd %zmm12, %zmm15, %zmm12 - - 0.49 - - - - 0.51 - - vsubpd %zmm28, %zmm24, %zmm15 - - 0.67 - - - - 0.33 - - vmulpd %zmm14, %zmm1, %zmm14 - - 0.83 - - - - 0.17 - - vmulpd %zmm12, %zmm14, %zmm14 - - 0.17 - - - - 0.83 - - vaddpd %zmm2, %zmm12, %zmm12 - - 0.67 - - - - 0.33 - - vmulpd %zmm12, %zmm14, %zmm12 - - 0.34 - - - - 0.66 - - vsubpd %zmm29, %zmm22, %zmm14 - - 0.66 - - - - 0.34 - - vfmadd231pd %zmm3, %zmm12, %zmm17 {%k2} - - 0.49 - - - - 0.51 - - vsubpd %zmm30, %zmm27, %zmm3 - - 0.34 - - - - 0.66 - - vfmadd231pd %zmm18, %zmm12, %zmm9 {%k2} - - 0.19 - - - - 0.81 - - vmulpd %zmm3, %zmm3, %zmm18 - - 0.32 - - - - 0.68 - - vfmadd231pd %zmm14, %zmm14, %zmm18 - - 0.82 - - - - 0.18 - - vfmadd231pd %zmm15, %zmm15, %zmm18 - - - - - - - 1.00 - - vcmpltpd %zmm0, %zmm18, %k1 - - 2.00 - - - - 1.00 - - vrcp14pd %zmm18, %zmm18 - - 0.66 - - - - 0.34 - - vfmadd231pd %zmm16, %zmm12, %zmm5 {%k2} - - 0.82 - - - - 0.18 - - vmulpd %zmm20, %zmm18, %zmm12 - - 0.18 - - - - 0.82 - - vmulpd %zmm18, %zmm18, %zmm16 - - 0.68 - - - - 0.32 - - vmulpd %zmm12, %zmm16, %zmm12 - - 0.65 - - - - 0.35 - - vmulpd %zmm18, %zmm1, %zmm16 - - 0.83 - - - - 0.17 - - vmulpd %zmm12, %zmm16, %zmm16 - - 0.17 - - - - 0.83 - - vaddpd %zmm2, %zmm12, %zmm12 - - 0.83 - - - - 0.17 - - vmulpd %zmm12, %zmm16, %zmm12 - - 0.65 - - - - 0.35 - - vfmadd231pd %zmm15, %zmm12, %zmm21 {%k1} - - - 1.00 1.00 - - - - - vmovupd 576(%rsp), %zmm15 - - 0.33 - - - - 0.67 - - vsubpd %zmm28, %zmm15, %zmm15 - - 0.01 0.99 - 1.00 - - - - vmovupd 128(%rsp), %zmm16 - - 0.66 - - - - 0.34 - - vsubpd %zmm29, %zmm16, %zmm16 - - - 0.99 1.00 - - 0.01 - - vmovupd 384(%rsp), %zmm18 - - 0.49 - - - - 0.51 - - vsubpd %zmm30, %zmm18, %zmm18 - - 0.35 - - - - 0.65 - - vfmadd231pd %zmm14, %zmm12, %zmm10 {%k1} - - 0.19 - - - - 0.81 - - vmulpd %zmm18, %zmm18, %zmm14 - - 0.35 - - - - 0.65 - - vfmadd231pd %zmm16, %zmm16, %zmm14 - - 0.83 - - - - 0.17 - - vfmadd231pd %zmm15, %zmm15, %zmm14 - - - - - - - 1.00 - - vcmpltpd %zmm0, %zmm14, %k2 - - 2.00 - - - - 1.00 - - vrcp14pd %zmm14, %zmm14 - - 0.65 - - - - 0.35 - - vfmadd231pd %zmm3, %zmm12, %zmm6 {%k1} - - 0.51 - - - - 0.49 - - vmulpd %zmm20, %zmm14, %zmm3 - - 0.33 - - - - 0.67 - - vmulpd %zmm14, %zmm14, %zmm12 - - 0.36 - - - - 0.64 - - vmulpd %zmm3, %zmm12, %zmm3 - - 0.50 - - - - 0.50 - - vmulpd %zmm14, %zmm1, %zmm12 - - 0.51 - - - - 0.49 - - vmulpd %zmm3, %zmm12, %zmm12 - - 0.49 - - - - 0.51 - - vaddpd %zmm2, %zmm3, %zmm3 - - 0.52 - - - - 0.48 - - vmulpd %zmm3, %zmm12, %zmm3 - - 0.82 - - - - 0.18 - - vfmadd231pd %zmm15, %zmm3, %zmm13 {%k2} - - 0.18 - - - - 0.82 - - vfmadd231pd %zmm16, %zmm3, %zmm8 {%k2} - - 0.82 - - - - 0.18 - - vfmadd231pd %zmm18, %zmm3, %zmm4 {%k2} - - - - - - - - 1.00 - incq %rcx - - - - - - - - 1.00 - cmpq %rcx, %r11 - - - - - - - - 1.00 - jne .LBB5_11 - - 0.19 - - - - - 0.81 - jmp .LBB5_12