[0] Code Region Iterations: 100 Instructions: 4200 Total Cycles: 2465 Total uOps: 5800 Dispatch Width: 6 uOps Per Cycle: 2.35 IPC: 1.70 Block RThroughput: 13.0 Instruction Info: [1]: #uOps [2]: Latency [3]: RThroughput [4]: MayLoad [5]: MayStore [6]: HasSideEffects (U) [1] [2] [3] [4] [5] [6] Instructions: 1 4 1.00 vpcmpgtd %ymm4, %ymm3, %k5 1 1 0.33 vpaddd %ymm15, %ymm4, %ymm4 2 8 0.50 * vmovdqu32 (%r10,%r15,4), %ymm17 {%k5} {z} 1 1 0.33 vpaddd %ymm17, %ymm17, %ymm18 1 1 0.25 addq $8, %r15 1 1 0.33 vpaddd %ymm18, %ymm17, %ymm19 1 1 1.00 kmovw %k5, %k2 1 1 1.00 kmovw %k5, %k3 1 1 1.00 kmovw %k5, %k1 1 0 0.17 vpxord %zmm21, %zmm21, %zmm21 1 0 0.17 vpxord %zmm20, %zmm20, %zmm20 1 0 0.17 vpxord %zmm22, %zmm22, %zmm22 5 21 4.00 * vgatherdpd 8(%rbx,%ymm19,8), %zmm21 {%k2} 5 21 4.00 * vgatherdpd (%rbx,%ymm19,8), %zmm20 {%k3} 5 21 4.00 * vgatherdpd 16(%rbx,%ymm19,8), %zmm22 {%k1} 1 4 0.50 vsubpd %zmm21, %zmm1, %zmm18 1 4 0.50 vsubpd %zmm20, %zmm2, %zmm17 1 4 0.50 vsubpd %zmm22, %zmm0, %zmm19 1 4 0.50 vmulpd %zmm18, %zmm18, %zmm31 1 4 0.50 vfmadd231pd %zmm17, %zmm17, %zmm31 1 4 0.50 vfmadd231pd %zmm19, %zmm19, %zmm31 3 4 2.00 vrcp14pd %zmm31, %zmm30 1 4 1.00 vcmpltpd %zmm14, %zmm31, %k6 {%k5} 1 4 1.00 vfpclasspd $30, %zmm30, %k0 1 1 0.50 vmovaps %zmm31, %zmm23 2 11 0.50 * vfnmadd213pd .L_2il0floatpacket.5(%rip){1to8}, %zmm30, %zmm23 1 1 1.00 knotw %k0, %k4 1 4 0.50 vmulpd %zmm23, %zmm23, %zmm24 1 4 0.50 vfmadd213pd %zmm30, %zmm23, %zmm30 {%k4} 1 4 0.50 vfmadd213pd %zmm30, %zmm24, %zmm30 {%k4} 1 4 0.50 vmulpd %zmm13, %zmm30, %zmm25 1 4 0.50 vmulpd %zmm12, %zmm30, %zmm27 1 4 0.50 vmulpd %zmm25, %zmm30, %zmm28 1 4 0.50 vmulpd %zmm28, %zmm30, %zmm26 1 4 0.50 vfmsub213pd %zmm5, %zmm28, %zmm30 1 4 0.50 vmulpd %zmm27, %zmm26, %zmm29 1 4 0.50 vmulpd %zmm30, %zmm29, %zmm23 1 4 0.50 vfmadd231pd %zmm17, %zmm23, %zmm10 {%k6} 1 4 0.50 vfmadd231pd %zmm18, %zmm23, %zmm9 {%k6} 1 4 0.50 vfmadd231pd %zmm19, %zmm23, %zmm8 {%k6} 1 1 0.25 cmpq %r14, %r15 1 1 0.50 jb ..B1.16 Resources: [0] - ICXDivider [1] - ICXFPDivider [2] - ICXPort0 [3] - ICXPort1 [4] - ICXPort2 [5] - ICXPort3 [6] - ICXPort4 [7] - ICXPort5 [8] - ICXPort6 [9] - ICXPort7 [10] - ICXPort8 [11] - ICXPort9 Resource pressure per iteration: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] - - 19.02 6.79 12.64 13.36 - 16.03 5.16 - - - Resource pressure by instruction: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] Instructions: - - - - - - - 1.00 - - - - vpcmpgtd %ymm4, %ymm3, %k5 - - 0.28 0.72 - - - - - - - - vpaddd %ymm15, %ymm4, %ymm4 - - 0.14 0.71 0.55 0.45 - 0.15 - - - - vmovdqu32 (%r10,%r15,4), %ymm17 {%k5} {z} - - - 0.97 - - - 0.03 - - - - vpaddd %ymm17, %ymm17, %ymm18 - - 0.14 0.41 - - - 0.13 0.32 - - - addq $8, %r15 - - - 0.99 - - - 0.01 - - - - vpaddd %ymm18, %ymm17, %ymm19 - - 1.00 - - - - - - - - - kmovw %k5, %k2 - - 1.00 - - - - - - - - - kmovw %k5, %k3 - - 1.00 - - - - - - - - - kmovw %k5, %k1 - - - - - - - - - - - - vpxord %zmm21, %zmm21, %zmm21 - - - - - - - - - - - - vpxord %zmm20, %zmm20, %zmm20 - - - - - - - - - - - - vpxord %zmm22, %zmm22, %zmm22 - - 1.00 0.99 3.52 4.48 - 0.01 1.00 - - - vgatherdpd 8(%rbx,%ymm19,8), %zmm21 {%k2} - - 1.00 0.99 4.48 3.52 - 0.01 1.00 - - - vgatherdpd (%rbx,%ymm19,8), %zmm20 {%k3} - - 1.00 1.00 3.52 4.48 - - 1.00 - - - vgatherdpd 16(%rbx,%ymm19,8), %zmm22 {%k1} - - 0.02 - - - - 0.98 - - - - vsubpd %zmm21, %zmm1, %zmm18 - - 0.17 - - - - 0.83 - - - - vsubpd %zmm20, %zmm2, %zmm17 - - 0.18 - - - - 0.82 - - - - vsubpd %zmm22, %zmm0, %zmm19 - - 0.01 - - - - 0.99 - - - - vmulpd %zmm18, %zmm18, %zmm31 - - 0.69 - - - - 0.31 - - - - vfmadd231pd %zmm17, %zmm17, %zmm31 - - 0.68 - - - - 0.32 - - - - vfmadd231pd %zmm19, %zmm19, %zmm31 - - 2.00 - - - - 1.00 - - - - vrcp14pd %zmm31, %zmm30 - - - - - - - 1.00 - - - - vcmpltpd %zmm14, %zmm31, %k6 {%k5} - - - - - - - 1.00 - - - - vfpclasspd $30, %zmm30, %k0 - - 0.83 - - - - 0.17 - - - - vmovaps %zmm31, %zmm23 - - 1.00 - 0.57 0.43 - - - - - - vfnmadd213pd .L_2il0floatpacket.5(%rip){1to8}, %zmm30, %zmm23 - - 1.00 - - - - - - - - - knotw %k0, %k4 - - 0.44 - - - - 0.56 - - - - vmulpd %zmm23, %zmm23, %zmm24 - - 0.56 - - - - 0.44 - - - - vfmadd213pd %zmm30, %zmm23, %zmm30 {%k4} - - 0.55 - - - - 0.45 - - - - vfmadd213pd %zmm30, %zmm24, %zmm30 {%k4} - - 0.69 - - - - 0.31 - - - - vmulpd %zmm13, %zmm30, %zmm25 - - 0.31 - - - - 0.69 - - - - vmulpd %zmm12, %zmm30, %zmm27 - - 0.56 - - - - 0.44 - - - - vmulpd %zmm25, %zmm30, %zmm28 - - 0.02 - - - - 0.98 - - - - vmulpd %zmm28, %zmm30, %zmm26 - - 0.98 - - - - 0.02 - - - - vfmsub213pd %zmm5, %zmm28, %zmm30 - - 0.30 - - - - 0.70 - - - - vmulpd %zmm27, %zmm26, %zmm29 - - 0.16 - - - - 0.84 - - - - vmulpd %zmm30, %zmm29, %zmm23 - - 0.17 - - - - 0.83 - - - - vfmadd231pd %zmm17, %zmm23, %zmm10 {%k6} - - 0.83 - - - - 0.17 - - - - vfmadd231pd %zmm18, %zmm23, %zmm9 {%k6} - - 0.17 - - - - 0.83 - - - - vfmadd231pd %zmm19, %zmm23, %zmm8 {%k6} - - - 0.01 - - - 0.01 0.98 - - - cmpq %r14, %r15 - - 0.14 - - - - - 0.86 - - - jb ..B1.16