[0] Code Region

Iterations:        100
Instructions:      4200
Total Cycles:      2465
Total uOps:        5800

Dispatch Width:    6
uOps Per Cycle:    2.35
IPC:               1.70
Block RThroughput: 13.0


Instruction Info:
[1]: #uOps
[2]: Latency
[3]: RThroughput
[4]: MayLoad
[5]: MayStore
[6]: HasSideEffects (U)

[1]    [2]    [3]    [4]    [5]    [6]    Instructions:
 1      4     1.00                        vpcmpgtd	%ymm4, %ymm3, %k5
 1      1     0.33                        vpaddd	%ymm15, %ymm4, %ymm4
 2      8     0.50    *                   vmovdqu32	(%r10,%r15,4), %ymm17 {%k5} {z}
 1      1     0.33                        vpaddd	%ymm17, %ymm17, %ymm18
 1      1     0.25                        addq	$8, %r15
 1      1     0.33                        vpaddd	%ymm18, %ymm17, %ymm19
 1      1     1.00                        kmovw	%k5, %k2
 1      1     1.00                        kmovw	%k5, %k3
 1      1     1.00                        kmovw	%k5, %k1
 1      0     0.17                        vpxord	%zmm21, %zmm21, %zmm21
 1      0     0.17                        vpxord	%zmm20, %zmm20, %zmm20
 1      0     0.17                        vpxord	%zmm22, %zmm22, %zmm22
 5      21    4.00    *                   vgatherdpd	8(%rbx,%ymm19,8), %zmm21 {%k2}
 5      21    4.00    *                   vgatherdpd	(%rbx,%ymm19,8), %zmm20 {%k3}
 5      21    4.00    *                   vgatherdpd	16(%rbx,%ymm19,8), %zmm22 {%k1}
 1      4     0.50                        vsubpd	%zmm21, %zmm1, %zmm18
 1      4     0.50                        vsubpd	%zmm20, %zmm2, %zmm17
 1      4     0.50                        vsubpd	%zmm22, %zmm0, %zmm19
 1      4     0.50                        vmulpd	%zmm18, %zmm18, %zmm31
 1      4     0.50                        vfmadd231pd	%zmm17, %zmm17, %zmm31
 1      4     0.50                        vfmadd231pd	%zmm19, %zmm19, %zmm31
 3      4     2.00                        vrcp14pd	%zmm31, %zmm30
 1      4     1.00                        vcmpltpd	%zmm14, %zmm31, %k6 {%k5}
 1      4     1.00                        vfpclasspd	$30, %zmm30, %k0
 1      1     0.50                        vmovaps	%zmm31, %zmm23
 2      11    0.50    *                   vfnmadd213pd	.L_2il0floatpacket.5(%rip){1to8}, %zmm30, %zmm23
 1      1     1.00                        knotw	%k0, %k4
 1      4     0.50                        vmulpd	%zmm23, %zmm23, %zmm24
 1      4     0.50                        vfmadd213pd	%zmm30, %zmm23, %zmm30 {%k4}
 1      4     0.50                        vfmadd213pd	%zmm30, %zmm24, %zmm30 {%k4}
 1      4     0.50                        vmulpd	%zmm13, %zmm30, %zmm25
 1      4     0.50                        vmulpd	%zmm12, %zmm30, %zmm27
 1      4     0.50                        vmulpd	%zmm25, %zmm30, %zmm28
 1      4     0.50                        vmulpd	%zmm28, %zmm30, %zmm26
 1      4     0.50                        vfmsub213pd	%zmm5, %zmm28, %zmm30
 1      4     0.50                        vmulpd	%zmm27, %zmm26, %zmm29
 1      4     0.50                        vmulpd	%zmm30, %zmm29, %zmm23
 1      4     0.50                        vfmadd231pd	%zmm17, %zmm23, %zmm10 {%k6}
 1      4     0.50                        vfmadd231pd	%zmm18, %zmm23, %zmm9 {%k6}
 1      4     0.50                        vfmadd231pd	%zmm19, %zmm23, %zmm8 {%k6}
 1      1     0.25                        cmpq	%r14, %r15
 1      1     0.50                        jb	..B1.16


Resources:
[0]   - ICXDivider
[1]   - ICXFPDivider
[2]   - ICXPort0
[3]   - ICXPort1
[4]   - ICXPort2
[5]   - ICXPort3
[6]   - ICXPort4
[7]   - ICXPort5
[8]   - ICXPort6
[9]   - ICXPort7
[10]  - ICXPort8
[11]  - ICXPort9


Resource pressure per iteration:
[0]    [1]    [2]    [3]    [4]    [5]    [6]    [7]    [8]    [9]    [10]   [11]   
 -      -     19.02  6.79   12.64  13.36   -     16.03  5.16    -      -      -     

Resource pressure by instruction:
[0]    [1]    [2]    [3]    [4]    [5]    [6]    [7]    [8]    [9]    [10]   [11]   Instructions:
 -      -      -      -      -      -      -     1.00    -      -      -      -     vpcmpgtd	%ymm4, %ymm3, %k5
 -      -     0.28   0.72    -      -      -      -      -      -      -      -     vpaddd	%ymm15, %ymm4, %ymm4
 -      -     0.14   0.71   0.55   0.45    -     0.15    -      -      -      -     vmovdqu32	(%r10,%r15,4), %ymm17 {%k5} {z}
 -      -      -     0.97    -      -      -     0.03    -      -      -      -     vpaddd	%ymm17, %ymm17, %ymm18
 -      -     0.14   0.41    -      -      -     0.13   0.32    -      -      -     addq	$8, %r15
 -      -      -     0.99    -      -      -     0.01    -      -      -      -     vpaddd	%ymm18, %ymm17, %ymm19
 -      -     1.00    -      -      -      -      -      -      -      -      -     kmovw	%k5, %k2
 -      -     1.00    -      -      -      -      -      -      -      -      -     kmovw	%k5, %k3
 -      -     1.00    -      -      -      -      -      -      -      -      -     kmovw	%k5, %k1
 -      -      -      -      -      -      -      -      -      -      -      -     vpxord	%zmm21, %zmm21, %zmm21
 -      -      -      -      -      -      -      -      -      -      -      -     vpxord	%zmm20, %zmm20, %zmm20
 -      -      -      -      -      -      -      -      -      -      -      -     vpxord	%zmm22, %zmm22, %zmm22
 -      -     1.00   0.99   3.52   4.48    -     0.01   1.00    -      -      -     vgatherdpd	8(%rbx,%ymm19,8), %zmm21 {%k2}
 -      -     1.00   0.99   4.48   3.52    -     0.01   1.00    -      -      -     vgatherdpd	(%rbx,%ymm19,8), %zmm20 {%k3}
 -      -     1.00   1.00   3.52   4.48    -      -     1.00    -      -      -     vgatherdpd	16(%rbx,%ymm19,8), %zmm22 {%k1}
 -      -     0.02    -      -      -      -     0.98    -      -      -      -     vsubpd	%zmm21, %zmm1, %zmm18
 -      -     0.17    -      -      -      -     0.83    -      -      -      -     vsubpd	%zmm20, %zmm2, %zmm17
 -      -     0.18    -      -      -      -     0.82    -      -      -      -     vsubpd	%zmm22, %zmm0, %zmm19
 -      -     0.01    -      -      -      -     0.99    -      -      -      -     vmulpd	%zmm18, %zmm18, %zmm31
 -      -     0.69    -      -      -      -     0.31    -      -      -      -     vfmadd231pd	%zmm17, %zmm17, %zmm31
 -      -     0.68    -      -      -      -     0.32    -      -      -      -     vfmadd231pd	%zmm19, %zmm19, %zmm31
 -      -     2.00    -      -      -      -     1.00    -      -      -      -     vrcp14pd	%zmm31, %zmm30
 -      -      -      -      -      -      -     1.00    -      -      -      -     vcmpltpd	%zmm14, %zmm31, %k6 {%k5}
 -      -      -      -      -      -      -     1.00    -      -      -      -     vfpclasspd	$30, %zmm30, %k0
 -      -     0.83    -      -      -      -     0.17    -      -      -      -     vmovaps	%zmm31, %zmm23
 -      -     1.00    -     0.57   0.43    -      -      -      -      -      -     vfnmadd213pd	.L_2il0floatpacket.5(%rip){1to8}, %zmm30, %zmm23
 -      -     1.00    -      -      -      -      -      -      -      -      -     knotw	%k0, %k4
 -      -     0.44    -      -      -      -     0.56    -      -      -      -     vmulpd	%zmm23, %zmm23, %zmm24
 -      -     0.56    -      -      -      -     0.44    -      -      -      -     vfmadd213pd	%zmm30, %zmm23, %zmm30 {%k4}
 -      -     0.55    -      -      -      -     0.45    -      -      -      -     vfmadd213pd	%zmm30, %zmm24, %zmm30 {%k4}
 -      -     0.69    -      -      -      -     0.31    -      -      -      -     vmulpd	%zmm13, %zmm30, %zmm25
 -      -     0.31    -      -      -      -     0.69    -      -      -      -     vmulpd	%zmm12, %zmm30, %zmm27
 -      -     0.56    -      -      -      -     0.44    -      -      -      -     vmulpd	%zmm25, %zmm30, %zmm28
 -      -     0.02    -      -      -      -     0.98    -      -      -      -     vmulpd	%zmm28, %zmm30, %zmm26
 -      -     0.98    -      -      -      -     0.02    -      -      -      -     vfmsub213pd	%zmm5, %zmm28, %zmm30
 -      -     0.30    -      -      -      -     0.70    -      -      -      -     vmulpd	%zmm27, %zmm26, %zmm29
 -      -     0.16    -      -      -      -     0.84    -      -      -      -     vmulpd	%zmm30, %zmm29, %zmm23
 -      -     0.17    -      -      -      -     0.83    -      -      -      -     vfmadd231pd	%zmm17, %zmm23, %zmm10 {%k6}
 -      -     0.83    -      -      -      -     0.17    -      -      -      -     vfmadd231pd	%zmm18, %zmm23, %zmm9 {%k6}
 -      -     0.17    -      -      -      -     0.83    -      -      -      -     vfmadd231pd	%zmm19, %zmm23, %zmm8 {%k6}
 -      -      -     0.01    -      -      -     0.01   0.98    -      -      -     cmpq	%r14, %r15
 -      -     0.14    -      -      -      -      -     0.86    -      -      -     jb	..B1.16