129 lines
7.9 KiB
Plaintext
129 lines
7.9 KiB
Plaintext
|
|
||
|
[0] Code Region
|
||
|
|
||
|
Iterations: 100
|
||
|
Instructions: 4200
|
||
|
Total Cycles: 2465
|
||
|
Total uOps: 5800
|
||
|
|
||
|
Dispatch Width: 6
|
||
|
uOps Per Cycle: 2.35
|
||
|
IPC: 1.70
|
||
|
Block RThroughput: 13.0
|
||
|
|
||
|
|
||
|
Instruction Info:
|
||
|
[1]: #uOps
|
||
|
[2]: Latency
|
||
|
[3]: RThroughput
|
||
|
[4]: MayLoad
|
||
|
[5]: MayStore
|
||
|
[6]: HasSideEffects (U)
|
||
|
|
||
|
[1] [2] [3] [4] [5] [6] Instructions:
|
||
|
1 4 1.00 vpcmpgtd %ymm4, %ymm3, %k5
|
||
|
1 1 0.33 vpaddd %ymm15, %ymm4, %ymm4
|
||
|
2 8 0.50 * vmovdqu32 (%r10,%r15,4), %ymm17 {%k5} {z}
|
||
|
1 1 0.33 vpaddd %ymm17, %ymm17, %ymm18
|
||
|
1 1 0.25 addq $8, %r15
|
||
|
1 1 0.33 vpaddd %ymm18, %ymm17, %ymm19
|
||
|
1 1 1.00 kmovw %k5, %k2
|
||
|
1 1 1.00 kmovw %k5, %k3
|
||
|
1 1 1.00 kmovw %k5, %k1
|
||
|
1 0 0.17 vpxord %zmm21, %zmm21, %zmm21
|
||
|
1 0 0.17 vpxord %zmm20, %zmm20, %zmm20
|
||
|
1 0 0.17 vpxord %zmm22, %zmm22, %zmm22
|
||
|
5 21 4.00 * vgatherdpd 8(%rbx,%ymm19,8), %zmm21 {%k2}
|
||
|
5 21 4.00 * vgatherdpd (%rbx,%ymm19,8), %zmm20 {%k3}
|
||
|
5 21 4.00 * vgatherdpd 16(%rbx,%ymm19,8), %zmm22 {%k1}
|
||
|
1 4 0.50 vsubpd %zmm21, %zmm1, %zmm18
|
||
|
1 4 0.50 vsubpd %zmm20, %zmm2, %zmm17
|
||
|
1 4 0.50 vsubpd %zmm22, %zmm0, %zmm19
|
||
|
1 4 0.50 vmulpd %zmm18, %zmm18, %zmm31
|
||
|
1 4 0.50 vfmadd231pd %zmm17, %zmm17, %zmm31
|
||
|
1 4 0.50 vfmadd231pd %zmm19, %zmm19, %zmm31
|
||
|
3 4 2.00 vrcp14pd %zmm31, %zmm30
|
||
|
1 4 1.00 vcmpltpd %zmm14, %zmm31, %k6 {%k5}
|
||
|
1 4 1.00 vfpclasspd $30, %zmm30, %k0
|
||
|
1 1 0.50 vmovaps %zmm31, %zmm23
|
||
|
2 11 0.50 * vfnmadd213pd .L_2il0floatpacket.5(%rip){1to8}, %zmm30, %zmm23
|
||
|
1 1 1.00 knotw %k0, %k4
|
||
|
1 4 0.50 vmulpd %zmm23, %zmm23, %zmm24
|
||
|
1 4 0.50 vfmadd213pd %zmm30, %zmm23, %zmm30 {%k4}
|
||
|
1 4 0.50 vfmadd213pd %zmm30, %zmm24, %zmm30 {%k4}
|
||
|
1 4 0.50 vmulpd %zmm13, %zmm30, %zmm25
|
||
|
1 4 0.50 vmulpd %zmm12, %zmm30, %zmm27
|
||
|
1 4 0.50 vmulpd %zmm25, %zmm30, %zmm28
|
||
|
1 4 0.50 vmulpd %zmm28, %zmm30, %zmm26
|
||
|
1 4 0.50 vfmsub213pd %zmm5, %zmm28, %zmm30
|
||
|
1 4 0.50 vmulpd %zmm27, %zmm26, %zmm29
|
||
|
1 4 0.50 vmulpd %zmm30, %zmm29, %zmm23
|
||
|
1 4 0.50 vfmadd231pd %zmm17, %zmm23, %zmm10 {%k6}
|
||
|
1 4 0.50 vfmadd231pd %zmm18, %zmm23, %zmm9 {%k6}
|
||
|
1 4 0.50 vfmadd231pd %zmm19, %zmm23, %zmm8 {%k6}
|
||
|
1 1 0.25 cmpq %r14, %r15
|
||
|
1 1 0.50 jb ..B1.16
|
||
|
|
||
|
|
||
|
Resources:
|
||
|
[0] - SKXDivider
|
||
|
[1] - SKXFPDivider
|
||
|
[2] - SKXPort0
|
||
|
[3] - SKXPort1
|
||
|
[4] - SKXPort2
|
||
|
[5] - SKXPort3
|
||
|
[6] - SKXPort4
|
||
|
[7] - SKXPort5
|
||
|
[8] - SKXPort6
|
||
|
[9] - SKXPort7
|
||
|
|
||
|
|
||
|
Resource pressure per iteration:
|
||
|
[0] [1] [2] [3] [4] [5] [6] [7] [8] [9]
|
||
|
- - 19.02 6.79 12.64 13.36 - 16.03 5.16 -
|
||
|
|
||
|
Resource pressure by instruction:
|
||
|
[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] Instructions:
|
||
|
- - - - - - - 1.00 - - vpcmpgtd %ymm4, %ymm3, %k5
|
||
|
- - 0.28 0.72 - - - - - - vpaddd %ymm15, %ymm4, %ymm4
|
||
|
- - 0.14 0.71 0.55 0.45 - 0.15 - - vmovdqu32 (%r10,%r15,4), %ymm17 {%k5} {z}
|
||
|
- - - 0.97 - - - 0.03 - - vpaddd %ymm17, %ymm17, %ymm18
|
||
|
- - 0.14 0.41 - - - 0.13 0.32 - addq $8, %r15
|
||
|
- - - 0.99 - - - 0.01 - - vpaddd %ymm18, %ymm17, %ymm19
|
||
|
- - 1.00 - - - - - - - kmovw %k5, %k2
|
||
|
- - 1.00 - - - - - - - kmovw %k5, %k3
|
||
|
- - 1.00 - - - - - - - kmovw %k5, %k1
|
||
|
- - - - - - - - - - vpxord %zmm21, %zmm21, %zmm21
|
||
|
- - - - - - - - - - vpxord %zmm20, %zmm20, %zmm20
|
||
|
- - - - - - - - - - vpxord %zmm22, %zmm22, %zmm22
|
||
|
- - 1.00 0.99 3.52 4.48 - 0.01 1.00 - vgatherdpd 8(%rbx,%ymm19,8), %zmm21 {%k2}
|
||
|
- - 1.00 0.99 4.48 3.52 - 0.01 1.00 - vgatherdpd (%rbx,%ymm19,8), %zmm20 {%k3}
|
||
|
- - 1.00 1.00 3.52 4.48 - - 1.00 - vgatherdpd 16(%rbx,%ymm19,8), %zmm22 {%k1}
|
||
|
- - 0.02 - - - - 0.98 - - vsubpd %zmm21, %zmm1, %zmm18
|
||
|
- - 0.17 - - - - 0.83 - - vsubpd %zmm20, %zmm2, %zmm17
|
||
|
- - 0.18 - - - - 0.82 - - vsubpd %zmm22, %zmm0, %zmm19
|
||
|
- - 0.01 - - - - 0.99 - - vmulpd %zmm18, %zmm18, %zmm31
|
||
|
- - 0.69 - - - - 0.31 - - vfmadd231pd %zmm17, %zmm17, %zmm31
|
||
|
- - 0.68 - - - - 0.32 - - vfmadd231pd %zmm19, %zmm19, %zmm31
|
||
|
- - 2.00 - - - - 1.00 - - vrcp14pd %zmm31, %zmm30
|
||
|
- - - - - - - 1.00 - - vcmpltpd %zmm14, %zmm31, %k6 {%k5}
|
||
|
- - - - - - - 1.00 - - vfpclasspd $30, %zmm30, %k0
|
||
|
- - 0.83 - - - - 0.17 - - vmovaps %zmm31, %zmm23
|
||
|
- - 1.00 - 0.57 0.43 - - - - vfnmadd213pd .L_2il0floatpacket.5(%rip){1to8}, %zmm30, %zmm23
|
||
|
- - 1.00 - - - - - - - knotw %k0, %k4
|
||
|
- - 0.44 - - - - 0.56 - - vmulpd %zmm23, %zmm23, %zmm24
|
||
|
- - 0.56 - - - - 0.44 - - vfmadd213pd %zmm30, %zmm23, %zmm30 {%k4}
|
||
|
- - 0.55 - - - - 0.45 - - vfmadd213pd %zmm30, %zmm24, %zmm30 {%k4}
|
||
|
- - 0.69 - - - - 0.31 - - vmulpd %zmm13, %zmm30, %zmm25
|
||
|
- - 0.31 - - - - 0.69 - - vmulpd %zmm12, %zmm30, %zmm27
|
||
|
- - 0.56 - - - - 0.44 - - vmulpd %zmm25, %zmm30, %zmm28
|
||
|
- - 0.02 - - - - 0.98 - - vmulpd %zmm28, %zmm30, %zmm26
|
||
|
- - 0.98 - - - - 0.02 - - vfmsub213pd %zmm5, %zmm28, %zmm30
|
||
|
- - 0.30 - - - - 0.70 - - vmulpd %zmm27, %zmm26, %zmm29
|
||
|
- - 0.16 - - - - 0.84 - - vmulpd %zmm30, %zmm29, %zmm23
|
||
|
- - 0.17 - - - - 0.83 - - vfmadd231pd %zmm17, %zmm23, %zmm10 {%k6}
|
||
|
- - 0.83 - - - - 0.17 - - vfmadd231pd %zmm18, %zmm23, %zmm9 {%k6}
|
||
|
- - 0.17 - - - - 0.83 - - vfmadd231pd %zmm19, %zmm23, %zmm8 {%k6}
|
||
|
- - - 0.01 - - - 0.01 0.98 - cmpq %r14, %r15
|
||
|
- - 0.14 - - - - - 0.86 - jb ..B1.16
|