289 lines
20 KiB
Plaintext
289 lines
20 KiB
Plaintext
|
|
[0] Code Region
|
|
|
|
Iterations: 100
|
|
Instructions: 12200
|
|
Total Cycles: 4745
|
|
Total uOps: 14000
|
|
|
|
Dispatch Width: 6
|
|
uOps Per Cycle: 2.95
|
|
IPC: 2.57
|
|
Block RThroughput: 34.0
|
|
|
|
|
|
Instruction Info:
|
|
[1]: #uOps
|
|
[2]: Latency
|
|
[3]: RThroughput
|
|
[4]: MayLoad
|
|
[5]: MayStore
|
|
[6]: HasSideEffects (U)
|
|
|
|
[1] [2] [3] [4] [5] [6] Instructions:
|
|
1 5 0.50 * movslq (%r10,%rbx,4), %rcx
|
|
1 1 0.50 leaq (%rcx,%rcx,2), %rdx
|
|
1 1 0.50 shlq $6, %rdx
|
|
2 8 0.50 * vmovupd (%rsi,%rdx), %zmm28
|
|
2 8 0.50 * vmovupd 64(%rsi,%rdx), %zmm29
|
|
2 8 0.50 * vmovupd 128(%rsi,%rdx), %zmm30
|
|
2 8 0.50 * vmovupd 16(%rsp), %zmm3
|
|
1 4 0.50 vsubpd %zmm28, %zmm3, %zmm3
|
|
1 4 0.50 vsubpd %zmm30, %zmm24, %zmm31
|
|
2 8 0.50 * vmovupd 336(%rsp), %zmm16
|
|
1 4 0.50 vsubpd %zmm29, %zmm16, %zmm16
|
|
1 4 0.50 vmulpd %zmm31, %zmm31, %zmm17
|
|
1 4 0.50 vfmadd231pd %zmm16, %zmm16, %zmm17
|
|
1 4 0.50 vfmadd231pd %zmm3, %zmm3, %zmm17
|
|
3 4 2.00 vrcp14pd %zmm17, %zmm18
|
|
1 4 0.50 vmulpd %zmm18, %zmm21, %zmm19
|
|
1 4 0.50 vmulpd %zmm19, %zmm18, %zmm19
|
|
1 4 0.50 vmulpd %zmm19, %zmm18, %zmm19
|
|
1 4 0.50 vaddpd %zmm1, %zmm19, %zmm20
|
|
1 4 0.50 vmulpd %zmm18, %zmm22, %zmm18
|
|
1 4 0.50 vmulpd %zmm20, %zmm18, %zmm18
|
|
1 4 0.50 vsubpd %zmm30, %zmm25, %zmm20
|
|
1 1 0.50 leal (%rcx,%rcx), %edx
|
|
1 1 0.25 cmpq %rdx, %r11
|
|
1 1 0.50 setne %dl
|
|
1 1 0.50 sete %al
|
|
1 1 0.25 addl %ecx, %ecx
|
|
1 1 0.25 incl %ecx
|
|
1 1 0.25 cmpq %rcx, %r11
|
|
1 1 0.50 sete %cl
|
|
1 4 0.50 vmulpd %zmm18, %zmm19, %zmm18
|
|
2 8 0.50 * vmovupd 528(%rsp), %zmm19
|
|
1 4 0.50 vsubpd %zmm28, %zmm19, %zmm19
|
|
1 1 0.50 setne %dil
|
|
1 1 0.25 movl %edi, %ebp
|
|
1 1 0.50 shlb $4, %bpl
|
|
1 1 0.25 subb %al, %bpl
|
|
1 1 0.25 addb $-17, %bpl
|
|
1 1 1.00 kmovd %ebp, %k1
|
|
1 4 1.00 vcmpltpd %zmm0, %zmm17, %k1 {%k1}
|
|
2 8 0.50 * vmovupd 272(%rsp), %zmm17
|
|
1 4 0.50 vsubpd %zmm29, %zmm17, %zmm17
|
|
1 1 0.50 leal (%rdx,%rdx), %eax
|
|
1 1 0.25 movl %edi, %ebp
|
|
1 4 0.50 vmulpd %zmm2, %zmm18, %zmm18
|
|
1 4 0.50 vfmadd231pd %zmm18, %zmm3, %zmm14 {%k1}
|
|
1 4 0.50 vmulpd %zmm20, %zmm20, %zmm3
|
|
1 4 0.50 vfmadd231pd %zmm17, %zmm17, %zmm3
|
|
1 4 0.50 vfmadd231pd %zmm19, %zmm19, %zmm3
|
|
1 4 0.50 vfmadd231pd %zmm18, %zmm16, %zmm11 {%k1}
|
|
3 4 2.00 vrcp14pd %zmm3, %zmm16
|
|
1 4 0.50 vfmadd231pd %zmm18, %zmm31, %zmm7 {%k1}
|
|
1 4 0.50 vmulpd %zmm16, %zmm21, %zmm18
|
|
1 4 0.50 vmulpd %zmm18, %zmm16, %zmm18
|
|
1 4 0.50 vmulpd %zmm18, %zmm16, %zmm18
|
|
1 4 0.50 vaddpd %zmm1, %zmm18, %zmm31
|
|
1 4 0.50 vmulpd %zmm16, %zmm22, %zmm16
|
|
1 4 0.50 vmulpd %zmm31, %zmm16, %zmm16
|
|
2 8 0.50 * vmovupd 464(%rsp), %zmm31
|
|
1 4 0.50 vsubpd %zmm28, %zmm31, %zmm31
|
|
1 1 0.50 shlb $5, %bpl
|
|
1 1 0.25 orb %al, %bpl
|
|
1 1 0.25 orb $-35, %bpl
|
|
1 1 1.00 kmovd %ebp, %k1
|
|
1 4 1.00 vcmpltpd %zmm0, %zmm3, %k1 {%k1}
|
|
2 8 0.50 * vmovupd 208(%rsp), %zmm3
|
|
1 4 0.50 vsubpd %zmm29, %zmm3, %zmm3
|
|
1 4 0.50 vmulpd %zmm16, %zmm18, %zmm16
|
|
1 4 0.50 vsubpd %zmm30, %zmm26, %zmm18
|
|
1 4 0.50 vmulpd %zmm2, %zmm16, %zmm16
|
|
1 4 0.50 vfmadd231pd %zmm16, %zmm19, %zmm15 {%k1}
|
|
1 4 0.50 vmulpd %zmm18, %zmm18, %zmm19
|
|
1 4 0.50 vfmadd231pd %zmm3, %zmm3, %zmm19
|
|
1 4 0.50 vfmadd231pd %zmm31, %zmm31, %zmm19
|
|
1 4 0.50 vfmadd231pd %zmm16, %zmm17, %zmm10 {%k1}
|
|
3 4 2.00 vrcp14pd %zmm19, %zmm17
|
|
1 4 0.50 vfmadd231pd %zmm16, %zmm20, %zmm6 {%k1}
|
|
1 4 0.50 vmulpd %zmm17, %zmm21, %zmm16
|
|
1 4 0.50 vmulpd %zmm16, %zmm17, %zmm16
|
|
1 4 0.50 vmulpd %zmm16, %zmm17, %zmm16
|
|
1 4 0.50 vaddpd %zmm1, %zmm16, %zmm20
|
|
1 4 0.50 vmulpd %zmm17, %zmm22, %zmm17
|
|
1 4 0.50 vmulpd %zmm20, %zmm17, %zmm17
|
|
1 4 0.50 vmulpd %zmm17, %zmm16, %zmm16
|
|
1 1 0.50 leal (,%rdx,4), %eax
|
|
1 1 0.50 shlb $6, %dil
|
|
1 1 0.25 orb %al, %dil
|
|
1 1 0.25 orb $-69, %dil
|
|
1 1 1.00 kmovd %edi, %k1
|
|
1 4 1.00 vcmpltpd %zmm0, %zmm19, %k1 {%k1}
|
|
2 8 0.50 * vmovupd 400(%rsp), %zmm17
|
|
1 4 0.50 vsubpd %zmm28, %zmm17, %zmm17
|
|
1 4 0.50 vsubpd %zmm29, %zmm23, %zmm19
|
|
1 4 0.50 vsubpd %zmm30, %zmm27, %zmm20
|
|
1 4 0.50 vmulpd %zmm2, %zmm16, %zmm16
|
|
1 4 0.50 vfmadd231pd %zmm16, %zmm31, %zmm13 {%k1}
|
|
1 4 0.50 vmulpd %zmm20, %zmm20, %zmm28
|
|
1 4 0.50 vfmadd231pd %zmm19, %zmm19, %zmm28
|
|
1 4 0.50 vfmadd231pd %zmm17, %zmm17, %zmm28
|
|
1 4 0.50 vfmadd231pd %zmm16, %zmm3, %zmm9 {%k1}
|
|
3 4 2.00 vrcp14pd %zmm28, %zmm3
|
|
1 4 0.50 vfmadd231pd %zmm16, %zmm18, %zmm5 {%k1}
|
|
1 4 0.50 vmulpd %zmm3, %zmm21, %zmm16
|
|
1 4 0.50 vmulpd %zmm16, %zmm3, %zmm16
|
|
1 4 0.50 vmulpd %zmm16, %zmm3, %zmm16
|
|
1 4 0.50 vaddpd %zmm1, %zmm16, %zmm18
|
|
1 4 0.50 vmulpd %zmm3, %zmm22, %zmm3
|
|
1 4 0.50 vmulpd %zmm18, %zmm3, %zmm3
|
|
1 4 0.50 vmulpd %zmm3, %zmm16, %zmm3
|
|
1 1 0.50 shlb $3, %dl
|
|
1 1 0.50 shlb $7, %cl
|
|
1 1 0.25 orb %dl, %cl
|
|
1 1 0.25 addb $-9, %cl
|
|
1 1 1.00 kmovd %ecx, %k1
|
|
1 4 1.00 vcmpltpd %zmm0, %zmm28, %k1 {%k1}
|
|
1 4 0.50 vmulpd %zmm2, %zmm3, %zmm3
|
|
1 4 0.50 vfmadd231pd %zmm3, %zmm17, %zmm12 {%k1}
|
|
1 4 0.50 vfmadd231pd %zmm3, %zmm19, %zmm8 {%k1}
|
|
1 4 0.50 vfmadd231pd %zmm3, %zmm20, %zmm4 {%k1}
|
|
1 1 0.25 incq %rbx
|
|
1 1 0.25 cmpq %rbx, %r9
|
|
1 1 0.50 jne .LBB5_12
|
|
|
|
|
|
Resources:
|
|
[0] - SKXDivider
|
|
[1] - SKXFPDivider
|
|
[2] - SKXPort0
|
|
[3] - SKXPort1
|
|
[4] - SKXPort2
|
|
[5] - SKXPort3
|
|
[6] - SKXPort4
|
|
[7] - SKXPort5
|
|
[8] - SKXPort6
|
|
[9] - SKXPort7
|
|
|
|
|
|
Resource pressure per iteration:
|
|
[0] [1] [2] [3] [4] [5] [6] [7] [8] [9]
|
|
- - 45.53 20.45 5.50 5.50 - 44.64 18.38 -
|
|
|
|
Resource pressure by instruction:
|
|
[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] Instructions:
|
|
- - - - 0.50 0.50 - - - - movslq (%r10,%rbx,4), %rcx
|
|
- - - 0.99 - - - 0.01 - - leaq (%rcx,%rcx,2), %rdx
|
|
- - 0.01 - - - - - 0.99 - shlq $6, %rdx
|
|
- - 0.01 0.99 0.49 0.51 - - - - vmovupd (%rsi,%rdx), %zmm28
|
|
- - 0.01 0.91 0.51 0.49 - 0.08 - - vmovupd 64(%rsi,%rdx), %zmm29
|
|
- - 0.01 0.56 0.49 0.51 - 0.43 - - vmovupd 128(%rsi,%rdx), %zmm30
|
|
- - - 0.99 0.50 0.50 - 0.01 - - vmovupd 16(%rsp), %zmm3
|
|
- - 0.95 - - - - 0.05 - - vsubpd %zmm28, %zmm3, %zmm3
|
|
- - 0.48 - - - - 0.52 - - vsubpd %zmm30, %zmm24, %zmm31
|
|
- - - 1.00 0.50 0.50 - - - - vmovupd 336(%rsp), %zmm16
|
|
- - 0.49 - - - - 0.51 - - vsubpd %zmm29, %zmm16, %zmm16
|
|
- - 0.48 - - - - 0.52 - - vmulpd %zmm31, %zmm31, %zmm17
|
|
- - 0.49 - - - - 0.51 - - vfmadd231pd %zmm16, %zmm16, %zmm17
|
|
- - 0.04 - - - - 0.96 - - vfmadd231pd %zmm3, %zmm3, %zmm17
|
|
- - 2.00 - - - - 1.00 - - vrcp14pd %zmm17, %zmm18
|
|
- - 1.00 - - - - - - - vmulpd %zmm18, %zmm21, %zmm19
|
|
- - 0.51 - - - - 0.49 - - vmulpd %zmm19, %zmm18, %zmm19
|
|
- - 0.49 - - - - 0.51 - - vmulpd %zmm19, %zmm18, %zmm19
|
|
- - 0.07 - - - - 0.93 - - vaddpd %zmm1, %zmm19, %zmm20
|
|
- - - - - - - 1.00 - - vmulpd %zmm18, %zmm22, %zmm18
|
|
- - 0.95 - - - - 0.05 - - vmulpd %zmm20, %zmm18, %zmm18
|
|
- - 0.92 - - - - 0.08 - - vsubpd %zmm30, %zmm25, %zmm20
|
|
- - - 0.94 - - - 0.06 - - leal (%rcx,%rcx), %edx
|
|
- - - - - - - - 1.00 - cmpq %rdx, %r11
|
|
- - - - - - - - 1.00 - setne %dl
|
|
- - 0.44 - - - - - 0.56 - sete %al
|
|
- - - 0.07 - - - 0.02 0.91 - addl %ecx, %ecx
|
|
- - - 0.53 - - - 0.46 0.01 - incl %ecx
|
|
- - - 0.51 - - - 0.46 0.03 - cmpq %rcx, %r11
|
|
- - 0.02 - - - - - 0.98 - sete %cl
|
|
- - 0.94 - - - - 0.06 - - vmulpd %zmm18, %zmm19, %zmm18
|
|
- - 0.01 0.99 0.51 0.49 - - - - vmovupd 528(%rsp), %zmm19
|
|
- - 0.47 - - - - 0.53 - - vsubpd %zmm28, %zmm19, %zmm19
|
|
- - 0.04 - - - - - 0.96 - setne %dil
|
|
- - - 0.95 - - - 0.02 0.03 - movl %edi, %ebp
|
|
- - 0.01 - - - - - 0.99 - shlb $4, %bpl
|
|
- - - 0.96 - - - - 0.04 - subb %al, %bpl
|
|
- - - 0.06 - - - - 0.94 - addb $-17, %bpl
|
|
- - - - - - - 1.00 - - kmovd %ebp, %k1
|
|
- - - - - - - 1.00 - - vcmpltpd %zmm0, %zmm17, %k1 {%k1}
|
|
- - 0.02 0.97 0.50 0.50 - 0.01 - - vmovupd 272(%rsp), %zmm17
|
|
- - 0.96 - - - - 0.04 - - vsubpd %zmm29, %zmm17, %zmm17
|
|
- - - 1.00 - - - - - - leal (%rdx,%rdx), %eax
|
|
- - - 0.05 - - - - 0.95 - movl %edi, %ebp
|
|
- - 0.51 - - - - 0.49 - - vmulpd %zmm2, %zmm18, %zmm18
|
|
- - 0.53 - - - - 0.47 - - vfmadd231pd %zmm18, %zmm3, %zmm14 {%k1}
|
|
- - 0.45 - - - - 0.55 - - vmulpd %zmm20, %zmm20, %zmm3
|
|
- - 0.94 - - - - 0.06 - - vfmadd231pd %zmm17, %zmm17, %zmm3
|
|
- - 0.03 - - - - 0.97 - - vfmadd231pd %zmm19, %zmm19, %zmm3
|
|
- - 0.47 - - - - 0.53 - - vfmadd231pd %zmm18, %zmm16, %zmm11 {%k1}
|
|
- - 2.00 - - - - 1.00 - - vrcp14pd %zmm3, %zmm16
|
|
- - 0.53 - - - - 0.47 - - vfmadd231pd %zmm18, %zmm31, %zmm7 {%k1}
|
|
- - 0.99 - - - - 0.01 - - vmulpd %zmm16, %zmm21, %zmm18
|
|
- - 0.99 - - - - 0.01 - - vmulpd %zmm18, %zmm16, %zmm18
|
|
- - 0.97 - - - - 0.03 - - vmulpd %zmm18, %zmm16, %zmm18
|
|
- - 0.52 - - - - 0.48 - - vaddpd %zmm1, %zmm18, %zmm31
|
|
- - 0.01 - - - - 0.99 - - vmulpd %zmm16, %zmm22, %zmm16
|
|
- - 0.52 - - - - 0.48 - - vmulpd %zmm31, %zmm16, %zmm16
|
|
- - - 0.99 0.50 0.50 - 0.01 - - vmovupd 464(%rsp), %zmm31
|
|
- - 0.03 - - - - 0.97 - - vsubpd %zmm28, %zmm31, %zmm31
|
|
- - 0.01 - - - - - 0.99 - shlb $5, %bpl
|
|
- - - 0.94 - - - - 0.06 - orb %al, %bpl
|
|
- - - 0.04 - - - - 0.96 - orb $-35, %bpl
|
|
- - - - - - - 1.00 - - kmovd %ebp, %k1
|
|
- - - - - - - 1.00 - - vcmpltpd %zmm0, %zmm3, %k1 {%k1}
|
|
- - - 0.99 0.50 0.50 - 0.01 - - vmovupd 208(%rsp), %zmm3
|
|
- - 0.95 - - - - 0.05 - - vsubpd %zmm29, %zmm3, %zmm3
|
|
- - 0.51 - - - - 0.49 - - vmulpd %zmm16, %zmm18, %zmm16
|
|
- - 0.01 - - - - 0.99 - - vsubpd %zmm30, %zmm26, %zmm18
|
|
- - 0.52 - - - - 0.48 - - vmulpd %zmm2, %zmm16, %zmm16
|
|
- - 1.00 - - - - - - - vfmadd231pd %zmm16, %zmm19, %zmm15 {%k1}
|
|
- - 0.03 - - - - 0.97 - - vmulpd %zmm18, %zmm18, %zmm19
|
|
- - 0.06 - - - - 0.94 - - vfmadd231pd %zmm3, %zmm3, %zmm19
|
|
- - 0.50 - - - - 0.50 - - vfmadd231pd %zmm31, %zmm31, %zmm19
|
|
- - - - - - - 1.00 - - vfmadd231pd %zmm16, %zmm17, %zmm10 {%k1}
|
|
- - 2.00 - - - - 1.00 - - vrcp14pd %zmm19, %zmm17
|
|
- - 1.00 - - - - - - - vfmadd231pd %zmm16, %zmm20, %zmm6 {%k1}
|
|
- - 0.07 - - - - 0.93 - - vmulpd %zmm17, %zmm21, %zmm16
|
|
- - 0.50 - - - - 0.50 - - vmulpd %zmm16, %zmm17, %zmm16
|
|
- - 0.09 - - - - 0.91 - - vmulpd %zmm16, %zmm17, %zmm16
|
|
- - 0.07 - - - - 0.93 - - vaddpd %zmm1, %zmm16, %zmm20
|
|
- - 0.93 - - - - 0.07 - - vmulpd %zmm17, %zmm22, %zmm17
|
|
- - 0.94 - - - - 0.06 - - vmulpd %zmm20, %zmm17, %zmm17
|
|
- - 0.51 - - - - 0.49 - - vmulpd %zmm17, %zmm16, %zmm16
|
|
- - - 1.00 - - - - - - leal (,%rdx,4), %eax
|
|
- - - - - - - - 1.00 - shlb $6, %dil
|
|
- - - 0.02 - - - - 0.98 - orb %al, %dil
|
|
- - - 0.48 - - - - 0.52 - orb $-69, %dil
|
|
- - - - - - - 1.00 - - kmovd %edi, %k1
|
|
- - - - - - - 1.00 - - vcmpltpd %zmm0, %zmm19, %k1 {%k1}
|
|
- - - 1.00 0.50 0.50 - - - - vmovupd 400(%rsp), %zmm17
|
|
- - 0.49 - - - - 0.51 - - vsubpd %zmm28, %zmm17, %zmm17
|
|
- - 0.49 - - - - 0.51 - - vsubpd %zmm29, %zmm23, %zmm19
|
|
- - 0.02 - - - - 0.98 - - vsubpd %zmm30, %zmm27, %zmm20
|
|
- - 0.98 - - - - 0.02 - - vmulpd %zmm2, %zmm16, %zmm16
|
|
- - 0.50 - - - - 0.50 - - vfmadd231pd %zmm16, %zmm31, %zmm13 {%k1}
|
|
- - 0.94 - - - - 0.06 - - vmulpd %zmm20, %zmm20, %zmm28
|
|
- - 0.04 - - - - 0.96 - - vfmadd231pd %zmm19, %zmm19, %zmm28
|
|
- - 0.07 - - - - 0.93 - - vfmadd231pd %zmm17, %zmm17, %zmm28
|
|
- - 0.50 - - - - 0.50 - - vfmadd231pd %zmm16, %zmm3, %zmm9 {%k1}
|
|
- - 2.00 - - - - 1.00 - - vrcp14pd %zmm28, %zmm3
|
|
- - 0.50 - - - - 0.50 - - vfmadd231pd %zmm16, %zmm18, %zmm5 {%k1}
|
|
- - 1.00 - - - - - - - vmulpd %zmm3, %zmm21, %zmm16
|
|
- - 0.55 - - - - 0.45 - - vmulpd %zmm16, %zmm3, %zmm16
|
|
- - 0.99 - - - - 0.01 - - vmulpd %zmm16, %zmm3, %zmm16
|
|
- - 0.99 - - - - 0.01 - - vaddpd %zmm1, %zmm16, %zmm18
|
|
- - - - - - - 1.00 - - vmulpd %zmm3, %zmm22, %zmm3
|
|
- - 0.52 - - - - 0.48 - - vmulpd %zmm18, %zmm3, %zmm3
|
|
- - 0.99 - - - - 0.01 - - vmulpd %zmm3, %zmm16, %zmm3
|
|
- - - - - - - - 1.00 - shlb $3, %dl
|
|
- - - - - - - - 1.00 - shlb $7, %cl
|
|
- - - 1.00 - - - - - - orb %dl, %cl
|
|
- - - 0.52 - - - - 0.48 - addb $-9, %cl
|
|
- - - - - - - 1.00 - - kmovd %ecx, %k1
|
|
- - - - - - - 1.00 - - vcmpltpd %zmm0, %zmm28, %k1 {%k1}
|
|
- - 0.98 - - - - 0.02 - - vmulpd %zmm2, %zmm3, %zmm3
|
|
- - 0.97 - - - - 0.03 - - vfmadd231pd %zmm3, %zmm17, %zmm12 {%k1}
|
|
- - 0.03 - - - - 0.97 - - vfmadd231pd %zmm3, %zmm19, %zmm8 {%k1}
|
|
- - 0.97 - - - - 0.03 - - vfmadd231pd %zmm3, %zmm20, %zmm4 {%k1}
|
|
- - - 0.48 - - - - 0.52 - incq %rbx
|
|
- - - 0.52 - - - - 0.48 - cmpq %rbx, %r9
|
|
- - - - - - - - 1.00 - jne .LBB5_12
|