https://gcc.gnu.org/bugzilla/show_bug.cgi?id=99634
--- Comment #2 from Jan Hubicka <hubicka at gcc dot gnu.org> --- AOCC produced code is: .LBB0_2: # %vector.body # Parent Loop BB0_1 Depth=1 # => This Inner Loop Header: Depth=2 vpbroadcastq %rdx, %zmm4 kxnorw %k0, %k0, %k1 incq %rdx vpsllq $2, %zmm4, %zmm4 vpaddq %zmm4, %zmm0, %zmm4 vpaddq %zmm7, %zmm4, %zmm5 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq .LCPI0_0(%rip), %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq .LCPI0_3(%rip), %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq .LCPI0_2(%rip), %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm11, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq .LCPI0_4(%rip), %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm13, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm12, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm15, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm14, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm17, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm16, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm19, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm18, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm21, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm20, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm23, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm22, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm25, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm24, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm27, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm26, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm29, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm28, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm31, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm30, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm2, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm1, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm8, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm6, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm5) {%k1} vpaddq %zmm10, %zmm4, %zmm5 kxnorw %k0, %k0, %k1 vpaddq %zmm9, %zmm4, %zmm4 vscatterqps %ymm3, (,%zmm5) {%k1} kxnorw %k0, %k0, %k1 vscatterqps %ymm3, (,%zmm4) {%k1} movl $1065353216, (%rcx) # imm = 0x3F800000 addq $1028, %rcx # imm = 0x404 cmpq $256, %rdx # imm = 0x100 jne .LBB0_2 # %bb.3: # %for.cond.cleanup3