http://gcc.gnu.org/bugzilla/show_bug.cgi?id=49362
--- Comment #2 from mark.pupilli at dyson dot com 2011-06-13 19:56:43 UTC ---
The vld2q version should actually be 15 instructions (not 17!) as follows:
vld2.32 {d20-d23}, [r0]
vld2.32 {d26-d29}, [r1]
veor q12, q11, q14
veor q3, q10, q13
vcnt.8 q8, q3
vcnt.8 q2, q12
vadd.i8 q1, q2, q8
vpaddl.u8 q9, q1
vpaddl.u16 q9, q9
vorr d0, d18, d18
vorr d18, d19, d19
vpadd.i32 d16, d18, d0
vpadd.i32 d16, d16, d16
vmov.32 r0, d16[0]
bx lr
