http://gcc.gnu.org/bugzilla/show_bug.cgi?id=49362
--- Comment #2 from mark.pupilli at dyson dot com 2011-06-13 19:56:43 UTC --- The vld2q version should actually be 15 instructions (not 17!) as follows: vld2.32 {d20-d23}, [r0] vld2.32 {d26-d29}, [r1] veor q12, q11, q14 veor q3, q10, q13 vcnt.8 q8, q3 vcnt.8 q2, q12 vadd.i8 q1, q2, q8 vpaddl.u8 q9, q1 vpaddl.u16 q9, q9 vorr d0, d18, d18 vorr d18, d19, d19 vpadd.i32 d16, d18, d0 vpadd.i32 d16, d16, d16 vmov.32 r0, d16[0] bx lr