<div dir="ltr">Hi,<div><br></div><div>Attached are 5 patches related to celt_inner_prod() and dual_inner_prod() NEON intrinsics optimization.</div><div><br></div><div>In 0004-Optimize-floating-point-celt_inner_prod-and-dual_inn.patch, the optimization changed the order of floating-point inner products, which will change the results. I created celt_inner_prod_neon_float_c_simulation() and dual_inner_prod_neon_float_c_simulation() to simulate the order floating-point operations in NEON optimization and compare their results. Sorry that I cannot bond the distance between original C function and NEON function to any giving reasonable small number or ratio. It's easy to create an input which 0 and 1,000 are both correct results by just manipulating the inner product order.</div><div><br></div><div>The total speed gain is about 1.0% for fixed-point encoder, and 1.8% for floating-point encoder, in Complexity 8, tested on my Chromebook.</div><div><br></div><div>Thanks,</div><div>Linfeng</div></div>