<div dir="ltr">Yes we'll have one more patch set related to xcorr in next week. Please don't wait if it's too late for 1.2 release.<div><br></div><div>Thanks,</div><div>Linfeng</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Jun 5, 2017 at 12:28 PM, Linfeng Zhang <span dir="ltr"><<a href="mailto:linfengz@google.com" target="_blank">linfengz@google.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Hi Jean-Marc,<div><br></div><div>I attached the new version in inner_prod_5patches_v2.zip which synced to the current master.</div><div><br></div><div>For fixed-point ARM, only 0003-Optimize-fixed-point-celt<wbr>_inner_prod-and-dual_inner_.pa<wbr>tch changes the performance.</div><div>For floating-point ARM, only 0004-Optimize-floating-point-c<a href="http://elt_inner_prod-and-dual_inn.pa" target="_blank"><wbr>elt_inner_prod-and-dual_inn.pa</a><wbr>tch changes the performance.</div><div>Patch 1 and 2 are code clean-up and can only affect x86 performance.</div><div>Patch 5 has neglectable effect on floating-point ARM performance.</div><div><br></div><div>Thanks,</div><div>Linfeng</div></div><div class="HOEnZb"><div class="h5"><div class="gmail_extra"><br><div class="gmail_quote">On Fri, Jun 2, 2017 at 11:26 AM, Jean-Marc Valin <span dir="ltr"><<a href="mailto:jmvalin@jmvalin.ca" target="_blank">jmvalin@jmvalin.ca</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Linfeng,<br>
<br>
I'll look into your patches. Can you let me know what's the expected<br>
effect on performance (if any) for each of your patches? Also, are these<br>
all the patches you intend to merge for 1.2 or are there more upcoming ones?<br>
<br>
Cheers,<br>
<br>
        Jean-Marc<br>
<div><div class="m_-9115801896269909919h5"><br>
On 01/06/17 06:33 PM, Linfeng Zhang wrote:<br>
> Hi,<br>
><br>
> Attached are 5 patches related to celt_inner_prod()<br>
> and dual_inner_prod() NEON intrinsics optimization.<br>
><br>
> In 0004-Optimize-floating-point-c<wbr><a href="http://elt_inner_prod-and-dual_inn.pa">elt_inner_prod-and-dual_inn.pa</a><wbr>tch, the<br>
> optimization changed the order of floating-point inner products, which<br>
> will change the results. I<br>
> created celt_inner_prod_neon_float_c_s<wbr>imulation()<br>
> and dual_inner_prod_neon_float_c_s<wbr>imulation() to simulate the order<br>
> floating-point operations in NEON optimization and compare their<br>
> results. Sorry that I cannot bond the distance between original C<br>
> function and NEON function to any giving reasonable small number or<br>
> ratio. It's easy to create an input which 0 and 1,000 are both correct<br>
> results by just manipulating the inner product order.<br>
><br>
> The total speed gain is about 1.0% for fixed-point encoder, and 1.8% for<br>
> floating-point encoder, in Complexity 8, tested on my Chromebook.<br>
><br>
> Thanks,<br>
> Linfeng<br>
><br>
><br>
</div></div>> ______________________________<wbr>_________________<br>
> opus mailing list<br>
> <a href="mailto:opus@xiph.org" target="_blank">opus@xiph.org</a><br>
> <a href="http://lists.xiph.org/mailman/listinfo/opus" rel="noreferrer" target="_blank">http://lists.xiph.org/mailman/<wbr>listinfo/opus</a><br>
><br>
</blockquote></div><br></div>
</div></div></blockquote></div><br></div>