<div>Ok. Will look out for alloca().<br></div><div>cheers</div><div class="gmail_quote"></div><div class="gmail_quote"><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">If you define _USE_SSE, CELT is already able to use SSE instructions. You must<br>
be careful on Windows though because it doesn&#39;t support C99 var-arrays and<br>
alloca() isn&#39;t properly aligned for SSE, so you have to make sure that alloca()<br>
isn&#39;t used.<br>
<div class="im"><br>
&gt; 2) To maybe learn from someone with previous experience in optimizing Speex<br>
&gt; for moderns x86 architectures before I set off trying all kinds of things on<br>
&gt; my own.<br>
<br>
</div>Can&#39;t think of anything else you need to know.<br>
<font color="#888888"><br>
   Jean-Marc<br>
</font><div><div class="h5"><br>
&gt;<br>
&gt; See answers inline:<br>
&gt; 2009/6/15 Tom Grandgent &lt;<a href="mailto:tom@grandgent.com">tom@grandgent.com</a>&gt;<br>
&gt;<br>
&gt; &gt; Why haven&#39;t you tried using release build with compiler optimizations?<br>
&gt;<br>
&gt; I just haven&#39;t started with optimizing... yet.<br>
&gt;<br>
&gt;<br>
&gt; &gt;<br>
&gt; &gt; It&#39;s quite possible that the performance picture could be substantially<br>
&gt; &gt; different.  You might end up wasting a lot of time if you do much<br>
&gt; &gt; performance analysis or optimization on a debug build.<br>
&gt;<br>
&gt; Yes, you are right and that is not what I&#39;m doing.<br>
&gt;<br>
&gt;<br>
&gt; &gt; Debug build<br>
&gt; &gt; not only has no optimization - it also has extra checks that may have a<br>
&gt; &gt; significant performance impact depending on the code.<br>
&gt;<br>
&gt; Possibly, but I have identified the most expensive functions. They are all<br>
&gt; from the Speex dll. I believe these will remain the most interesting ones<br>
&gt; also in release build with some O-flags.<br>
&gt; Someone who is knowledgeable in these functions might know if their impact<br>
&gt; can be reduced and what the best practices are.<br>
&gt;<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; If you want to profile with symbols, you know you can compile a release<br>
&gt; &gt; build with symbols, right?  The CodeAnalyst documentation describes<br>
&gt; &gt; how to do that with Visual Studio.  (I&#39;ve done it.)<br>
&gt;<br>
&gt; Ok. thx.<br>
&gt;<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; Tom<br>
&gt; &gt;<br>
&gt; &gt; Greger Burman &lt;<a href="mailto:greger@mobile-robotics.com">greger@mobile-robotics.com</a>&gt; wrote:<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; I have a question about the overall performance of Speex and what I can<br>
&gt; &gt; do<br>
&gt; &gt; &gt; to improve it. I&#39;m running Speex Windows x86, Visual C++ EE compiler. I<br>
&gt; &gt; will<br>
&gt; &gt; &gt; say right away that I&#39;ve only compiled debug so far and used no compiler<br>
&gt; &gt; &gt; optimizations at all.<br>
&gt; &gt; &gt; I use the uwb-mode, preprocessing, denoising and echo cancellation.<br>
&gt; &gt; &gt; I&#39;ve noticed that speex consumes a lot of cpu resources. When I run this<br>
&gt; &gt; on<br>
&gt; &gt; &gt; a Celeron 2,6GHz I have to disable EC in order to not overload the cpu.<br>
&gt; &gt; Am I<br>
&gt; &gt; &gt; correct to assume that there are massive floating point calculations<br>
&gt; &gt; &gt; happening?<br>
&gt; &gt; &gt; I did a quick profile with CodeAnalyst and identified the most expensive<br>
&gt; &gt; &gt; functions as (in order):<br>
&gt; &gt; &gt; CPU Clocks, Function<br>
&gt; &gt; &gt; 4657, kiss_fft_stride<br>
&gt; &gt; &gt; 4456, speex_echo_cancellation<br>
&gt; &gt; &gt; 2494, split_cb_search_shape_sign<br>
&gt; &gt; &gt; 1490, fir_mem16<br>
&gt; &gt; &gt; 1419, speex_preprocess_run<br>
&gt; &gt; &gt; I&#39;m looking for advise on how to boost the performance with as little<br>
&gt; &gt; code<br>
&gt; &gt; &gt; rewrite as possible. The architecture for release build will be SSE/SSE2<br>
&gt; &gt; &gt; capable.<br>
&gt; &gt; &gt; 1) Compiler optimizations: Recommended options?<br>
&gt; &gt; &gt; 2) SIMD. Is Speex written to take advantage of SIMD architectures? What<br>
&gt; &gt; must<br>
&gt; &gt; &gt; I do to take advantage of this?<br>
&gt; &gt; &gt; --<br>
&gt; &gt; &gt; Greger Burman<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt;<br>
<br>
<br>
<br></div></div></blockquote></div>