<html><body><div style="color:#000; background-color:#fff; font-family:times new roman, new york, times, serif;font-size:12pt">Hi, <br><br>I have a bunch of mp3s which are conference call recordings. They usually start with some background music, then human voice and then music or silence again. <br>I know that speex supports voice activity detection to encode better. <br>Is there any way I can use this to mark the beginning and end of voice activity in the file?<br><br>If it cannot work on mp3, would it work on raw sound input or any other formats?<br><br>Regds<br>Madhu<br></div></body></html>