<p></p>
<p>I've been using the Penn forced alignment tool (<a href="http://www.ling.upenn.edu/phonetics/">http://www.ling.upenn.edu/phonetics/</a>) for aligning individual words. This is for English, but it would be adaptable to other languages assuming there was data on phonetic structures. (I actually have this for Bardi but haven't had the time to try to implement the program for Bardi yet.) </p>

<p>It's free, and at least for the English stuff I've been doing, has been producing very good results.</p><p>Claire</p>
<p>On Apr 9, 2011 5:24 AM, "Doug Cooper" <<a href="mailto:doug.cooper.thailand@gmail.com" target="_blank">doug.cooper.thailand@gmail.com</a>> wrote:<br type="attribution">> Hi, Nick:<br>> We made extensive use of Lipsync  (working with Russian).  Performance<br>


> was extremely good on reasonably clean input, and fell off on very noisy<br>> recordings, musical interludes, and (of course) inaccurate transcription.<br>> <a href="http://www.annosoft.com/lipsync-tool" target="_blank">http://www.annosoft.com/lipsync-tool</a><br>


> The desktop tool is US$500 (that's about $79.99 Aussie); there's also an<br>> SDK.  I think they have save-disabled and 30-day trial versions available<br>> for demo.   Their xml input and output formats were easy to modify.<br>


> <br>>    I had some correspondence with the brains behind the operation; he was<br>> friendly and quick to respond.  I've attached part of one note, below.<br>> <br>>     A fundamental issue with audio alignment is that it is not robust in the<br>


> way that, say, even bad OCR is.  Once sync is lost, it's difficult to recover<br>> automatically.  The workaround is to embed breakpoints -- not terribly<br>> difficult, but it does require a human sitting at a computer for long hours.<br>


> <br>>     Good luck,<br>>     Doug<br>> <br>> Mark Zartler <<a href="mailto:mzartler@annosoft.com" target="_blank">mzartler@annosoft.com</a>>  wrote:<br>>  > I've tried a couple of times to implement a speech/music/noise discriminator,<br>


>  > but have a come up with lackluster results. It's a high value feature for us,<br>>  > but it has been an elusive thing.<br>> [snip]<br>>> We have a few processes to develop new languages. If we have access to a<br>


>  > pronunciation dictionary, we can crunch a letter to sound system, using<br>>  > methods by Dr Alan Black in his paper (Issues building General Letter To<br>>  > Sound Rules).<br>> [snip]<br>>  > I'd be happy to do some research into your needed languages to get a feel<br>


>  > for the difficulties in each of them. I enjoy this work.<br>> <br>> <br>> <br>> <br>> On 4/9/2011 2:33 PM, Nick Thieberger wrote:<br>>> Has anyone had experience of software that takes a textual transcript<br>


>> and aligns it with the media it transcribes? I know it exists for<br>>> major languages but have not seen it working and do not know of the<br>>> software. It would be interesting to know how applicable it could be<br>


>> to the many hours of (handwritten/typed) transcripts of recordings we<br>>> have in the PARADISEC collection.<br>>><br>>> Thanks,<br>>><br>>> Nick<br>>><br></p>