<html>
<br>
[ We apologise for the duplicate posting of this announcement ] <br>
<br>
*********************************************************************************************************************************************************<br>
<div align="center">
ELRA <br>
European Language Resources Association <br>
ELRA News <br>
</div>
*********************************************************************************************************************************************************<br>
<div align="center">
We are happy to announce new resources available via ELRA in the
framework of the Aurora project.<br>
<br>
</div>
 *** AURORA PROJECT DATABASE ***<br>
<br>
[ELRA is releasing  5 databases made within the ETSI STQ-AURORA DSR
working group.]<br>
<br>
AURORA PROJECT DATABASE 2.0<br>
<br>
The Aurora project is releasing a revised version of the Noisy TI digits
database to follow on the work of ETSI. This CD set is a replacement for
the previous set (version 1.0 consisted of 2 CDs while version 2.0 now
consists of 4 CDs) .<br>
This database is intended for the evaluation of algorithms for front-end
feature extraction algorithms in background<br>
noise but may also be used more widely by speech researchers to evaluate
and compare the performance of <br>
noise robust speech recognition algorithms.<br>
<br>
Compared to version 1.0 the changes are as follows:<br>
 <br>
1) The files are restored to the energy level of the original speech
<br>
in the TI digits database. <br>
2) One of the noise types added to the speech has been changed <br>
(the babble one) <br>
3) There is an additional test sets where the noises are mismatched<br>
to those used in the training set. <br>
4) There is a convolutional distortion test. <br>
5) There is a clean training set<br>
The CD ROM will be used for the next round of ETSI Aurora standards
<br>
evaluation.<br>
<br>
AURORA PROJECT DATABASE 3.0- SUBSET OF SPEECHDAT-CAR FINNISH
DATABASE<br>
<br>
This database is a subset of the SpeechDat-Car database in Finnish
language which has been collected as part of the European Union funded
SpeechDat-Car project. It contains isolated and connected Finnish digits
spoken in the following driving conditions inside a car:<br>
1. 0 km/hr with the car engine on <br>
2. 40-60 km/hr with the car windows closed <br>
3. 40-60 km/hr with the car windows open <br>
4. 100-120km/hr with no music in the background <br>
5. 100-120km/hr with music in the background<br>
The database also contains the software needed to run simulations <br>
using the Entropic's HTK, which has been adopted as the
"standard" <br>
HMM recogniser for the Aurora standard evaluation.<br>
<br>
AURORA PROJECT DATABASE 3.0- SUBSET OF SPEECHDAT-CAR DANISH DATABASE
<br>
<br>
The Aurora project was originally set up to establish a world wide
standard for the feature extraction software which forms the core of the
front-end of a DSR (Distributed Speech Recognition) system. ETSI formally
adopted this activity as work items 007 and 008.The two work items within
ETSI are:<br>
<font face="Times New Roman, Times">-<x-tab>       </x-tab></font>ETSI
DES/STQ WI007: Distributed Speech Recognition - Front-End Feature
Extraction Algorithm & Compression Algorithm<br>
<font face="Times New Roman, Times">-<x-tab>       </x-tab></font>ETSI
DES/STQ WI008: Distributed Speech Recognition - Advanced Feature
Extraction Algorithm. <br>
<br>
This database is a subset of the SpeechDat-Car database in Danish
language which has been collected as part of the European Union funded
SpeechDat-Car project. It contains isolated and connected Danish digits
spoken in the following noise and driving conditions inside a car:<br>
<br>
<font face="Times New Roman, Times">1.<x-tab>      </x-tab></font>High
speed good road<br>
<font face="Times New Roman, Times">2.<x-tab>      </x-tab></font>Low
speed rough road<br>
<font face="Times New Roman, Times">3.<x-tab>      </x-tab></font>Stopped
with motor running<br>
<font face="Times New Roman, Times">4.<x-tab>      </x-tab></font>Town
traffic<br>
<br>
AURORA PROJECT DATABASE 3.0- SUBSET OF SPEECHDAT-CAR GERMAN DATABASE
<br>
<br>
The Aurora project was originally set up to establish a world wide
standard for the feature extraction software which forms the core of the
front-end of a DSR (Distributed Speech Recognition) system. ETSI formally
adopted this activity as work items 007 and 008.The two work items within
ETSI are:<br>
<font face="Times New Roman, Times">-<x-tab>       </x-tab></font>ETSI
DES/STQ WI007: Distributed Speech Recognition - Front-End Feature
Extraction Algorithm & Compression Algorithm<br>
<font face="Times New Roman, Times">-<x-tab>       </x-tab></font>ETSI
DES/STQ WI008: Distributed Speech Recognition - Advanced Feature
Extraction Algorithm. <br>
<br>
This database is a subset of the SpeechDat-Car database in German
language which has been collected as part of the European Union funded
SpeechDat-Car project. It contains isolated and connected German digits
spoken in the following noise and driving conditions inside a car:<br>
<br>
<font face="Times New Roman, Times">5.<x-tab>      </x-tab></font>High
speed good road<br>
<font face="Times New Roman, Times">6.<x-tab>      </x-tab></font>Low
speed rough road<br>
<font face="Times New Roman, Times">7.<x-tab>      </x-tab></font>Stopped
with motor running<br>
<font face="Times New Roman, Times">8.<x-tab>      </x-tab></font>Town
traffic<br>
<br>
AURORA PROJECT DATABASE 3.0- SUBSET OF SPEECHDAT-CAR SPANISHDATABASE
<br>
<br>
The Aurora project was originally set up to establish a world wide
standard for the feature extraction software which forms the core of the
front-end of a DSR (Distributed Speech Recognition) system. ETSI formally
adopted this activity as work items 007 and 008.The two work items within
ETSI are:<br>
<font face="Times New Roman, Times">-<x-tab>       </x-tab></font>ETSI
DES/STQ WI007: Distributed Speech Recognition - Front-End Feature
Extraction Algorithm & Compression Algorithm<br>
<font face="Times New Roman, Times">-<x-tab>       </x-tab></font>ETSI
DES/STQ WI008: Distributed Speech Recognition - Advanced Feature
Extraction Algorithm. <br>
<br>
This database is a subset of the SpeechDat-Car database in Spanish
language which has been collected as part of the European Union funded
SpeechDat-Car project. It contains isolated and connected Spanish digits
spoken in the following noise and driving conditions inside a car:<br>
<br>
<font face="Times New Roman, Times">1.<x-tab>      </x-tab></font>Quiet
environment. Stop motor running.<br>
<font face="Times New Roman, Times">2.<x-tab>      </x-tab></font>Low
noise. Town traffic + low speed rough road.<br>
<font face="Times New Roman, Times">3.<x-tab>      </x-tab></font>High
noise: High speed good road.<br>
</html>