Eksperymenty z prozodią: Synteza mowy - program MBROLA
Anotacja mowy ciągłej - program Transcriber>
- Sejm.zip
- dialog.wav
- Zapis w postaci ortograficznej zgodnie z zasadami j. polskiego tego, co zostało wypowiedziane w nagraniu.
Podział wypowiedzi na frazy.
Jednostki całkowicie niezrozumiałe lub błędnie wypowiedziane oznaczone symbolami ** lub *wyraz.
Jednostki w obcym języku oznaczamy [for=DE], [for=EN], itd.
Pauzy wypełnione oznaczone [fil=y], [fil=e], itd - Anotacja szumów
a) dźwięki pochodzące od mówcy (związane bezpośrednio z produkcją mowy, np. mlaski, szum artykulacyjny), odgłosy bezwarunkowe (np. odgłosy jęków, westchnień, chrząkania, głośny oddech, kaszel, śmiech). 4 podkategorie spk (speaker noise): [spk=Breath] – oddech, pociąganie nosem; [spk=Click] – mlaśnięcie; [spk=Laugh] – śmiech; [spk=Throat] – kaszel, chrząkanie; [spk] - inne
b) dźwięki pochodzące od innego mówcy/mówców (np. mowa, płacz, krzyk, śmiech) – [spk], [int] (intrusive noise, krótkie zakłócenie) lub [sta] (stationary noise, zakłócenie ciągłe, trwające minimum kilka sekund)
c) akustyka tła (np. pogłos), odgłosy środowiska pochodzące z różnych miejsc (np. ulica, szkoła, biuro, pojazd) – [sta] lub [mint] (multi-int) lub [muz] (muzyka)
d) inne: również takie, jak np. odgłosy czynności i dźwięki od urządzeń technicznych (np. rozbijanie szkła, dźwięk telefonu, wybuchu), dźwięki muzyki, odgłosy natury (np. zwierząt, wiatru, deszczu) – stosujemy oznaczenia [int] lub [mint] lub [sta] lub [muz]