Warsztaty z zakresu analizy prozodycznej, Uniwersytet Warszawski, 2015-02-06

Eksperymenty z prozodią: Synteza mowy - program MBROLA

 1. Start z Mbrolą
 2. głos pl2
 3. MBROLI.zip
 4. Mowa_ekspresywna.zip

Anotacja mowy ciągłej - program Transcriber

 1. Sejm.zip
 2. dialog.wav
 3. Zapis w postaci ortograficznej zgodnie z zasadami j. polskiego tego, co zostało wypowiedziane w nagraniu.
  Podział wypowiedzi na frazy.
  Jednostki całkowicie niezrozumiałe lub błędnie wypowiedziane oznaczone symbolami ** lub *wyraz.
  Jednostki w obcym języku oznaczamy [for=DE], [for=EN], itd.
  Pauzy wypełnione oznaczone [fil=y], [fil=e], itd
 4. Anotacja szumów
  a) dźwięki pochodzące od mówcy (związane bezpośrednio z produkcją mowy, np. mlaski, szum artykulacyjny), odgłosy bezwarunkowe (np. odgłosy jęków, westchnień, chrząkania, głośny oddech, kaszel, śmiech). 4 podkategorie spk (speaker noise): [spk=Breath] – oddech, pociąganie nosem; [spk=Click] – mlaśnięcie; [spk=Laugh] – śmiech; [spk=Throat] – kaszel, chrząkanie; [spk] - inne
  b) dźwięki pochodzące od innego mówcy/mówców (np. mowa, płacz, krzyk, śmiech) – [spk], [int] (intrusive noise, krótkie zakłócenie) lub [sta] (stationary noise, zakłócenie ciągłe, trwające minimum kilka sekund)
  c) akustyka tła (np. pogłos), odgłosy środowiska pochodzące z różnych miejsc (np. ulica, szkoła, biuro, pojazd) – [sta] lub [mint] (multi-int) lub [muz] (muzyka)
  d) inne: również takie, jak np. odgłosy czynności i dźwięki od urządzeń technicznych (np. rozbijanie szkła, dźwięk telefonu, wybuchu), dźwięki muzyki, odgłosy natury (np. zwierząt, wiatru, deszczu) – stosujemy oznaczenia [int] lub [mint] lub [sta] lub [muz]