Warsztaty z zakresu analizy prozodycznej, Uniwersytet Warszawski, 2015-02-06

Eksperymenty z prozodią: Synteza mowy - program MBROLA

  1. Start z Mbrolą
  2. głos pl2
  3. MBROLI.zip
  4. Mowa_ekspresywna.zip

Anotacja mowy ciągłej - program Transcriber

  1. Sejm.zip
  2. dialog.wav
  3. Zapis w postaci ortograficznej zgodnie z zasadami j. polskiego tego, co zostało wypowiedziane w nagraniu.
    Podział wypowiedzi na frazy.
    Jednostki całkowicie niezrozumiałe lub błędnie wypowiedziane oznaczone symbolami ** lub *wyraz.
    Jednostki w obcym języku oznaczamy [for=DE], [for=EN], itd.
    Pauzy wypełnione oznaczone [fil=y], [fil=e], itd
  4. Anotacja szumów
    a) dźwięki pochodzące od mówcy (związane bezpośrednio z produkcją mowy, np. mlaski, szum artykulacyjny), odgłosy bezwarunkowe (np. odgłosy jęków, westchnień, chrząkania, głośny oddech, kaszel, śmiech). 4 podkategorie spk (speaker noise): [spk=Breath] – oddech, pociąganie nosem; [spk=Click] – mlaśnięcie; [spk=Laugh] – śmiech; [spk=Throat] – kaszel, chrząkanie; [spk] - inne
    b) dźwięki pochodzące od innego mówcy/mówców (np. mowa, płacz, krzyk, śmiech) – [spk], [int] (intrusive noise, krótkie zakłócenie) lub [sta] (stationary noise, zakłócenie ciągłe, trwające minimum kilka sekund)
    c) akustyka tła (np. pogłos), odgłosy środowiska pochodzące z różnych miejsc (np. ulica, szkoła, biuro, pojazd) – [sta] lub [mint] (multi-int) lub [muz] (muzyka)
    d) inne: również takie, jak np. odgłosy czynności i dźwięki od urządzeń technicznych (np. rozbijanie szkła, dźwięk telefonu, wybuchu), dźwięki muzyki, odgłosy natury (np. zwierząt, wiatru, deszczu) – stosujemy oznaczenia [int] lub [mint] lub [sta] lub [muz]