Baza Mazak

W ostatnich latach badacze zajmujący się percepcją oraz syntezą mowy stworzyli szereg baz danych. Zazwyczaj zawierają one czytane przez mówców listy wyrazów lub zdań, np. bazy dotyczące amerykańskiej odmiany języka angielskiego “Easy-Hard” Word Multi-Talker Speech Database (Torretta 1995), TIMIT Acoustic-Phonetic Continuous Speech Corpus (Zue i in. 1990), Talker Variability Sentence Database (Karl, Pisoni 1994) czy dotycząca języka polskiego baza BABEL (Gubrynowicz 1999). W bazach tych badacze starają się uwzględniać zarówno kobiety, jak i mężczyzn, jednak rzadko można tam znaleźć informacje dotyczące statusu socjoekonomicznego oraz przynależności narodowościowej i regionalnej mówców.

Dane te są niezbędne w bazach nastawionych na uchwycenie zróżnicowania języka mówionego. Tego typu zbiory danych muszą zawierać próbki mowy od mówców dokładnie scharakteryzowanych pod względem socjalnym, np. Santa Barbara Corpus of Spoken American English (DuBois i in. 2000), CallFriend Telephone Speech Corpus for American English (Linguistic Data Consortium, 1996), TELSUR (Labov i in. 2006). W odróżnieniu od specjalnie “zaprojektowanego” materiału badawczego do przeczytania, używanego w bazach związanych z technologią mowy, w typowych bazach językowych mamy do czynienia z próbkami naturalnego języka, takimi jak konwersacja czy opowiadanie.

Akustyczna baza danych dialektu mazowieckiego należy do baz mających na celu uchwycenie zróżnicowania języka mówionego. Głównym jej celem jest zebranie jak największej liczby próbek mowy spontanicznej ze wszystkich regionów dialektu mazowieckiego od osób mieszkających od urodzenia, co najmniej w drugim pokoleniu, w danym regionie. Zebrany materiał dźwiękowy może zostać wykorzystany do analiz akustycznych i studiów dialektologicznych. Poza tekstami spontanicznymi baza zawiera dane w postaci wartości docelowych dwóch pierwszych formantów dla występujących w gwarach mazowieckich akcentowanych i nieakcentowanych samogłosek ustnych w różnych kontekstach spółgłoskowych. Dla celów porównawczych baza została uzupełniona o odpowiednie dane akustyczne dotyczące samogłosek polszczyzny ogólnej. Dane te umożliwiają automatyczne porównywanie na wykresach gwarowych realizacji samogłosek z realizacjami odpowiednich głosek polskiego języka ogólnego oraz ukazanie współczesnego obrazu wokalizmu gwar mazowieckich. Pozwoli to na uzupełnienie oraz ewentualną weryfikację dotychczasowych ustaleń w zakresie fonetyki mazowieckiej.

Baza obejmuje średnio 60000 realizacji samogłosek i zawiera szczegółowe metadane, m.in. dialekt, gwara, miejsce urodzenia informatorów, oraz wyszukiwarkę i wykresy ukazujące wymowę informatorów.

Projekt wykorzystuje metodologię fonetyki akustycznej, ponieważ w gwarach obserwowana jest silna wariantywność fonetyczna, wynikająca z działania rozmaitych czynników fonetycznych, geograficznych i socjalnych dotyczących badanych osób, takich jak miejsce pochodzenia, wiek i wykształcenie użytkowników gwary, wpływ języka ogólnopolskiego lub kontekst, w jakim znalazła się badana głoska. Wariantywność tę można dobrze opisać na podstawie obiektywnych danych akustycznych oraz porównać z innymi tego typu danymi, czego nie zapewniają subiektywne wyniki indywidualnego odsłuchu.

Otrzymane z wykorzystaniem tej samej metodologii dane będą porównywalne ze sobą, dając spójny i aktualny obraz wokalizmu gwar mazowieckich, pozwalający na weryfikację dotychczasowych ustaleń w obrębie tak szczegółowych zagadnień, jak np. podwyższona wymowa samogłoski y, charakter samogłosek pochylonych, istnienie przedniej artykulacji samogłoski a, wpływ kontekstu miękkiego i sonornego na realizację samogłosek, różnice między mową kobiet i mężczyzn w zakresie wokalizmu, różnice wymawianiowe zależne od wieku czy wykształcenia respondentów.

Cel projektu