W okresie staropolskim, obejmującym przedział od początków rozwoju polszczyzny (X w.) do początków XVI w., każda samogłoska mogła wystąpić jako długa lub krótka. Iloczas, czyli czas trwania samogłoski wpływał na znaczenie wyrazu. Zanik iloczasu, który nastąpił na przełomie XV – XVI w. doprowadził do zastąpienia opozycji samogłoska krótka – samogłoska długa nową opozycją samogłoska jasna – samogłoska ścieśniona (pochylona). W języku literackim wysokie samogłoski długie i, y, u zidentyfikowały się z kontynuantami dawnych krótkich odpowiedników. Natomiast ā długie przeszło w á ścieśnione i było wymawiane jako dźwięk pośredni między a oraz o, ē długie przeszło w é ścieśnione o barwie pośredniej między e oraz i/y, a ó ścieśnione pochodzące z ō długiego stało się głoską pośrednią między o i u. Głoski te zanikły w języku ogólnopolskim, ale nadal można je usłyszeć w gwarach (Dubisz, Długosz-Kurczabowa 1998). W porównaniu z innymi dzielnicami gwarowymi, jak np. Małopolska czy Wielkopolska, Mazowsze wykazuje stosunkowo słabą tendencję do ścieśnień dawnych samogłosek długich. Gwary mazowieckie prawie nie rozwinęły odziedziczonych z okresu średniopolskiego (XVI w.-1772 r.) samogłosek ustnych ścieśnionych. Pozostały one stosunkowo bliskie tej fazie rozwoju, w jakiej znajdowały się prawdopodobnie w XVI w. (Basara 1965).
W gwarach mazowieckich w okresie zanikania zróżnicowań iloczasowych staropolskie ǎ nie przeszło, jak w języku literackim w a jasne, lecz w głoskę o bardziej przedniej artykulacji, pośredniej między a i e. Głoska ta w sąsiedztwie spółgłosek miękkich i sonornych mogła zbliżać swoją artykulację do samogłoski e, a nawet zlewać się z nią. W przeszłości wymowa taka obejmowała prawdopodobnie całe Mazowsze i była uznawana za gwarową, dlatego też unikano jej w polszczyźnie ogólnej, o czym świadczą liczne formy hiperpoprawne w zabytkach XV i XVI w. Współcześnie taka realizacja dawnego ǎ występuje jedynie w najbardziej peryferycznych gwarach mazowieckich na Mazurach (Dejna 1993).
Z tym dawnym typowo mazowieckim przesunięciem ku przodowi artykulacji staropolskiego ă > ae wiązać należy jednak szereg notowanych w gwarach mazowieckich zjawisk fonetycznych jak:
W okresie staropolskim przejście nagłosowego ja- > je-, por. jeskółka ‘jaskółka’, jek ‘jak’ i ra- > re-, por. reno ‘rano’, redło ‘radło’ było zjawiskiem systemowym i obejmującym całe Mazowsze (Taszycki 1961). Współcześnie ma charakter leksykalny, a nie fonetyczny i szybko zanika, o czym świadczą liczne formy z obocznością ja-//je-, ra-//re- lub z samym ja, ra- wewnątrz obszaru wymowy z je-, re-.
Zmiana -ar- > -er-, podobnie jak przedstawione wyżej, nie jest współcześnie systemowa, pojawia się tylko w niektórych formach czasowników m.in. trzeć, drzeć, żreć, umrzeć, uprzeć się, zaprzeć, zawrzeć oraz rzeczowników, np. tartak, tarcica, umarlak, darń. Podobnie rzecz się przedstawiała w okresie staropolskim. Już od XII w. pojawiają się w zabytkach północnopolskich formy wyrazowe potwierdzające tę zmianę fonetyczną, np. wyderł ‘wydarł’ 1425, umerł ‘umarł’ 1437, pożerła ‘pożarła’ 1510. Zebrany materiał historyczny dowodzi, że przejście -ar- > -er- jest zjawiskiem starym, sięgającym doby przedpiśmiennej języka polskiego, obejmującym niegdyś całą północną Polskę z Wielkopolską włącznie. Zjawisko to nigdy jednak nie przybrało większych rozmiarów.
K. Nitsch notował przed I wojną światową postacie: ter ‘tarł’, nazer się ‘nażarł się’, poderła ‘podarła’, poderte ‘podarte’, tertak ‘tartak’, umerlak ‘umarlak’ na całym północno-wschodnim terenie po Wieprz i Wisłę, i dalej po okolice Warszawy i Sochaczewa (Nitsch 1957). Obecnie można obserwować stopniowe wycofywanie się omawianych postaci na północ. Ustępują one przed szerzącymi się w tym kierunku południowomazowieckimi i literackimi formami z -ar-.
W gwarach mazowieckich, samogłoska a (< staropolskie ă) może ulegać uprzednieniu artykulacyjnemu także w połączeniu ze spółgłoską j w formach przysłówków dzisiaj i tutaj. Na mapie 467 AGM zwraca uwagę daleki północno-wschodni zasięg tych form, obejmujący także Mazowsze dalsze, choć tutaj notowano je zawsze obocznie z postaciami ogólnopolskimi. Tak szeroki zakres form z -ej < -aj, cechą charakterystyczną przede wszystkim dla południowej i zachodniej Polski, powszechnie tłumaczy się analogią do form dzisiejszy, tutejszy (Basara 1965). Według mapy A. Basary omawiane zjawisko występuje w gwarach mazowieckich tylko do linii wyznaczonej przez Pruszków i Nowy Dwór Mazowiecki, a na terenach położonych dalej na wschód notowane jest sporadycznie lub w ogóle (Basara 1965, m. nr 1.).
Ze względu na wymowę kontynuantów dawnego ā długiego Mazowsze dzieli się na dwie części. Wymowa á pochylonego (< staropolskie ā) jako dźwięku pośredniego pomiędzy a oraz o lub jako o występuje na Mazowszu bliższym, Kurpiach, Warmii, w Ostródzkiem, w środkowej części Mazur oraz w niektórych wsiach Mazur zachodnich, por. nieroz, zagroł ‘nieraz, zagrał’, a jako a jasnego (jak w języku ogólnopolskim) na Mazowszu dalszym, Podlasiu i w Lubawskiem.
Na terenie dialektu mazowieckiego samogłoska e w grupie eN, albo ulega rozszerzeniu do aN, albo ulega zwężeniu do eyN, yN. Ten pierwszy sposób artykulacji można wytłumaczyć istniejącą na Mazowszu odpowiedniością między barwą ustną samogłoski nosowej przedniej i połączeń eN. Jeśli na danym obszarze gwarowym panuje archaiczna, szeroka wymowa samogłoski ę jak ą, to i e w grupie eN także rozszerza swoją artykulację do a, dając grupę aN, por. owsam ‘owsem’, wozam ‘wozem’, zbożam ‘zbożem’. Ten archaiczny typ wymowy notowany był powszechnie przez K. Nitscha wzdłuż prawego brzegu Wisły, aż pod Brok oraz w zachodniej części Kurpiów. Taka realizacja grupy eN szybko zanika, co podkreślano już w opracowaniach z lat trzydziestych i współcześnie spotykana jest rzadko, zwłaszcza w okolicach Warszawy.
Drugi sposób realizacji samogłoski e jest następstwem tego, że już pod koniec trwania artykulacji e zaczyna się przygotowanie narządów artykulacyjnych do wymówienia następnej głoski nosowej, polegające na wstępnym opuszczeniu podniebienia miękkiego. Wskutek tego odległość między położeniem masy języka, potrzebnym do wymówienia e, a górną częścią jamy ustnej zmniejsza się i kanał ustny staje się węższy, podobny do tego, jaki jest przy artykulacji ey, a nawet y (Dejna 1993), por. cyment ‘cement’, tyn ‘ten’, cymentowe ‘cementowe’. Silne ścieśnienia samogłoski e, dochodzące do i//y są charakterystyczne dla Mazowsza prawobrzeżnego (Basara 1965).
Oprócz dwóch wymienionych wyżej realizacji występuje także, obecnie dominująca, wymowa zgodna z normą ogólnopolską, czyli eN, por. jeden, bochenek.
W języku literackim é pochylone, kontynuujące ē długie, utrzymywało się jeszcze do końca XIX w., a wąska artykulacja tej samogłoski do dziś zachowana jest w gwarach, także na Mazowszu (poza gwarami łowickimi i wschodniego Podlasia), gdzie utrzymuje się zdecydowanie lepiej niż a pochylone (Basara 1965). W gwarach Mazowsza, kontynuant staropolskiego ē długiego bywa z reguły wymawiany jako głoska pośrednia między i/y oraz e, a także z silniejszym ścieśnieniem jako y lub i, por. zwirzyna ‘zwierzyna’, pogrzyb ‘pogrzeb’, chlyb ‘chleb’, wrzosowygo ‘wrzosowego’, tygo ‘tego’. Na całym Mazowszu samogłoska e jest bardzo silnie ścieśniana w wyrazie też, por. tyż.
Osobną grupę stanowią wyrazy, w których ścieśnieniu ulega e niekontynuujące ē długiego, por. zamyk ‘zamek’, żuryk ‘żurek’. Ścieśnieniu może ulec też samogłoska e w wyrazach zapożyczonych, por. w kiliszku ‘w kieliszku’, cybulke ‘cebulkę’. Na terenie dialektu mazowieckiego wszystkie wymienione realizacje spotykane są rzadko, przeważa wymowa zgodna z normą ogólnopolską.
Według ujęcia K. Nitscha Mazowsze stanowi część północnego obszaru Polski, na którym panuje wymowa każdej samogłoski y jak i. Oprócz takiej realizacji, na miejscu samogłoski y może wystąpić dźwięk pośredni między y oraz i, por. tyile ‘tyle’, praktyike ‘praktykę’, byik ‘byk’.
W wielu opracowaniach gwar mazowieckich taka pośrednia realizacja samogłoski y wysuwa się na pierwszy plan, natomiast pełne utożsamienie y z i notowane jest niekonsekwentnie, w niektórych tylko wyrazach czy pozycjach fonetycznych (Basara 1965; Cyran 1960; Urbańczyk 1962). Obie wymienione wyżej realizacje samogłoski y są zjawiskiem zanikającym. Według mapy 86 AGP we współczesnych gwarach mazowieckich, wysoką realizację y jak i można już tylko spotkać na północ od rzeki Bug, natomiast na pozostałym obszarze występuje, obok powszechnej ogólnopolskiej, wymowa pośrednia.
Samogłoska i jest na ogół wymawiana tak samo jak w języku literackim, jedynie w nagłosie wyrazów oraz przed spółgłoskami sonornymi notowano zmiany w jej artykulacji.
Na całym Mazowszu samogłoska i w nagłosie wyrazów może być wymawiana jako i- lub poprzedzona przez głoskę j i wymawiana jako ji-, por. przykłady: ji//i, jile//ile, jidzie//idzie. Zjawisko to można wyjaśniać tym, że niekiedy początkowa faza samogłoski i odznacza się nieco wyższym wzniesieniem środkowej części języka, czego rezultatem jest głoska j (Friedrich 1955).
Samogłoska i może ulegać pewnym zmianom pod wpływem sąsiedztwa spółgłosek sonornych. Zmiany te polegają głównie na rozszerzeniu artykulacji i nie zawsze zachodzą konsekwentnie, por. nie lubieli ‘nie lubili’, jendyk ‘indyk’, fieranki ‘firanki’. Powyższe zjawisko fonetyczne poświadczone jest także w najstarszych polskich zabytkach pisanych. W pozycji przed spółgłoskami nosowymi można je wyjaśniać trudnościami w utrzymaniu wysokiej artykulacji samogłoski i, bowiem spółgłoski te wymagają znacznego obniżenia podniebienia miękkiego (Koneczna 1965).
Na terenie dialektu mazowieckiego labializacja, czyli poprzedzanie samogłoski o, a także u przez głoskę ł, zaznacza się słabo – jedynie w nagłosie wyodrębnia się krótkie ł, które powstaje z silniejszego zaokrąglenia warg, następującego wcześniej niż ułożenie masy języka dla o (Dejna 1993), por. łoś ‘oś’, łoba ‘oba’, łosioł ‘osioł’.
Na zmianę artykulacji jasnego o, podobnie jak innych samogłosek, może wpływać sąsiedztwo spółgłosek sonornych, przede wszystkim nosowych (N). Charakterystyczne dla nich opuszczanie podniebienia miękkiego może rozpoczynać się już pod koniec trwania czynności artykulacyjnych właściwych dla samogłoski o, co pomniejsza szerokość otwarcia jamy ustnej (Dejna 1993). W wyniku spowodowanych tym przekształceń kanału ustnego samogłoska o przed spółgłoskami nosowymi może ulegać nieznacznemu zwężeniu i cofnięciu do ouN, uoN, por. kounia ‘konia’, brounach ‘bronach’, a nawet stać się głoską maksymalnie zwężoną i cofniętą do uN, por. fruńcie ‘froncie’, kunia ‘konia’.
Sporadycznie pojawiają się ścieśnienia także przed spółgłoską r w wyrazach pochodzenia obcego, por. doktur ‘doktor’, dyrektour ‘dyrektor’.
Odpowiedniki ō długiego na Mazowszu mogą brzmieć jak u, ou lub o. Współcześnie, zdecydowanie przeważa wymowa ogólnopolska jak u.
Podobnie jak w wypadku samogłoski o, także przy u labializacja zaznacza się bardzo słabo i występuje jedynie w nagłosie, por. łurośnie ‘urośnie’, łubity ‘ubity’. Według A. Basary teren, na którym panuje taka wymowa jest węższy niż ten, na którym notuje się labializację samogłoski o: „Wyodrębnia się tutaj Płockie, Sierpeckie oraz okolice Łowicza i Rawy Mazowieckiej, a we wschodniej części Mazowsza teren zawarty między Ciechanowem, Brokiem i Nowogrodem. [...] wyraźny zanik labializacji występuje przede wszystkim w szeroko pojętych okolicach Warszawy.” (Basara 1965, s. 125).