Website van Alex Reuneker over taal, hardlopen, wielrennen en reizen

Taal & Literatuur

Posts over taal en literatuur

Mann-Whitney-U-toets

Onlangs voegde ik aan de T-toets-en-Cohen's-d-calculator de Lilliefors-toets toe (zie https://www.reuneker.nl/2026/04/lilliefors-toets-toegevoegd-aan-t-toets-calculator), om te toetsen op een voorwaarde van de t-toets, namelijk of de data een normaaldistributie volgen. Het leek me handig om er echter ook gevolg aan te geven, want hoewel de Lilliefors-resultaten netjes werden gerapporteerd, werd ook bij niet voldoen aan de bovenstaande voorwaarde toch de parametrische t-toets uitgevoerd.

Vanaf nu geeft de calculator, naast de resultaten van de parametrische t-toets, ook de resultaten van de non-parameterische Mann-Whitney-U-toets weer, met daarbij de effectgrootte in Rank-Biserial-correlatie en Cliff's Delta, en wordt de rapportage aangepast op de resultaten van de Lilliefors-toets.

Resultaten van de Mann-Whitney-U-toets

Resultaten van de Mann-Whitney-U-toets

Lilliefors-toets toegevoegd aan t-toets-calculator

Omdat mijn eerstejaarscollege over onder andere de t-toets er weer aankomt, heb ik de code van de T-toets-en-Cohen's-d-calculator nog eens goed bekeken en er wat verbeteringen in aangebracht. Een grote wijziging is de toevoeging van een toets voor normaalverdeling van de data. Ik wilde daarvoor, zoals gebruikelijk is, de Shapiro-Wilk-toets implementeren, maar dat blijkt in PHP nogal lastig te zijn, omdat de berekening afhankelijk is van allerlei matrices en statistieken die niet in PHP ingebed zijn. Daarom heb ik de Lilliefors-toets toegevoegd, die, qua uitkomst althans, ongeveer hetzelfde doet.

De Lilliefors-toets is een variant van de Kolmogorov-Smirnov-toets die wordt gebruikt om te toetsen of data afkomstig zijn uit een normaalverdeling wanneer het gemiddelde en de standaarddeviatie uit de data zelf worden geschat. Het is belangrijk zo'n toets te doen voordat je een t-toets op je data loslaat, omdat die toets uitgaat van normaal verdeelde data. Als die aanname niet klopt, kunnen de resultaten van de t-toets onbetrouwbaar zijn.

Rapportage van onder andere de Lilliefors-toets

Rapportage van onder andere de Lilliefors-toets

Nou ja, een enigszins technisch verhaal, maar gelukkig doet de T-toets-en-Cohen's-D-calculator al het werk en krijg je netjes een rapportage waarin de resultaten van zowel de Lilliefors-toets als de t-toets, waar het uiteindelijk toch om draait, inclusief referenties staan vermeld. Zie https://www.reuneker.nl/files/t.

Neerlandistiekdagen 2026: het effect van herhaling op hitnotering

Popmuziek zou niet meer zijn wat het geweest is. Zo zijn Amerikaanse popteksten de afgelopen vijftig jaar steeds repetitiever geworden (Parada-Cabaleiro et al., 2024) en daarvoor is een goede reden: hoe meer tekstuele herhaling een liedje bevat, hoe groter de kans dat het hoog eindigt in de hitlijsten. Geldt dat ook voor Nederlandse hits? Niet alleen De Jeugd van Tegenwoordig is ‘gek op repetitie’, ook Frenna scoort ermee: ‘ze is fan, ze is fan, ze is fan van wat ik doe, doe, doe’. Op de studentendag van de Neerlandistiekdagen 2026 aan de Universiteit Leiden nemen Vivien Waszink en ik je mee door een verzameling van Top 40-liedteksten (1965-2025): neemt herhaling ook in Nederlandse popteksten toen en beïnvloedt repetitie hitpositie?

Cassettebandje

Foto door Etienne Girardet op Unsplash

Neerlandistiekdagen 2026: https://www.student.universiteitleiden.nl/agenda/2026/04/neerlandistiekdagen-2026?cf=geesteswetenschappen&cd=nederlandse-taal-en-cultuur-ba

Het meestgebruikte woord in Nederlandstalige popmuziek

Welk woord hoor je het meest in Nederlandstalige popmuziek? Dat is ik. We zingen blijkbaar vaak en graag over onszelf, want dit persoonlijke voornaamwoord komt ruim vierhonderd keer per 10.000 woorden voor.

Willy en Willeke Alberti (ja, vader en dochter) spanden al in 1967 de kroon met Dat afgezaagde zinnetje, waarin ik 26 keer voorkomt. Daarmee is deze onderwerpsvorm, eerste persoon enkelvoud goed voor bijna 14 procent van alle woorden in deze creatieve hertaling van Frank en Nancy Sinatra’s Something stupid. Ter vergelijking: in 'normaal' gesproken Nederlands is niet ik, maar ja het meest voorkomende woord met 287 keer per 10.000 woorden, al scoort ik ook hier niet slecht.

Zingen we dan niet graag over of tegen een ander? Zeker wel, want op nummer 2 staat, met 300 keer per 10.000 woorden, je. Het nummer met de meeste je's? Dat is Wat zou je doen van Bløf uit 1998, waarin het maar liefst zestig keer voorkomt.

De d's en t's van tekstprofessionals

Naar aanleiding van mijn lezing 'Van "verwoeste" tot "deletete": welke spelfouten maken zelfs ervaren schrijvers?' op VIOT 2026 aan de Universiteit van Antwerpen, deed Louise Cornelis aanvullend onderzoek onder haar schrijfcursisten en ze plaatste er een interessante blogpost over op haar weblog Tekst & Communicatie. Ze gaat daarbij vooral in op de vraag welke fouten in werkwoordspelling haar cursisten, professionele tekstschrijvers, maken als ze geen geïsoleerde oefeningen doen, zoals op Gespeld het geval is, maar als ze met gecontextualiseerde teksten bezig zijn.

Lees de post op https://lhcornelis.nl/schrijftips/de-ds-en-ts-van-mijn-schrijvers.

Pagina 3 of 22