Website van Alex Reuneker over taal, hardlopen, wielrennen en reizen

Taal & Literatuur

Posts over taal en literatuur

Post-hocvergelijkingen met Tukey HSD toegevoegd aan ANOVA-calculator

Aan de ANOVA-calculator zijn inmiddels post-hocvergelijkingen met Tukey HSD toegevoegd. Waar je met de ANOVA kijkt in hoeverre er (significante) groepsverschillen zijn, toets je met zo'n post-hocvergelijking welke groepen uit de analyse onderling verschillen.

Stel je voor dat je de lengtes van zinnen, als deelaspect van complexiteit, van drie kranten met elkaar wilt vergelijken. Je neemt een aantal zinnen uit drie kranten en telt de zinnen. Je schrijft de volgende lengtes op.

Telegraaf: 9, 7, 2, 8, 4, 1, 6, 4, 1, 5, 9, 5, 9, 7, 7, 8, 7, 7, 3, 2

Volkskrant: 24, 10, 2, 11, 4, 5, 23, 25, 8, 16, 24, 3, 13, 12, 19, 16, 16, 5, 15, 11

NRC: 22, 22, 21, 28, 17, 2, 23, 7, 27, 14, 28, 23, 26, 2, 20, 16, 16, 4, 24, 24

Als we, met de calculator op https://www.reuneker.nl/files/anova, een ANOVA toepassen op deze gegeven, krijgen we de onderstaande resultaten.

Op de bovenstaande gegevens is een eenrichtings-ANOVA (Cramer & Howitt, 2007; Reuneker, 2025) uitgevoerd om het effect van krant op zinslengte (aantal woorden) te vergelijken. Uit deze eenrichtings-ANOVA bleek dat er een statistisch significant verschil was in zinslengte (aantal woorden) tussen ten minste twee groepen (F(2, 57) = 18.54, p = 0). Het effect is groot (η2 = 0.39); de groepen verklaren 39.42 procent van de variatie ten opzichte van het gemiddelde.

Let overigens op: de data zijn gefingeerd en verschillen met dergelijke effectgrootten kom je niet vaak tegen; het is maar een voorbeeld.

Maar we weten dan nog niet welke kranten nu eigenlijk van elkaar verschillen. Met een post-hocanalyse kun je precies dat toetsen; je neemt alle mogelijke paren (Telegraaf vs Volkskrant; Telegraaf vs NRC; Volkskrant vs NRC) en toetst per paar of er een significant verschil is. Dat levert, in deze fictieve proef, het volgende op.

Post-hocvergelijkingen (Tukey HSD) zijn paarswijs toegepast. Telegraaf (m = 5.55) verschilt significant van Volkskrant (m = 13.1), p < 0.05, q = 5.07. Telegraaf (m = 5.55) verschilt significant van NRC (m = 18.3), p < 0.05, q = 8.56. Volkskrant (m = 13.1) verschilt niet significant van NRC (m = 18.3), p > 0.05, q = 3.49.

Het tekstuele rapportje wordt door de tool automatisch gegenereerd, maar je kunt het natuurlijk herschrijven om het iets soepeler te laten lopen. Het belangrijkste is echter dat we nu weten dat het de Telegraaf is die afwijkt van de NRC en de Volkskrant, maar dat die laatste twee kranten onderling niet significant van elkaar verschillen in zinslengtes.

enter image description here

Post-hocanalyses in de ANOVA-tool

Je vindt in de https://www.reuneker.nl/files/anova, met een druk op de knop, uiteraard ook alle toetswaarden.

ANOVA-calculator

Een aantal van mijn studenten wil metingen van meer dan twee groepen met elkaar vergelijken en dan kom je er met een t-toets helaas niet; je hebt dan in principe een variantieanalyse zoals ANOVA nodig. Het leek me daarom, vorig jaar al, handig een ANOVA-calculator te maken die gemakkelijk te gebruiken is en de juiste rapportage geeft van zowel significantie als effectgrootte (in termen van ETA-kwadraat). De calculator die ik vorig jaar maakte, maakte ik echter niet af en nu had ik een relatief rustige middag waarop ik er eens goed voor kon gaan zitten. Een en ander kan nog wat gestroomlijnder en ik wil nog wel wat features toevoegen, zoals boxplots (zie de t-toets-calculator) en post-hoctoetsen, maar de pagina is wel inmiddels wel functioneel.

Online ANOVA-calculator

Online ANOVA-calculator

Je kunt de calculator gebruiken op https://www.reuneker.nl/files/anova en als je nog geen data hebt om te testen, dan kun je door middel van een druk op de knop een gefingeerd voorbeeldonderzoekje tevoorschijn roepen.

Even tot hier (BNNVARA): Hoe spel je geupdate wel?

In het satirische programma Even tot hier (BNNVARA) van cabaretiers Niels van der Laan en Jeroen Woe wordt, in de aflevering van zaterdag 18 april op ongeveer 21 minuten en 45 seconden, gewezen op een spelfout in een checklist ter preventie van cybercrime van de politie: 'Zorg dat apps geupdate zijn'.

Zorg dat apps geupdate zijn

Zorg dat apps geupdate zijn

Dit is de aanleiding voor de volgende publieksvraag: 'Hoe spel je geupdate wel?'

Hoe spel je geupdate wel?

Hoe spel je geupdate wel?

Na het goede antwoord te hebben gegeven (geüpdatet), geven ze nog een leuke toelichting: 'Het is een leenwoord uit het Engels en die Engelsen willen altijd extra t(hee). Zo kan je het onthouden'.

Vanmorgen bekeek ik zelf even de checklist op de site van de politie en het lijkt erop dat ze ook gekeken hebben. Ze gaan 'het probleem' echter liever uit de weg dan dat ze het oplossen; er staat nu 'Voer regelmatig updates uit'. Tja, dan ben je er ook vanaf.

Voer regelmatig updates uit

Voer regelmatig updates uit

Dank aan Ronny Boogaart voor de kijktip.

Mann-Whitney-U-toets

Onlangs voegde ik aan de T-toets-en-Cohen's-d-calculator de Lilliefors-toets toe (zie https://www.reuneker.nl/2026/04/lilliefors-toets-toegevoegd-aan-t-toets-calculator), om te toetsen op een voorwaarde van de t-toets, namelijk of de data een normaaldistributie volgen. Het leek me handig om er echter ook gevolg aan te geven, want hoewel de Lilliefors-resultaten netjes werden gerapporteerd, werd ook bij niet voldoen aan de bovenstaande voorwaarde toch de parametrische t-toets uitgevoerd.

Vanaf nu geeft de calculator, naast de resultaten van de parametrische t-toets, ook de resultaten van de non-parameterische Mann-Whitney-U-toets weer, met daarbij de effectgrootte in Rank-Biserial-correlatie en Cliff's Delta, en wordt de rapportage aangepast op de resultaten van de Lilliefors-toets.

Resultaten van de Mann-Whitney-U-toets

Resultaten van de Mann-Whitney-U-toets

Lilliefors-toets toegevoegd aan t-toets-calculator

Omdat mijn eerstejaarscollege over onder andere de t-toets er weer aankomt, heb ik de code van de T-toets-en-Cohen's-d-calculator nog eens goed bekeken en er wat verbeteringen in aangebracht. Een grote wijziging is de toevoeging van een toets voor normaalverdeling van de data. Ik wilde daarvoor, zoals gebruikelijk is, de Shapiro-Wilk-toets implementeren, maar dat blijkt in PHP nogal lastig te zijn, omdat de berekening afhankelijk is van allerlei matrices en statistieken die niet in PHP ingebed zijn. Daarom heb ik de Lilliefors-toets toegevoegd, die, qua uitkomst althans, ongeveer hetzelfde doet.

De Lilliefors-toets is een variant van de Kolmogorov-Smirnov-toets die wordt gebruikt om te toetsen of data afkomstig zijn uit een normaalverdeling wanneer het gemiddelde en de standaarddeviatie uit de data zelf worden geschat. Het is belangrijk zo'n toets te doen voordat je een t-toets op je data loslaat, omdat die toets uitgaat van normaal verdeelde data. Als die aanname niet klopt, kunnen de resultaten van de t-toets onbetrouwbaar zijn.

Rapportage van onder andere de Lilliefors-toets

Rapportage van onder andere de Lilliefors-toets

Nou ja, een enigszins technisch verhaal, maar gelukkig doet de T-toets-en-Cohen's-D-calculator al het werk en krijg je netjes een rapportage waarin de resultaten van zowel de Lilliefors-toets als de t-toets, waar het uiteindelijk toch om draait, inclusief referenties staan vermeld. Zie https://www.reuneker.nl/files/t.

Pagina 1 of 21