Website van Alex Reuneker over taal, hardlopen, wielrennen en reizen

Taal & Literatuur

Posts over taal en literatuur

Improvements to the Lexical Diversity Calculator

In the last couple of days, I've been implementing various improvements to the Lexical Diversity Calculator. Not only did I fix a problem in the calculation of MTLD, which resulted in numbers that were slightly off, but I've also streamlined the calculations and added the calculation of Moving average TTR (MATTR).

enter image description here

Photo by Siora Photography on Unsplash.

Updates

  • 2025-05-29: Added choice to use natural logarithm or base 10 in calculation Maas's a2, Dugast's U2, and Herdan's C.
  • 2025-05-29: Various improvements to calculations and algorithms; added MATTR.
  • 2025-05-26: Important change to the calculation of MTLD, which was slightly off before due to not averaging the forward and backward algorithm.

Next to this, I'm also working on an R-package to easily calculate several measures of lexical diversity, primarily for a research project I'm envisioning for the near future. Stay tuned! For now, please see the online calculator at https://www.reuneker.nl/ld for the newest version.

Langs het Pykeswegje

Onlangs fietste ik van Schiedam naar Kapelle, Zeeland om (oud-)collega en sportvriendin Louise Cornelis te bezoeken. Van tevoren zag ik op de kaart dat ik praktisch langs het Pykeswegje 1 in Goes zou komen – het huis waar dichter Hans Warren vanaf 1957 woonde. Ik las er het onderstaande gedicht en schreef er een stukje over op dé website over Hans Warren.

Verval
Hier was het. Rust is weergekeerd.
Mijn drift die al tot weemoed wordt
heeft, hoop ik, je niet meer bezeerd.
De bloemen zijn al lang verdord,
je beeld is als een kiek vergeeld,
je naam stierf in ‘t bladergeruis.
Hier hebben we ons geluk verspeeld,
kijk: mos woekert al over ‘t huis.

Zie de hele blogpost op http://www.hanswarren.nl/langs-het-pykeswegje/.

enter image description here

Even tot rust komen aan het Pykeswegje 1

Boxplots bij de t-toets

Wilt u een boxplot bij de t? Flauw, I know, maar dat mag ook wel een keertje. De t-toets-calculator is uitgebreid met boxplots, dus bij elke vergelijking die je nu maakt, verschijnt netjes een grafiek zoals de onderstaande, die hoort bij een vergelijking van (fictieve) examenresultaten.

enter image description here

Boxplot bij een vergelijking van (fictieve) examenresultaten

Het verschil in de scores op het examen Nederlands van 2VA (m = 7.13; sd = 1.3) en 2VB (m = 5.79; sd = 1.37) is significant (t (27) = 2.71; p < 0.05). Het effect is groot (Cohen's d = 1.01; Cohen, 1988). Dat kun je ook mooi in de grafiek zien; de medianen liggen niet in het bereik van de eerste twee kwartielen (de boxes) en de verdere spreiding (de whiskers) wijken aardig van elkaar af.

Geshadowband

Het blijft lastig, Engelse werkwoorden in het Nederlands vervoegen en spellen. Binnenkort verschijnt er een artikel over in Tekstblad, waarin ik laat zien hoe dit soort werkwoorden zelfs bij zeer ervaren schrijvers problemen opleveren – vervoegingen van leenwerkwoorden in de verleden, voltooide en tegenwoordige tijd bezetten zelfs de gehele top 3.

Vandaag gaf de NRC, in het (lezenswaardige) artikel Gruwelijke tijdlijnen: waarom gaat extreem geweld zo vaak viraal?, een mooie illustratie van het woord shadowbannen, waarvan ik eerlijk gezegd nog nooit had gehoord.

enter image description here

De betekenis wordt me door de korte uitleg in de zin erna ook niet helemaal duidelijk, maar gelukkig biedt de onderstaande uitleg op deze Wikipedia-pagina uitkomst.

De Engelse termen shadowban, shadowbanning, ghostbanning, comment ghosting of range throttling verwijzen naar de volledige of gedeeltelijke blokkering van een gebruiker, of diens inhoud, van een online gemeenschap op een manier, dat de gebruiker niet onmiddellijk weet dat deze is geblokkeerd.

Nu dan de spelling. De stam van shadowbannen is shadowban en als je de stam, die eindigt op een stemhebbende klank (de n zit niet in 't kofschip'), gebruikt bij het spellen, krijg je geshadowband – niet geshadowbanned. Hoewel shadowbannen niet in de officiële woordenlijst staat, staat bannen daar wel in en daarvoor geldt uiteraard hetzelfde. Het onnodig toevoegen van een e beschreef ik al eerder in het artikel Engelse leenwerkwoorden en de invloed van stameinde en werkwoordstijd op spelfouten in Tijdschrift voor Taalbeheersing 46(1). Het komt best vaak voor, waarschijnlijk omdat het er 'beter' (lees 'Engelser') uitziet.

Overigens blijkt dit niet de eerste keer te zijn dat dit werkwoord in deze spelling voorkomt in de NRC. Toen ik zojuist even de online versie opzocht, zag ik het onderstaande.

enter image description here

Het incorrecte 'geshadowbanned' komt driemaal voor.

Voor wie denkt 'ja, maar hoe vaak komt het voor in de correcte spelling?': niet, zoals je hieronder kunt zien. Ook andere tijden waarbij deze kwestie speelt (shadowbande, bijvoorbeeld) vond ik niet.

enter image description here

Het correcte 'geshadowband' komt niet voor.

'From clue to culprit: epistemic conditionals in detective fiction' at ECA 2025, Warsaw

In September 2025, at the 5th European Conference on Argumentation (ECA), I will present a corpus study on reasoning with conditionals by detectives, entitled From clue to culprit: epistemic conditionals in detective fiction. The conference is hosted by the Warsaw University of Technology, Faculty of Administration and Social Sciences. Below you'll find the abstract. Hope to see you all there!

enter image description here

Abstract 'From clue to culprit: epistemic conditionals in detective fiction'

Pagina 15 of 22