Website van Alex Reuneker over taal, hardlopen, wielrennen en reizen

Hirsch-Popescu Point added to Lexical Diversity Calculator

The Hirsch-Popescu Point (Popescu & Altmann, 2006) is an interesting metric to assess repetition in a text. It is determined by first calculating the frequency distribution of all words in the text. Then, words are ranked from the most frequent to the least frequent. The H-P Point is then defined as 'the point in which the ranking of a word in the distribution matches its frequency, just like the h-index in academia' (see Nunes, Ordanini, Valsesia, 2017, p. 20; Hirsh, 2005). Indeed, the h-index is a well-known measure of productivity and citation impact of publications. The smaller the H-P point, the less repetition a text contains and vice versa, i.e, the greater the HP-point, the more repetition a text contains.

If we apply the calculation to an example text, we easily see how it works exactly. The text used here is Sylvia Plath’s poem 'Lady Lazarus' (1965), and the resulting frequency table (distribution of words) can be seen below.

Word distribution in https://www.poetryfoundation.org/poems/49000/lady-lazarus”>Sylvia Plath’s poem ‘Lady Lazarus’ (1965)

Word distribution in Sylvia Plath’s poem ‘Lady Lazarus’ (1965)

In this table, we see that the word of occurs eight times in the poem, and it is also ranked at position eight in order from most to least frequent words. Therefore, 8 is the H-P Point. Of course, this frequency table, the sorting and determining the actual point at which frequency and order coincide is done by the Lexical Diversity Calculator for you, as can be seen below.

The Hirsch-Popescu Point as calculated by the Lexical Diversity Calculator

The Hirsch-Popescu Point as calculated by the Lexical Diversity Calculator

As always, if you find it useful, have fun!

'Ben stil' of 'wees stil'?

In de aanstaande publicatie ‘Onthoud de gebiedende wijs! De spelling van de gebiedende wijs in het voortgezet onderwijs’ in Tijdschrift voor Nederlandse Taal- en Letterkunde (TNTL) die ik samen met Franka Hogewoning schreef, zochten we uit hoe het nu precies zit met de gebiedende wijs wees, als in ‘Wees nou eens stil!’. Je hoort tegenwoordig ook wel ‘Ben stil’, maar die vorm lijkt toch nog niet helemaal doorgebroken. Wat is het verhaal?

'Wees nou eens stil!'. Foto door Kristina Flour op Unsplash

'Wees nou eens stil!'. Foto door Kristina Flour op Unsplash

Persoonsvormen zijn werkwoordsvormen die congrueren met hun onderwerp en die aanduiden of een gebeurtenis of een situatie gelijktijdig ofwel voortijdig is aan het spreekmoment. In de Algemene Nederlandse Spraakkunst wordt de gebiedende wijs een persoonsvorm genoemd, ook al is het onderwerp van de zin niet uitgedrukt, zoals in ‘Ga zitten.’ (Haeseryn et al. 1997: 44). In de traditionele grammatica heeft de gebiedende wijs twee vormen. De eerste en meest gebruikte vorm is gelijk aan de stam of eerste persoon enkelvoud tegenwoordige tijd (zie o.a. Van der Velde 1956: 77; Nederlandse Taalunie 2005: 75). Zo stelt Onze Taal dat in ‘Word lid van Onze Taal’ […] word een gebiedende wijs [is] en die is gelijk aan de ik-vorm van het werkwoord. Er komt dus geen t achter word.’ In sommige bronnen wordt vermeld dat de vorm gelijk is aan ‘de vorm van het werkwoord die hoort bij de tweede persoon, met jij erachter’ (Renkema 2020: 451; zie ook Den Hertog 1903: 39). Die laatste omschrijving lijkt, ook getuige de opmerking ‘we mogen noem als vorm voor de 1e pers. enkelvoud niet gelijkstellen met noem als vorm voor de gebiedende wijs, zoals vergelijking met ben en wees leert’ in de Spraakkunst van Rijpma en Schuringa (1972: 69), als instructie, ingewikkelder, maar wel correcter. Hieronder laten we zien wat dat nu met wees te maken heeft.

Bij enkele vormen is de specifieke werkwoordsvorm voor de gebiedende wijs in gebruik gebleven en daarin zien we de overeenkomst met de persoonsvorm van de tweede persoon enkelvoud, zoals in ‘Wees jij nu eens stil!/Wees nu eens stil!’ en niet met die van de eerste persoon enkelvoud, zoals in ‘Ik ben stil./? Ben nu eens stil!’ Hier zien we tevens waarom de gebiedende wijs als persoonsvorm wordt gezien; wees is de specifieke vorm die hoort bij de gebiedende wijs van het werkwoord zijn. De gebiedende wijs ben lijkt wel in opkomst te zijn, maar behoort volgens de Algemene Nederlandse Spraakkunst (nog) niet tot de standaardtaal (Haeseryn et al. 1997: 66-67). Wel speelt regio een rol (Onze Taal). Proeme stelt dat ‘de persoonsvormen in imperativuszinnen geheel overeenkomen met persoonsvormen in mededelende zinnen’ en dat er daarom in imperatiefzinnen, net als in mededelende zinnen, ook werkwoordsvormen voor kunnen komen die niet in tegenwoordige tijd staan (1984: 248).

Volgens De Haan (1986: 253) is de gebiedende wijs als specifieke werkwoordsvorm door taalverandering verdwenen, op ‘een relict als de vorm wees bij zijn’ na. De infinitief zijn is, volgens het Woordenboek der Nederlandsche Taal, een jongere pendant van wezen die in het Middelnederlands al sterk aanwezig is. Toch blijft wezen ook buiten de gebiedende wijs nog tot in de twintigste eeuw in gebruik, vooral in geschreven taal (WNT). Vroeger was er een aparte vorm voor de gebiedende wijs, maar de gebiedende wijs is veranderd in een zinstype dat voldoet aan een of meer kenmerken, zoals het ontbreken van een onderwerp, een persoonsvorm die vooraan staat in de zin, een werkwoordsvorm die bestaat uit de stam en in de tegenwoordige tijd staat. De opmars van zijn ten koste van wezen lijkt echter (nog) niet de imperatief wees te hebben verdrongen.

Lees, om toch maar af te sluiten met een gebiedende wijs, binnenkort meer in het komende nummer van Tijdschrift voor Nederlandse Taal- en Letterkunde (TNTL).

La la la

In Nederlandse liedteksten doet la het uitermate goed. In 'Dans je de hele nacht mij?' van De Sjonnies (1995) bijvoorbeeld komt het 279 keer voor – ja, 279 keer! Dat betekent dat bijna 65 procent van alle 433 woorden in deze meezinger la is. Ook klankverwanten ah, na en da blijken populair, zoals in Suzan en Freeks hit 'Onderweg Naar Later' uit 2021: 'Ik hoop dat het iets is wat nog blijft als het straks zomer is geweest na na na [...]'.

De Sjonnies (afbeelding van [YouTube](https://youtu.be/8rzw1eUfbZo?si=3XO4mW9zk-Au605i))

De Sjonnies (afbeelding van YouTube)

Samen met collega's Milou Andree en Vivien Waszink zoek ik momenteel nog veel meer uit over Nederlandstalige popmuziek. Later meer, maar voor nu gewoon lekker meezingen met De Sjonnies: https://youtu.be/8rzw1eUfbZo?si=3XO4mW9zk-Au605i.

N-gram generator now capable of logographic n-grams

As per request, I have added an option to the n-gram generator to treat text not solely as word-based, but also as character-based/logographic text. This enables analyzing texts in, for instance, Mandarin Chinese.

Logographic n-grams in the n-gram generator

Logographic n-grams in the n-gram generator

As my knowledge of character-based languages is virtually non-existent, the feature is rudimentary at this moment, although two researchers of Mandarin Chinese did test the tool and evaluate the output. With respect to Chinese, a limitation pointed out to me by Maarten Bogaards, is that the character-based script does not have spaces, and the calculator basically treats each individual character as one word, even though words can consist of multiple characters. A Chinese sample text to test with can now also be loaded, and is a sample of Mei Yuan's 隨園詩話, taken from Project Gutenberg.

One of the things I added after testing was the removal of following punctuation marks, which are different in Chinese, namely 。,、“‘’”《》…·:?!;()and ,. You might not see the difference in all marks, but they are non-utf-8 counterparts, which, for computers at least, are a different beast. You can also enter additional characters to exclude if you so wish.

De Ronde Venen Duo-marathon 2025

Afgelopen zondag liepen Eva en ik De Ronde Venen Duo-marathon, met als start- en eindpunt het Raadhuisplein van Abcoude. Het was erg leuk om samen een marathon te volbrengen en daarbij grotendeels (nou ja, 'grotendeels'... lees vooral verder) samen te zijn. Natuurlijk kun je een marathon soms ook als twee halve marathons lopen, waarbij je het figuurlijke stokje op de helft doorgeeft, maar bij deze duo-marathon mocht je zelf bepalen hoe vaak en waar je wilde wisselen. Degene die niet liep, fietste en vice versa.

De route van de Ronde Venen Marathon met onze wisselpunten

De route van de Ronde Venen Marathon met onze wisselpunten

Op de website stond helder uigelegd op welke punten je, bijvoorbeeld vanwege smalle paden, niet mocht wisselen. Wij hadden bedacht op zes, twaalf en daarna elke vijf kilometer te wisselen, behalve aan het einde; de een-na-laatste zou dik zes kilometer lopen en de laatste vier, alvorens, 300 meter voor de finish, de fiets te parkeren en samen hardlopend de eindstreep over te gaan. We zouden dan allebei ongeveer een halve marathon in de benen hebben.

Al bij aankomst was de sfeer goed; het cafeetje vlak bij de start was afgeladen met deelnemers en dat was niet alleen gezellig, maar ook lekker warm, want het was flink guur buiten; koud en aardig wat wind. Ik begon met lopen en we wisselenden op de afgesproken punten. Het viel me wat tegen hoe lang de verschillen tussen de loop- en fietsroutes waren – meestal wel een paar kilometer – waarbij je dan dus niet bij elkaar was. De route was, voor fietsers, maar vooral voor lopers, wel erg mooi. Zo liepen we lang langs de Vinkeveense Plassen en waren er flinke stukken onverhard parcours, waarbij het laatste onverharde stuk van zo'n tweeënhalve kilometer overigens wel erg blubberig en glibberig was op wegschoenen.

Start en finish op Raadhuisplein

Start en finish op Raadhuisplein

Tot voorbij het halvemarathonpunt ging het heel voorspoedig; tegen de verwachting in liepen we de eerste helft onder de anderhalf uur. De route had daarna een paar verrassingen in petto; zo liepen/fietsten we door een bloemenkas en door een koeienstal. Erg leuk en sowieso was het fijn dat op veel punten, zeker in de dorpjes, toeschouwers stonden aan te moedigen. Ook het feit dat je, door het afwisselen, steeds dezelfde mensen inhaalde of door hen juist werd ingehaald, maakte dat het allemaal heel persoonlijk en gemoedelijk aandeed; een praatje hier, 'zet 'm op!' daar.

Dwars door de bloemenkas

Dwars door de bloemenkas (foto door Mieke van 't Schip)

Het ging echter goed mis bij de laatste wissel; de fietser moest daar twee kilometer extra fietsen en dat met volle bak tegenwind. Ik liep aardig door, zo'n 3:45-3:50 per kilometer en dat is omgerekend ongeveer zestien kilometer per uur – hard doortrappen dus. Te hard, bleek, want ik miste het wisselpunt, dat ik daadwerkelijk niet herkend heb, waarschijnlijk omdat er geen andere 'wisselaars' stonden – de grote groep moest nog komen, denk ik – en er kwamen me op een gegeven moment, toen ik al voorbij dat punt was, zelfs duo-fietsers tegemoet. Ik wist niet wat te doen, dus ik liep maar door, omdat ik aannam dat ik achter de fietser liep. Dat bleek niet zo te zijn. Bij het punt waarop we samen al hardlopend de laatste 300 meter zouden afleggen, heb ik dus maar gewacht en met de telefoon van een vriendelijke dame van de organisatie gebeld. Gelukkig troffen we elkaar na een minuut of vijf en de finish ging daarna oké, maar we hadden ons dit toch wel anders voorgesteld.

Afbeelding van de Nieuwe Meerbode

Afbeelding van de Nieuwe Meerbode

Onderweg waarschuwden een Belgisch duo ons al dat de fietser rond de 34 kilometer écht door zou moeten fietsen, maar dat het zo erg was, dat vermoedden we niet. Meerdere deelnemers en vrijwillgers zeiden ons later dat het zonder elektrische fiets eigenlijk niet te doen was en dat vind ik zelf eigenlijk niet zo leuk. Je zag sowieso veel deelnemers met een accu op de fiets en voor mij haalt dat toch wel enigszins de lol van een sportief evenement af. Nu was de zware stadsfiets die wij hadden wel het andere uiterste, maar met een enigszins sportieve fiets zou zoiets mijns inziens gewoon moeten kunne. Zo niet, dan zou ik de route aanpassen.

Al met al hadden we ons het einde toch wel heel anders voorgesteld, maar de dag zelf, de route, de organisatie, vrijwilligers en andere deelnemers maakten veel goed; het was echt een goed bezocht, maar niet te groot en daardoor heel gemoedelijk evenement. Uiteindelijk finishten we overigens, inclusief wachttijd aan het einde, in 3:01:56. Van tevoren had ik geen tijdsdoel bedacht en ook bij het zien van de tijd deed die me niet heel veel. Het was vooral mooi om samen een sportieve prestatie neer te zetten, leuke mensen te spreken en lekker bezig te zijn in een mooie, ons onbekende omgeving.

Pagina 1 of 57