Website van Alex Reuneker over taal, hardlopen, wielrennen en reizen

Welke 'De Avonden' dit jaar?

Al jaren lees ik van 22 december tot en met oudjaar De avonden van Gerard Reve. Zo'n traditie vind ik heerlijk, niet in de laatste plaats omdat je weet dat je niet alleen bent – je bent natuurlijk bij de beslommeringen van Frits van Egters, maar ik bedoel vooral dat er nog meer mensen zijn die precies op deze dagen steeds een hoofdstuk uit deze literaire klassieker lezen. Zie daarvoor overigens ook het commentaar op https://neerlandistiek.nl/2025/12/zo-ver-weg-van-och-jeetje-achguttoch en lees dan vooral ook de mooie recensie van Marc van Oostendorp van Eric de Rooijs Uit tallozen, jij.

Toch is een beetje variatie op z'n tijd ook niet vervelend. Zo las ik vorig jaar voor de verandering eens de 'verstripping' van Dick Matena, het jaar ervoor, als ik het me goed herinner, de tweede druk en het jaar daarvoor de eerste. Ook heb ik een jaar met veel genoegen het luisterboek op cd beluisterd (inmiddels natuurlijk ook al weer hartstikke ouderwets), waarop een al oude Reve het boek voorleest. Heerlijk. Maar wat blijft er dan over voor dit jaar?

De Avonden in Engelse vertaling

De Avonden' in Engelse vertaling

Niet lang na het verschijnen ervan staat hier ook de Engelse vertaling The Evenings in de kast, maar die uitgave heb ik nog steeds niet gelezen. Dat wordt 'm dus dit jaar. Afkicken van moeders 'hoei boei'? Misschien, want dat is in de vertaling van Sam Garret goodness gracious geworden, dat ik overigens toch vooral uit Jerry Lee Lewis' Great Balls of Fire ken.

Hirsch-Popescu Point added to Lexical Diversity Calculator

The Hirsch-Popescu Point (Popescu & Altmann, 2006) is an interesting metric to assess repetition in a text. It is determined by first calculating the frequency distribution of all words in the text. Then, words are ranked from the most frequent to the least frequent. The H-P Point is then defined as 'the point in which the ranking of a word in the distribution matches its frequency, just like the h-index in academia' (see Nunes, Ordanini, Valsesia, 2017, p. 20; Hirsh, 2005). Indeed, the h-index is a well-known measure of productivity and citation impact of publications. The smaller the H-P point, the less repetition a text contains and vice versa, i.e, the greater the HP-point, the more repetition a text contains.

If we apply the calculation to an example text, we easily see how it works exactly. The text used here is Sylvia Plath’s poem 'Lady Lazarus' (1965), and the resulting frequency table (distribution of words) can be seen below.

Word distribution in https://www.poetryfoundation.org/poems/49000/lady-lazarus”>Sylvia Plath’s poem ‘Lady Lazarus’ (1965)

Word distribution in Sylvia Plath’s poem ‘Lady Lazarus’ (1965)

In this table, we see that the word of occurs eight times in the poem, and it is also ranked at position eight in order from most to least frequent words. Therefore, 8 is the H-P Point. Of course, this frequency table, the sorting and determining the actual point at which frequency and order coincide is done by the Lexical Diversity Calculator for you, as can be seen below.

The Hirsch-Popescu Point as calculated by the Lexical Diversity Calculator

The Hirsch-Popescu Point as calculated by the Lexical Diversity Calculator

As always, if you find it useful, have fun!

'Ben stil' of 'wees stil'?

In de aanstaande publicatie ‘Onthoud de gebiedende wijs! De spelling van de gebiedende wijs in het voortgezet onderwijs’ in Tijdschrift voor Nederlandse Taal- en Letterkunde (TNTL) die ik samen met Franka Hogewoning schreef, zochten we uit hoe het nu precies zit met de gebiedende wijs wees, als in ‘Wees nou eens stil!’. Je hoort tegenwoordig ook wel ‘Ben stil’, maar die vorm lijkt toch nog niet helemaal doorgebroken. Wat is het verhaal?

'Wees nou eens stil!'. Foto door Kristina Flour op Unsplash

'Wees nou eens stil!'. Foto door Kristina Flour op Unsplash

Persoonsvormen zijn werkwoordsvormen die congrueren met hun onderwerp en die aanduiden of een gebeurtenis of een situatie gelijktijdig ofwel voortijdig is aan het spreekmoment. In de Algemene Nederlandse Spraakkunst wordt de gebiedende wijs een persoonsvorm genoemd, ook al is het onderwerp van de zin niet uitgedrukt, zoals in ‘Ga zitten.’ (Haeseryn et al. 1997: 44). In de traditionele grammatica heeft de gebiedende wijs twee vormen. De eerste en meest gebruikte vorm is gelijk aan de stam of eerste persoon enkelvoud tegenwoordige tijd (zie o.a. Van der Velde 1956: 77; Nederlandse Taalunie 2005: 75). Zo stelt Onze Taal dat in ‘Word lid van Onze Taal’ […] word een gebiedende wijs [is] en die is gelijk aan de ik-vorm van het werkwoord. Er komt dus geen t achter word.’ In sommige bronnen wordt vermeld dat de vorm gelijk is aan ‘de vorm van het werkwoord die hoort bij de tweede persoon, met jij erachter’ (Renkema 2020: 451; zie ook Den Hertog 1903: 39). Die laatste omschrijving lijkt, ook getuige de opmerking ‘we mogen noem als vorm voor de 1e pers. enkelvoud niet gelijkstellen met noem als vorm voor de gebiedende wijs, zoals vergelijking met ben en wees leert’ in de Spraakkunst van Rijpma en Schuringa (1972: 69), als instructie, ingewikkelder, maar wel correcter. Hieronder laten we zien wat dat nu met wees te maken heeft.

Bij enkele vormen is de specifieke werkwoordsvorm voor de gebiedende wijs in gebruik gebleven en daarin zien we de overeenkomst met de persoonsvorm van de tweede persoon enkelvoud, zoals in ‘Wees jij nu eens stil!/Wees nu eens stil!’ en niet met die van de eerste persoon enkelvoud, zoals in ‘Ik ben stil./? Ben nu eens stil!’ Hier zien we tevens waarom de gebiedende wijs als persoonsvorm wordt gezien; wees is de specifieke vorm die hoort bij de gebiedende wijs van het werkwoord zijn. De gebiedende wijs ben lijkt wel in opkomst te zijn, maar behoort volgens de Algemene Nederlandse Spraakkunst (nog) niet tot de standaardtaal (Haeseryn et al. 1997: 66-67). Wel speelt regio een rol (Onze Taal). Proeme stelt dat ‘de persoonsvormen in imperativuszinnen geheel overeenkomen met persoonsvormen in mededelende zinnen’ en dat er daarom in imperatiefzinnen, net als in mededelende zinnen, ook werkwoordsvormen voor kunnen komen die niet in tegenwoordige tijd staan (1984: 248).

Volgens De Haan (1986: 253) is de gebiedende wijs als specifieke werkwoordsvorm door taalverandering verdwenen, op ‘een relict als de vorm wees bij zijn’ na. De infinitief zijn is, volgens het Woordenboek der Nederlandsche Taal, een jongere pendant van wezen die in het Middelnederlands al sterk aanwezig is. Toch blijft wezen ook buiten de gebiedende wijs nog tot in de twintigste eeuw in gebruik, vooral in geschreven taal (WNT). Vroeger was er een aparte vorm voor de gebiedende wijs, maar de gebiedende wijs is veranderd in een zinstype dat voldoet aan een of meer kenmerken, zoals het ontbreken van een onderwerp, een persoonsvorm die vooraan staat in de zin, een werkwoordsvorm die bestaat uit de stam en in de tegenwoordige tijd staat. De opmars van zijn ten koste van wezen lijkt echter (nog) niet de imperatief wees te hebben verdrongen.

Lees, om toch maar af te sluiten met een gebiedende wijs, binnenkort meer in het komende nummer van Tijdschrift voor Nederlandse Taal- en Letterkunde (TNTL).

La la la

In Nederlandse liedteksten doet la het uitermate goed. In 'Dans je de hele nacht mij?' van De Sjonnies (1995) bijvoorbeeld komt het 279 keer voor – ja, 279 keer! Dat betekent dat bijna 65 procent van alle 433 woorden in deze meezinger la is. Ook klankverwanten ah, na en da blijken populair, zoals in Suzan en Freeks hit 'Onderweg Naar Later' uit 2021: 'Ik hoop dat het iets is wat nog blijft als het straks zomer is geweest na na na [...]'.

De Sjonnies (afbeelding van [YouTube](https://youtu.be/8rzw1eUfbZo?si=3XO4mW9zk-Au605i))

De Sjonnies (afbeelding van YouTube)

Samen met collega's Milou Andree en Vivien Waszink zoek ik momenteel nog veel meer uit over Nederlandstalige popmuziek. Later meer, maar voor nu gewoon lekker meezingen met De Sjonnies: https://youtu.be/8rzw1eUfbZo?si=3XO4mW9zk-Au605i.

N-gram generator now capable of logographic n-grams

As per request, I have added an option to the n-gram generator to treat text not solely as word-based, but also as character-based/logographic text. This enables analyzing texts in, for instance, Mandarin Chinese.

Logographic n-grams in the n-gram generator

Logographic n-grams in the n-gram generator

As my knowledge of character-based languages is virtually non-existent, the feature is rudimentary at this moment, although two researchers of Mandarin Chinese did test the tool and evaluate the output. With respect to Chinese, a limitation pointed out to me by Maarten Bogaards, is that the character-based script does not have spaces, and the calculator basically treats each individual character as one word, even though words can consist of multiple characters. A Chinese sample text to test with can now also be loaded, and is a sample of Mei Yuan's 隨園詩話, taken from Project Gutenberg.

One of the things I added after testing was the removal of following punctuation marks, which are different in Chinese, namely 。,、“‘’”《》…·:?!;()and ,. You might not see the difference in all marks, but they are non-utf-8 counterparts, which, for computers at least, are a different beast. You can also enter additional characters to exclude if you so wish.

Pagina 1 of 57