Clusteranalyse stemwijzer 2017

Op de website van Ruben Woudsma staat een aantal analyses van de Stemwijzer 2017. Waar de Stemwijzer de antwoorden van partijen op 30 stellingen primair gebruikt om ze te vergelijken met de antwoorden van de kiezer (met welke partij komt de kiezer het meest overeen), vergelijkt Ruben ze met elkaar (welke partijen komen onderling het meest overeen). Dat levert een matrix op waarin je aan de scores kunt zie in hoeverre partijen met elkaar overeenkomen.

Zo’n matrix is mooi, maar naar mijn mening niet heel overzichtelijk. Het kost bijvoorbeeld best nog wat moeite om te zien dat de Partij voor de Dieren en GroenLinks dicht bij elkaar liggen (al helpen Rubens kleurtjes wel; zie vooral ook de rest van Rubens pagina). Daarom heb ik, op basis van dezelfde gegevens, een clusteranalyse uitgevoerd. Zo’n analyse heeft als voordeel dat je er een zogenaamd dendrogram mee kunt maken, zoals hieronder.

clusteranalyse_stemwijzer_2

Een dendrogram is een visualisatie van de overeenkomsten en verschillen (of afstand) tussen partijen op basis van hun antwoorden op de stellingen. De visualisatie neemt de vorm aan van een gekantelde boomstructuur, waardoor je in een oogopslag kunt zien welke partijen bij elkaar klitten (of clusteren) en welke partijen ver van elkaar afstaan. De schaal op de x-as is nu even niet relevant; waar het om gaat is welke groepen worden gevormd, waarbij afstand aangeeft hoe sterk het onderscheid is. Het grootste verschil kun je dus zien in de eerste vertakking vanaf links; de groep bestaande uit SGP, CDA, VVD, ChristenUnie, 50Plus en PVV verschilt het meest van de groep D66, PvdA, Partij voor de Dieren, GroenLinks en SP. Dat bevestigt aardig het onderscheid rechts-links.

Kijken we verder, dan zien we – nogmaals, puur op basis van de antwoorden op de stellingen – dat SGP en CDA dicht bij elkaar zitten, maar ook dat de VVD dichter bij dat groepje zit dan de ChristenUnie. Dit laat zien dat de VVD meer overeenkomst heeft met de SGP en het CDA dan dat de ChristenUnie dat heeft. Overigens is de positie van de ChristenUnie hier het zwakst. Bij een ander algoritme (‘complete linkage’ ipv ‘Ward’s method’ voor de geïnteresseerden) valt de partij namelijk in de onderste (linkse) tak, wat wel klopt met hun eigen positionering, volgens mij. De keuze voor de gepresenteerde clustering is de AC-waarde (agglomerative coefficient) die je links ziet; die geeft de sterkte van de clustering aan, waarbij 0 staat voor een willekeurige clustering en 1 voor een perfect-systematische clustering. De 0.76 is 0.2 hoger dan wanneer het algoritme wordt gebruikt waarbij de ChristenUnie opschuift naar links.

Een aparte groep op rechts is die van 50Plus en de PVV. Wat dat laat zien, is dat die groep minder gemeen heeft met de bovenste vier partijen dan dat die bovenste vier onderling gemeen hebben. Uiteraard hebben ze nog minder gemeen met de onderste vijf partijen.

Onderaan, bij de ‘linkse’ tak, zien we dat D66 en PvdA bij elkaar klitten, evenals de Partij voor de Dieren en GroenLinks, terwijl de SP meer met de laatste, dan met de eerste groep gemeen heeft.

Wat je ermee moet, weet ik niet, maar het is wel mooi te zien dat een clustering op basis van dertig ja/nee-vragen aardig overeenkomt met een intuïtief idee van het huidige politieke landschap. Wat je natuurlijk zou kunnen doen, als je nog ‘zweeft’, is het programma bekijken van de partij die het dichtst staat bij de partij waarmee je de meeste affiniteit hebt.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *