Jan van Bakel.



Kwantitatief

Vorige Entr'acte
Volgende Entr'acte
Terug naar Archief Entr'actes
Terug naar hoofdmenu.


Zou het de goede lezer opgevallen zijn dat in mijn Entre'actes tot nu toe tweemaal een woord van 28 letters is verschenen en wel histocompatibiliteitscomplex en intimiteit-met-het-werkwoord? En geen langere? Ik heb een beetje geaarzeld om u dit mee te delen. Want die mededeling brengt noodzakelijk een verstoring teweeg voor de volgende teller. Die vindt er nl. in één keer dubbel zoveel. En dat is als een verstoring te beschouwen, omdat de oorzaak ligt bij een dwaas die belang stelt in kwantitatieve gevens. Zoals ik. Ik heb dus wat tellingen uitgevoerd. Dat het in totaal gaat om 72207 woorden, waarvan 3620 van zeven letters, zoals bijvoorbeeld : evenmin althans cirkels zodanig citeren terwijl meisjes eenmaal opnieuw verband ervaren waarvan fysieke etters slechts woorden dichten tijdens gekende ellende, is natuurlijk niet zo gewichtig. Al is het wel een feit, zou Harry Mulisch (ook zeven, drie keer) zeggen.

Belangstelling voor kwantiteiten is in de taalkunde eigenlijk altijd een beetje verdacht geweest. Bijvoorbeeld in het begin van het computertijdperk, toen het rekenen door alfa's voor het eerst en eindelijk op enigszins betrouwbare wijze kon worden uitgevoerd, hoewel niemand zich kon voorstellen dat het van belang kon zijn dat je niet alleen kon zeggen dat iets waar was, maar ook hoevaak. Toen ons universitaire onderwijs op het einde van de jaren 60 van de vorige eeuw toch al behoorlijk ontspoord was, begonnen wij met derdejaars neerlandici kwantitatief vergelijkend onderzoek uit te voeren op de eigenschappen van de Metaal-CAO. De werkhypothese was dat de arbeiders door de Behörde bewust werden misleid door verhullende teksten. Als je dat gaat uitwerken kom je uit bij moeilijk taalgebruik. Je moet dus weten wat dat is. Je doet een veronderstelling : de taal van Ot en Sien is makkelijk, die van P.C. Hooft is moeilijk. Je doet honderdduizend metingen, bij wijze van spreken. Je vergelijkt de Metaal-CAO met reeksen van andere teksten en je ziet dat die van allemaal het dichtst bij Hooft staat. (Hoewel Potgieter toch nog "moeilijker" is.) Waarmee natuurlijk nog niks is bewezen, behalve dat het, binnen jouw definities, moeilijke tekst is. Wat alle onderzoek ook uitwees was dat je voor de hele kwestie van de moeilijkheid alleen naar de zinslengte hoefde te kijken. Want daarmee correleerde alles signifikant. En dan wordt alle kwantitatief taalonderzoek direct een platte trivialiteit. Hooft heeft een gemiddelde zinslengte van 27.72 woorden, de Metaal-CAO van 32.98, Ot en Sien van 5.95. De Entr'actes komen op 17.25. Reken maar uit : 4185 zinnen tegen 72207 woorden. Zeer exact maar volkomen zinloos.

U zult zeggen : waarom zit je daar dan mee te rommelen? Ja, als u het weet. Domme nieuwsgierigheid? Maar als u misschien wat kwantitatieve gegevens over de Entr'actes wenst? Maar bedenk : geparseerd (syntactisch geanalyseerd) zijn ze niet.

Jan van Bakel, 12 februari 2002.

Dit stukje: 487 woorden met gem. lengte van 4.83 letters. 35 zinnen met gem. lengte van 13.91 woorden. 46 7-letterwoorden.

janvanbakel.nl

Terug naar boven

Reactie? Bericht: jan.van.bakel@gmail.com.