Oorspronkelijk met de bedoeling een statistisch hulpmiddel te bouwen
voor zijn eigenlijke vakgebied, Historische Syntaxis, belandde
professor van Bakel langzamerhand steeds meer in de formele taalkunde. Zijn
onderwijsopdracht computerlinguïstiek werd een leeropdracht, en
vanaf 1985 is er met de aanzet tot de oprichting van TSI eindelijk
schot gekomen in de organisatie van iets als de vakgroep
computerlinguïstiek waar hij al in 1971 voor ijverde. Nu is hij
ongeveer aan zijn pensioen toe. Hij is buitengewoon hoogleraar en
begeleidt alleen nog wat mensen die op het terrein werkzaam zijn.
Het contact met studenten heeft altijd een grote rol gespeeld: ``De
studentenoppositie uit de late jaren zestig had een zeer progressieve
eis tot verandering in die oude troep van taalkunde. Zij eisten
dus generatieve grammatica. En dan sta je voor die groep van
studenten, en dan ga je daar maar aan beginnen.'' Hij is nog steeds
enthousiast. ``Hard werken en dan zien: `Verrek, hij doet het!' Dat is
het leukste wat er is.''
``Mijn eerste stappen op het terrein van de
computertoepassing met betrekking tot taal dateren van 1968. Ik
had toen een grammatica bewerkt voor Wolters. Dat was gewoon een
grammatica voor de opleiding voor middelbare akte en voor gebruik op
de universiteit. Ik heb toestemming gevraagd om ermee te doen wat ik
wilde, en dat mocht. En toen ben ik daaraan begonnen.
``Er was een rijke literatuur over de Nederlandse
grammatica die je in een handboek natuurlijk alleszins kunt toepassen
en gebruiken. Alleen op een bepaald terrein was er eigenlijk geen
literatuur. Dat was de syntaxis van het middenstuk van de zin. Het
beginstuk, dat is de PV vooraan
en de clustering van pronomina daaraan en de NP die daarover heen gezet
wordt. Daar zijn heel uitvoerige theorieën over. En ook over het
achterstuk van de zin, die in het Nederlands is verbrokkeld doordat de
persoonsvorm naar voren is gehaald. Maar over dat stuk daartussen in
is geen literatuur. En toen ik bezig was met die kwestie,
kwam ik tot de conclusie dat ik dat zelf uit zou moeten zoeken wat daar
over gezegd moest worden. Let wel, ik was structuralist, ik heb nooit
generatieve grammatica geleerd. Met de generatieve grammatica ben ik in
contact gekomen nadat ik me had bezig gehouden met computertoepassingen
en formele grammatica's. Toen ik computertoepassingen en formele
grammatica's had bestudeerd kwam ik later in de generatieve grammatica
terecht om te concluderen dat dat broertje en zusje waren.
``Hier in Nijmegen stond vanaf 1966 een IBM-machine. Op het
rekencentrum hadden we een staat hangen van de gebruiksfrequentie, het
toerekenen van de computer-uren naar afdelingen van de universiteit. Al
in 1969 was ik verschillende weken derde of tweede in produktief
gebruik.
Ik heb me daar toen ook wel in verdiept. Op een heel klungelachtige
manier, achteraf. Alles wat je toen las over computers ging over
het raamwerk van draadjes en magnetische ringetjes, waar je nu chips
voor hebt en ponskaarten, natuurlijk. Alles ging met ponskaarten.
``Automatisch vertalen bestond natuurlijk wel. Maar dat is
methodologisch een grote ratjetoe! Dat heeft nooit enige duidelijke
wetenschappelijke structuur gehad. Daardoor is dat natuurlijk ook
een grote mislukking geworden. Ik denk dat u wel gelezen heeft wat Hugo
Brandt Corstius over automatisch vertalen schrijft? Dat is in alle
toonaarden afwijzend ten opzichte van die zaak. In zoverre is dat juist
dat je er donder op kunt zeggen dat er nooit iets zinnigs bereikt wordt
in dat vak. Maar dat is met de bestrijding van de dood ook zo, daarom
schaf je toch de medische wetenschap niet af? Dat het automatisch vertalen
altijd gebrekkig zal zijn, weet ik ook wel.
``Dit is een publicatie van 1970 die uitgegeven is hier in het universitair
rekencentrum van de KU Nijmegen, "Automatische syntactische analyse van
Nederlandse teksten". Dat is kwantitatieve taalkunde, ziet u dat? Ik
heb een aantal teksten genomen en die gecodeerd volgens het systeem. De
teksten die ik daarvoor koos waren de `Ferguut' en de `Karel ende
Elegast'. Ik nam twee stukken van de `Karel ende Elegast', en die gooide
ik uit elkaar. Op die stukken deed ik kwantitatief onderzoek.
``Het is uitgelopen op een regelsysteem. Op de resultaten heb ik een
statistische toets gedaan. Ik heb gekeken hoeveel vaker het verschil
tussen de twee delen `Ferguut' significant verschilde van die twee delen
`Karel ende Elegast'. En daar kun je spreken over
een hele hoop statistische eigenschappen van zinnen. Als een zin uit
zes stukken bestaat, heeft elk van die stukken een syntactische
diepte. Als je naar `Ot en Sien' kijkt, hebben die stukken geen
diepte: Ot is niet thuis. Dat zijn vijf woorden en die hebben
geen inwendige syntactische structuur.
``Ik heb daar lange tijd heel uitvoerig onderzoek naar gedaan. Ik ben
ermee gestopt omdat er eigenlijk niets anders mogelijk is dan trieste
uitspraken, die bijvoorbeeld in de medische wetenschap ook bekend zijn,
zo van `als je dit gebruikt dan heb je zoveel kans dat er dat gaat
gebeuren'. En dat is misschien wel het meest bereikbare, maar als er
niet meer bereikbaar is, dan doe ik gewoon niet mee. Ik heb lange tijd
gezocht naar de mogelijkheid om een auteursconstante te vinden. Als je
kwantitatieve analyse zou doen en je zou kunnen zeggen "gut, dat is...".
Maar de ervaring wijst uit dat je geen twee tekstbestanden kunt nemen
van enige uitgebreidheid of er treden significante verschillen op.
Daarom ben ik ermee gestopt, maar ik heb lange tijd gezocht naar de
meetbaarheid van een zin.
``Mijn contact met Chomskiaanse grammatica dateert uit 1969, denk ik.
Ik was vroeger aangesteld voor historische taalkunde. Wat ik gaf was
oud-Germaans, Middelnederlands, Germanistiek en dat soort van dingen.
Dat was allemaal klankleer, want de hele historische taalkunde was
klankleer. Syntaxis, daar kon niemand iets zinnigs over zeggen.
``Professor Kraak heeft de historische verdienste dat hij op het eind
van de jaren zestig door zijn dissertatie over negatieve zinnen in
Nederland de introductor is geweest van de generatieve grammatica van
Chomsky. Chomsky is bezig vanaf 1954, maar het duurt een hele tijd eer
dat doordringt in Europa. Het is heel interessant om te kijken wat er
allemaal over Chomsky is geschreven in de vroege jaren, maar het
begrip was zeer gebrekkig.
``Ik had toen een taak voor historische taalkunde aan studenten
Nederlands. De studentenoppositie uit de late jaren zestig had een zeer
progessieve eis met een verandering in die oude troep van taalkunde.
Die zeiden: `Ja luister eens hier, al dat gedonder met die oude troep,
laten we nou eens ergens anders over praten! Je kunt toch zo niet
bezig blijven!' Zij eisten dus generatieve grammatica. Niet omdat ze
dat kenden, maar omdat ze wel wisten dat het natuurlijk niet aanging
om een onderwijsprogramma te ontwikkelen zonder dat daar generatieve
grammatica inzat. En dan sta je dus voor die groepen van studenten,
dan ga je er maar aan beginnen.
In samenhang met wat er in die colleges werd besproken zijn
we samen in de literatuur gedoken om te kijken wat er was. Er was nog
bijna niets, hoor. Wat er toen was, was een artikel van ene Spa, over
generatieve fonologie. Dat was Nederlands, maar
in het buitenland was er ook niets. The Sound Pattern van
Chomsky en Halle was er nog lang niet. Aspects en
Syntactic Structures waren er al wel, maar ja, ik gaf
klankleer.
``Wij hebben bij computationele taalkunde altijd op dit standpunt gestaan:
"De taalkunde zegt dat ze formeel is, dat zullen we dan wel eens
bekijken." En dan kijken we wat de status van zo'n grammatica is. Als
dat werkelijk formeel is, moet je dat kunnen implementeren. En als je
dat gaat implementeren, wat kun je er dan mee doen? Slaat dat ergens
op, waar is dat voor? Wat kun je er wel mee, wat kun je er niet mee?
Wat zijn de dingen die niet formaliseerbaar zijn? Dat zijn dus een
aantal methodologische vragen rond een formele status van de
taalwetenschap. Wanneer iemand zegt: `Wij presenteren een formeel
kader', dan is de vraag van de computerlinguïst: `Klopt dat en
kun je er wat mee doen?' Een grammatica maken zoals Chomsky doet en
dan niet kijken of het klopt, dat vind ik zoiets doms!
``We hebben altijd als centraal idee willen handhaven, en
ik denk gehandhaafd, dat de dingen moeten worden bezien vanuit hun
linguïstische relevantie. Ik bedoel: het idee dat je je
bezighoudt met linguïstische problemen, dat wordt nooit
bijzaak. Dat blijft altijd hoofdzaak. Het gaat er dus niet om een
computer een zinnetje te laten vertalen, het gaat erom of hij dat doet
volgens theorieen die linguïstisch interessant zijn. Als dat niet
interessant is, moet je een japannertje kopen die die zinnetjes
laat zien. En dat is toch niet interessant! Het gaat om
linguïstische motivatie.
``Neurale netten? Ach, toen de stoommachine werd uitgevonden,
vond iedereen dat toch wel iets wat het menselijk model zeer dicht
benaderde. En deze domme vergissing zijn ze bezig te herhalen nadat de
computer is uitgevonden. Ik heb een kanarie in een kooitje, die
kunstjes op een stokje kan uitvoeren, waarvan het simulatiemodel
onoverzienbaar zou zijn. Onoverzienbaar! Dan heb je het nog helemaal
niet over menselijke capaciteiten. Dan heb je niets anders dan het
handhaven van evenwicht en het zich verplaatsen in de lucht.
``Die vakgroep is nooit gesticht. Wat er in formele zin gebeurd is,
is dat er in 1975 een onderwijsopdracht is gegeven voor
computerlinguïstiek. Ik ben toen in dat jaar hoogleraar geworden, maar
ik werd hoogleraar in de historische syntaxis van het Nederlands.
Historische syntaxis was een discipline die door gedetailleerd onderzoek
in Nederlandse taaldocumenten zou komen tot uitspraken over
ontwikkelingen van de Nederlandse syntaxis. Tegenwoordig hoeft dat
allemaal niet meer, want iedereen is veel meer geïnteresseerd in wat er
allemaal kan gebeuren en in wat er gebeurt, interesseert ze niks.
Wat er kan gebeuren, is bekend, want dat laat de theorie zien.
En daarbij had ik een onderwijsopdracht computerlinguïstiek. Dat
betekent dat je daarvoor colleges mag inrichten. In eerste instantie
waren dat colleges die gevolgd konden worden door studenten Nederlands
als bijvak. Dat kon geleidelijk aan ook voor studenten van andere
afdelingen. Op zeker moment werd dat een onderdeel binnen de
algemene disciplines. Je had een studieprogramma waar de student een
bepaald deel van zijn tijd vrij is om te kiezen voor dingen van
algemene aard, bijvoorbeeld algemene taalwetenschap, toegepaste
taalkunde en ook computerlinguïstiek. Gaandeweg kregen we daar
steeds meer belangstelling voor. Toen heeft de faculteit gevraagd
om meer mogelijkheden voor studenten te creëren, zodat ze dus niet
alleen de inleidende cursus computerlinguïstiek konden volgen, maar
ook iets voortgezets daarin. En zo kwam er dan tenslotte een
onderwijspakketje tevoorschijn.
``Ik had een onderwijsopdracht voor computerlinguïstiek in het begin van
de jaren zeventig en die onderwijs opdracht moest jaarlijks worden
vernieuwd, die is niet voor het leven. Dus elk jaar moest het bestuur
schrijven van "Wilt U deze man opnieuw voor een jaar benoemen voor een
onderwijsopdracht computerlinguïstiek...". Toen zei het College van
Bestuur, kunnen jullie er niet een leeropdracht van maken, dan hoeven
we dat niet elk jaar te doen. Zo heb ik een leeropdracht
computerlinguïstiek gekregen. En daar heeft dit allemaal onder plaats
gehad.
``Vanaf 1985 zijn we hier binnen de universiteit komen te
spreken over het bij elkaar brengen van verschillende disciplines
binnen een vakgroep, over het bij elkaar brengen van verwante
activiteiten binnen de faculteit.
Daarvoor zouden dan een aantal dingen bij elkaar genomen worden, die net
zoveel met elkaar te maken hebben als neo-natologie en geriatrie, zoals
bijvoorbeeld signaalanalyse bij fonetiek met corpuslinguïstisch
onderzoek van de afdeling Engels en wat er binnen de afdeling
Computerlinguïstiek bezig was. Computerlinguïstiek was dus een
afdeling, dat had geen enkele status, dat was niets anders dan een
woord op papier. En er was een leeropdracht, die hing gewoon in de lucht.
Dat was dus geen organisatiemilieu waarin
dat paste. Ook promovendi waren er nog niet. Onlangs is Peter-Arno
Coppen gepromoveerd, hij is eigenlijk de eerste promovendus op het
terrein van de computerlinguïstiek geweest. Die dingen werden dus op
de faculteit samengebracht in een vakgroep, de vakgroep Taal en
Spraak. En binnen de vakgroep Taal en Spraak is er een studieprogramma
Taal, Spraak en Informatica. Dat is natuurlijk wel mooi. Dat is voor
het eerst dat het een status heeft.''
(Anne-Marie Mineur)
|