Dit interview is verschenen in Ta!, het Nederlandse studentenblad voor computationele taalkunde, jaargang I, nummer 1.
© Alle rechten voorbehouden aan Ta!

Professor van Bakel:

``Een grammatica maken zoals Chomsky doet, en dan niet kijken of het klopt, dat vind ik zoiets doms.''

Hugo Brandt Corstius zei: in 1970 waren ze de enigen die in Nederland aan computationele taalkunde deden, en in 1975 waren ze nog met zijn tweeën.

Oorspronkelijk met de bedoeling een statistisch hulpmiddel te bouwen voor zijn eigenlijke vakgebied, Historische Syntaxis, belandde professor van Bakel langzamerhand steeds meer in de formele taalkunde. Zijn onderwijsopdracht computerlinguïstiek werd een leeropdracht, en vanaf 1985 is er met de aanzet tot de oprichting van TSI eindelijk schot gekomen in de organisatie van iets als de vakgroep computerlinguïstiek waar hij al in 1971 voor ijverde. Nu is hij ongeveer aan zijn pensioen toe. Hij is buitengewoon hoogleraar en begeleidt alleen nog wat mensen die op het terrein werkzaam zijn.

Het contact met studenten heeft altijd een grote rol gespeeld: ``De studentenoppositie uit de late jaren zestig had een zeer progressieve eis tot verandering in die oude troep van taalkunde. Zij eisten dus generatieve grammatica. En dan sta je voor die groep van studenten, en dan ga je daar maar aan beginnen.'' Hij is nog steeds enthousiast. ``Hard werken en dan zien: `Verrek, hij doet het!' Dat is het leukste wat er is.''

``Mijn eerste stappen op het terrein van de computertoepassing met betrekking tot taal dateren van 1968. Ik had toen een grammatica bewerkt voor Wolters. Dat was gewoon een grammatica voor de opleiding voor middelbare akte en voor gebruik op de universiteit. Ik heb toestemming gevraagd om ermee te doen wat ik wilde, en dat mocht. En toen ben ik daaraan begonnen.

``Er was een rijke literatuur over de Nederlandse grammatica die je in een handboek natuurlijk alleszins kunt toepassen en gebruiken. Alleen op een bepaald terrein was er eigenlijk geen literatuur. Dat was de syntaxis van het middenstuk van de zin. Het beginstuk, dat is de PV vooraan en de clustering van pronomina daaraan en de NP die daarover heen gezet wordt. Daar zijn heel uitvoerige theorieën over. En ook over het achterstuk van de zin, die in het Nederlands is verbrokkeld doordat de persoonsvorm naar voren is gehaald. Maar over dat stuk daartussen in is geen literatuur. En toen ik bezig was met die kwestie, kwam ik tot de conclusie dat ik dat zelf uit zou moeten zoeken wat daar over gezegd moest worden. Let wel, ik was structuralist, ik heb nooit generatieve grammatica geleerd. Met de generatieve grammatica ben ik in contact gekomen nadat ik me had bezig gehouden met computertoepassingen en formele grammatica's. Toen ik computertoepassingen en formele grammatica's had bestudeerd kwam ik later in de generatieve grammatica terecht om te concluderen dat dat broertje en zusje waren.

``Hier in Nijmegen stond vanaf 1966 een IBM-machine. Op het rekencentrum hadden we een staat hangen van de gebruiksfrequentie, het toerekenen van de computer-uren naar afdelingen van de universiteit. Al in 1969 was ik verschillende weken derde of tweede in produktief gebruik. Ik heb me daar toen ook wel in verdiept. Op een heel klungelachtige manier, achteraf. Alles wat je toen las over computers ging over het raamwerk van draadjes en magnetische ringetjes, waar je nu chips voor hebt en ponskaarten, natuurlijk. Alles ging met ponskaarten.

Kwantitatieve Taalkunde

``Ik was dus structuralist. Ik heb toen een paar zaterdagse couranten genomen, uitgeknipt, en al die zinnetjes op kaarten geplakt en dat werd zo'n bak, en die heb ik door studentassistenten kwantitatief laten rubriceren en analyseren en daar kwam naar verloop van tijd een systeem uit waarin je zegt van kijk, dit is van type 1-2-3-4, en dit is van type 1-2-4-3. En dat was allemaal zo exact dat ik dacht wat is dat een onzin om dat niet op de een of andere manier te formaliseren! Daar ben ik toen mee begonnen kort nadat die grammatica verschenen was. Zodoende was mijn eerste werkzaamheid met betrekking tot computertoepassing op het gebied van de taal, een methode om aan de woorden een code toe te kennen, een code met betrekking tot het woordsoortkarakter van het woord en met betrekking tot de syntactische grens die er achter ligt. Nou zult u zeggen: Hoezo? Maar u moet al deze dingen plaatsen in een periode waarin er van formele grammatica's met betrekking tot het Nederlands niets was. Dat was traditionele grammatica, de structuralistische grammatica. Dat was in de sfeer van Bloomfield en de school van A.W. de Groot in Utrecht.

``Automatisch vertalen bestond natuurlijk wel. Maar dat is methodologisch een grote ratjetoe! Dat heeft nooit enige duidelijke wetenschappelijke structuur gehad. Daardoor is dat natuurlijk ook een grote mislukking geworden. Ik denk dat u wel gelezen heeft wat Hugo Brandt Corstius over automatisch vertalen schrijft? Dat is in alle toonaarden afwijzend ten opzichte van die zaak. In zoverre is dat juist dat je er donder op kunt zeggen dat er nooit iets zinnigs bereikt wordt in dat vak. Maar dat is met de bestrijding van de dood ook zo, daarom schaf je toch de medische wetenschap niet af? Dat het automatisch vertalen altijd gebrekkig zal zijn, weet ik ook wel.

``Dit is een publicatie van 1970 die uitgegeven is hier in het universitair rekencentrum van de KU Nijmegen, "Automatische syntactische analyse van Nederlandse teksten". Dat is kwantitatieve taalkunde, ziet u dat? Ik heb een aantal teksten genomen en die gecodeerd volgens het systeem. De teksten die ik daarvoor koos waren de `Ferguut' en de `Karel ende Elegast'. Ik nam twee stukken van de `Karel ende Elegast', en die gooide ik uit elkaar. Op die stukken deed ik kwantitatief onderzoek.

``Het is uitgelopen op een regelsysteem. Op de resultaten heb ik een statistische toets gedaan. Ik heb gekeken hoeveel vaker het verschil tussen de twee delen `Ferguut' significant verschilde van die twee delen `Karel ende Elegast'. En daar kun je spreken over een hele hoop statistische eigenschappen van zinnen. Als een zin uit zes stukken bestaat, heeft elk van die stukken een syntactische diepte. Als je naar `Ot en Sien' kijkt, hebben die stukken geen diepte: Ot is niet thuis. Dat zijn vijf woorden en die hebben geen inwendige syntactische structuur.

``Ik heb daar lange tijd heel uitvoerig onderzoek naar gedaan. Ik ben ermee gestopt omdat er eigenlijk niets anders mogelijk is dan trieste uitspraken, die bijvoorbeeld in de medische wetenschap ook bekend zijn, zo van `als je dit gebruikt dan heb je zoveel kans dat er dat gaat gebeuren'. En dat is misschien wel het meest bereikbare, maar als er niet meer bereikbaar is, dan doe ik gewoon niet mee. Ik heb lange tijd gezocht naar de mogelijkheid om een auteursconstante te vinden. Als je kwantitatieve analyse zou doen en je zou kunnen zeggen "gut, dat is...". Maar de ervaring wijst uit dat je geen twee tekstbestanden kunt nemen van enige uitgebreidheid of er treden significante verschillen op. Daarom ben ik ermee gestopt, maar ik heb lange tijd gezocht naar de meetbaarheid van een zin.

Chomsky

``Hugo Brandt Corstius gebruikte formele grammatica's. Hij had natuurlijk een heel andere scholing achter de rug dan ik. Hij was wiskundige, hij heeft jarenlang in Amsterdam gezeten vlak bij het Mathematisch Centrum. Hugo was het met mijn werk helemaal niet eens. Nogal logisch, ik ook niet, achteraf. Het is later geweest, in een veel latere situatie, dat ik vanuit een afdeling hier binnen de faculteit werd benaderd om eens iets te zeggen ter advisering van corpuslinguïstisch onderzoek. Wat ik daar gedaan heb, ging dan wel over kleine corpora, maar dat was toch gewoon corpuslinguïstisch onderzoek. En toen heb ik tegen die mensen gezegd: stop, kijk in vredesnaam niet naar dat boekje, maar ontwikkel formele grammatica's!

``Mijn contact met Chomskiaanse grammatica dateert uit 1969, denk ik. Ik was vroeger aangesteld voor historische taalkunde. Wat ik gaf was oud-Germaans, Middelnederlands, Germanistiek en dat soort van dingen. Dat was allemaal klankleer, want de hele historische taalkunde was klankleer. Syntaxis, daar kon niemand iets zinnigs over zeggen.

``Professor Kraak heeft de historische verdienste dat hij op het eind van de jaren zestig door zijn dissertatie over negatieve zinnen in Nederland de introductor is geweest van de generatieve grammatica van Chomsky. Chomsky is bezig vanaf 1954, maar het duurt een hele tijd eer dat doordringt in Europa. Het is heel interessant om te kijken wat er allemaal over Chomsky is geschreven in de vroege jaren, maar het begrip was zeer gebrekkig.

``Ik had toen een taak voor historische taalkunde aan studenten Nederlands. De studentenoppositie uit de late jaren zestig had een zeer progessieve eis met een verandering in die oude troep van taalkunde. Die zeiden: `Ja luister eens hier, al dat gedonder met die oude troep, laten we nou eens ergens anders over praten! Je kunt toch zo niet bezig blijven!' Zij eisten dus generatieve grammatica. Niet omdat ze dat kenden, maar omdat ze wel wisten dat het natuurlijk niet aanging om een onderwijsprogramma te ontwikkelen zonder dat daar generatieve grammatica inzat. En dan sta je dus voor die groepen van studenten, dan ga je er maar aan beginnen. In samenhang met wat er in die colleges werd besproken zijn we samen in de literatuur gedoken om te kijken wat er was. Er was nog bijna niets, hoor. Wat er toen was, was een artikel van ene Spa, over generatieve fonologie. Dat was Nederlands, maar in het buitenland was er ook niets. The Sound Pattern van Chomsky en Halle was er nog lang niet. Aspects en Syntactic Structures waren er al wel, maar ja, ik gaf klankleer.

Formeel

``Deze papieren zijn heel oud. Topics in compilerwriting, dat is een college van ene Andries van Dam. Uit deze omgeving kende ik Chomsky wel, uit de andere omgeving, de taalkunde niet. Toen ik dus de generatieve grammatica indook ontdekte ik eigenlijk wel dat dat wat zijn manier van praten betreft aansloot bij datgene wat er in deze omgevingen aan de orde was. Ik had eigenlijk al besloten me bezig te houden met computerdingen, en niet met de generatieve grammatica. Ik mag natuurlijk niet zeggen dat ze precies hetzelfde zijn, want daar heb ik al heel wat ruzies door ondervonden, maar formeel is het in elk geval wel vlak bij elkaar.

``Wij hebben bij computationele taalkunde altijd op dit standpunt gestaan: "De taalkunde zegt dat ze formeel is, dat zullen we dan wel eens bekijken." En dan kijken we wat de status van zo'n grammatica is. Als dat werkelijk formeel is, moet je dat kunnen implementeren. En als je dat gaat implementeren, wat kun je er dan mee doen? Slaat dat ergens op, waar is dat voor? Wat kun je er wel mee, wat kun je er niet mee? Wat zijn de dingen die niet formaliseerbaar zijn? Dat zijn dus een aantal methodologische vragen rond een formele status van de taalwetenschap. Wanneer iemand zegt: `Wij presenteren een formeel kader', dan is de vraag van de computerlinguïst: `Klopt dat en kun je er wat mee doen?' Een grammatica maken zoals Chomsky doet en dan niet kijken of het klopt, dat vind ik zoiets doms!

``We hebben altijd als centraal idee willen handhaven, en ik denk gehandhaafd, dat de dingen moeten worden bezien vanuit hun linguïstische relevantie. Ik bedoel: het idee dat je je bezighoudt met linguïstische problemen, dat wordt nooit bijzaak. Dat blijft altijd hoofdzaak. Het gaat er dus niet om een computer een zinnetje te laten vertalen, het gaat erom of hij dat doet volgens theorieen die linguïstisch interessant zijn. Als dat niet interessant is, moet je een japannertje kopen die die zinnetjes laat zien. En dat is toch niet interessant! Het gaat om linguïstische motivatie.

``Neurale netten? Ach, toen de stoommachine werd uitgevonden, vond iedereen dat toch wel iets wat het menselijk model zeer dicht benaderde. En deze domme vergissing zijn ze bezig te herhalen nadat de computer is uitgevonden. Ik heb een kanarie in een kooitje, die kunstjes op een stokje kan uitvoeren, waarvan het simulatiemodel onoverzienbaar zou zijn. Onoverzienbaar! Dan heb je het nog helemaal niet over menselijke capaciteiten. Dan heb je niets anders dan het handhaven van evenwicht en het zich verplaatsen in de lucht.

Status

``Ik heb geprobeerd tot organisatie van werkzaamheden op het terrein van computerlinguïstiek te komen in ongeveer 1970 - 1971. Toen heb ik de faculteit voorstellen gedaan voor de inrichting van wat ik toen dacht als een vakgroep voor computerlinguïstiek. Mijn voorstel toen, en daar heb ik wat steun bij gezocht van andere afdelingen binnen de faculteit, was om een vakgroep in te richten die meer disciplinair zou zijn. Dat wil zeggen een vakgroep waarin deelname zou zijn van verschillende traditionele sekties als Nederlands, Duits, Frans en dat soort richtingen.

``Die vakgroep is nooit gesticht. Wat er in formele zin gebeurd is, is dat er in 1975 een onderwijsopdracht is gegeven voor computerlinguïstiek. Ik ben toen in dat jaar hoogleraar geworden, maar ik werd hoogleraar in de historische syntaxis van het Nederlands. Historische syntaxis was een discipline die door gedetailleerd onderzoek in Nederlandse taaldocumenten zou komen tot uitspraken over ontwikkelingen van de Nederlandse syntaxis. Tegenwoordig hoeft dat allemaal niet meer, want iedereen is veel meer geïnteresseerd in wat er allemaal kan gebeuren en in wat er gebeurt, interesseert ze niks. Wat er kan gebeuren, is bekend, want dat laat de theorie zien.

En daarbij had ik een onderwijsopdracht computerlinguïstiek. Dat betekent dat je daarvoor colleges mag inrichten. In eerste instantie waren dat colleges die gevolgd konden worden door studenten Nederlands als bijvak. Dat kon geleidelijk aan ook voor studenten van andere afdelingen. Op zeker moment werd dat een onderdeel binnen de algemene disciplines. Je had een studieprogramma waar de student een bepaald deel van zijn tijd vrij is om te kiezen voor dingen van algemene aard, bijvoorbeeld algemene taalwetenschap, toegepaste taalkunde en ook computerlinguïstiek. Gaandeweg kregen we daar steeds meer belangstelling voor. Toen heeft de faculteit gevraagd om meer mogelijkheden voor studenten te creëren, zodat ze dus niet alleen de inleidende cursus computerlinguïstiek konden volgen, maar ook iets voortgezets daarin. En zo kwam er dan tenslotte een onderwijspakketje tevoorschijn.

``Ik had een onderwijsopdracht voor computerlinguïstiek in het begin van de jaren zeventig en die onderwijs opdracht moest jaarlijks worden vernieuwd, die is niet voor het leven. Dus elk jaar moest het bestuur schrijven van "Wilt U deze man opnieuw voor een jaar benoemen voor een onderwijsopdracht computerlinguïstiek...". Toen zei het College van Bestuur, kunnen jullie er niet een leeropdracht van maken, dan hoeven we dat niet elk jaar te doen. Zo heb ik een leeropdracht computerlinguïstiek gekregen. En daar heeft dit allemaal onder plaats gehad.

``Vanaf 1985 zijn we hier binnen de universiteit komen te spreken over het bij elkaar brengen van verschillende disciplines binnen een vakgroep, over het bij elkaar brengen van verwante activiteiten binnen de faculteit. Daarvoor zouden dan een aantal dingen bij elkaar genomen worden, die net zoveel met elkaar te maken hebben als neo-natologie en geriatrie, zoals bijvoorbeeld signaalanalyse bij fonetiek met corpuslinguïstisch onderzoek van de afdeling Engels en wat er binnen de afdeling Computerlinguïstiek bezig was. Computerlinguïstiek was dus een afdeling, dat had geen enkele status, dat was niets anders dan een woord op papier. En er was een leeropdracht, die hing gewoon in de lucht. Dat was dus geen organisatiemilieu waarin dat paste. Ook promovendi waren er nog niet. Onlangs is Peter-Arno Coppen gepromoveerd, hij is eigenlijk de eerste promovendus op het terrein van de computerlinguïstiek geweest. Die dingen werden dus op de faculteit samengebracht in een vakgroep, de vakgroep Taal en Spraak. En binnen de vakgroep Taal en Spraak is er een studieprogramma Taal, Spraak en Informatica. Dat is natuurlijk wel mooi. Dat is voor het eerst dat het een status heeft.''

(Anne-Marie Mineur)


Terug naar boven