9803.a Terug
Vooruit 9803.02

Col: 9803.01

Date: Sat, 7 Mar 1998 18:47:57 +0100
From: Marc van Oostendorp <oostendo@euronet.nl>
Subject: Col: 9803.01: Column Marc van Oostendorp: NederNed, no. 20: Nieuwe woorden

NederNed, no. 20: Nieuwe woorden

In Onze Taal wordt sinds enige tijd een discussie gevoerd over de vraag hoe snel de woordenschat van het Nederlands groeit. Vorig jaar schreef Frank Jansen in het blad dat er zestig woorden per dag bij komen. Een paar maanden later schreef Joop van der Horst in het onzetaalboek Taalalmanak dat deze telling overdreven was: volgens hem komt er maar één woord per dag bij. In het laatste nummer van het blad komt Jansen dan weer op de kwestie terug. Volgens hem was zijn schatting eerder te laag dan te hoog.

Een opmerkelijk aspect aan de hele discussie is dat ze zo duidelijk vanachter de leestafel wordt gevoerd. Jansen en Van der Horst `bewijzen' hun stellingen door nummers van NRC Handelsblad en enkele andere kranten door te nemen, en de woorden die ze vinden te vergelijken met de woorden in gedrukte woordenboeken. Woorden op radio en woorden op televisie tellen niet mee, en de woorden op Internet evenmin.

Terwijl de laatste zo gemakkelijk te tellen zijn. In zijn laatste artikel geeft Jansen 54 voorbeelden van 'nieuwe' woorden die hij gevonden heeft in enkele katernen van NRC Handelsblad, Het Parool, het Algemeen Dagblad en De Telegraaf, allemaal verschenen op 14 november 1997. Hij moet die katernen zeer nauwkeurig zelf hebben doorgenomen. Voor een zoektocht op Internet is dat allemaal niet nodig; daar kan een zoekmachine, een speciaal programma dat een index over tientallen miljoenen webpagina's bijhoudt, in een handomdraai het nodige werk doen.

Ik heb de proef op de som genomen. De 54 woorden die Jansen noemt heb ik ingevoerd in enkele bekende zoekmachines op Internet -- AltaVista (http://www.altavista.digital.com) en Hotbot (http://www.hotbot.com/) en het Nederlandse Vindex (http://www.webwereld.nl/). Vervolgens heb ik alle documenten weggefilterd die op of na 14 november 1997 verschenen. Ik vond bijvoorbeeld twee van de door Jansen geraadpleegde artikelen uit de NRC in de webeditie terug, maar deze telde ik natuurlijk niet mee. Uiteindelijk hield ik 23 woorden over die volgens Jansen op 14 november 1997 nieuw waren, maar die op die dag al kortere of langere tijd via Internet gevonden konden worden: dat is 43 procent. Daarbij valt nog aan te tekenen dat deze drie zoekmachines zeker niet alle pagina's op Internet geïndexeerd hebben.

Hieronder geef ik een lijst van de 54 woorden die Jansen in zijn laatste artikel noemt; erachter geef ik het aantal Nederlandstalige vindplaatsen (woorden als EU-Minister werden ook gevonden op Duitstalige websites) dat de genoemde zoekmachines mij opleverden, en een representatief voorbeeld van een dergelijke vindplaats:

rijstzaak/rijst-zaak0 
reli-zapper/relizapper 0 
jazz-timing/jazztiming0 
D66-fractieleider10http://www.nrc.nl/W2/Nieuws/1997/05/31/Vp/01.html
HMG-directie8http://www.pi.net/computer/multim/
11-6-97/mm11-6-97g.html
SRV-bende 0 
EU-minister34http://www.minjust.nl/c_actual/persber/pb104.htm
VN-ambassadeur18http://www.vum.be/dsifvnkris.html
VN-chef 51http://www.vum.be/dsifwef2.html
VN-commissie23http://www.antenna.nl/wvi/nl/ic/mr/mrnl/est32.html
VN-contributie1http://www.dailynews.nl/zondag061096/
buitenland/vsvn.htm
VN-gebouw3http://www.milieudefensie.nl/julaug96/set.htm
VN-inspecteur0 
VN-resolutie22http://wwwdb.europarl.eu.int/dg7/questions/
qe/97/qr/C83/nl/E-2352-96.htm
VN-tribunaal33http://sascha.esrac.ele.tue.nl/~ivo/groepsspelen/vn.html
Vestdijk-lezer 0 
goede-in-het-algemeen 0 
Nederlands-Surinaams0 
Turks/Koerdische17http://194.7.253.55/nbifmedtv2.html
zuid-zuidrelatie0 
ad-hocgezelschap 1http://www.music-meeting.nl/verslag.htm
tripletherapie1http://www.nrc.nl/W2/Nieuws/1997/05/16/Opi/01.html
branche-exclusiviteit7http://ww.cci.be/brussels/nno35217.html
mediacontract 3http://mediamaat.atn.nl/
segmentsponsoring0 
sponsorpot 5http://www.kun.nl/mycelium/reunisten.html
STER-blok 20http://www.ster.nl/nieuws/persbericht/pers9.html
WK-wedstrijd 3http://www.rotterdamsdagblad.nl:81/html/001455.html
afscheidsgrap 0 
arbo-kritiek 0 
bewust-coma 0 
ex-veteranendienstplichtige 0 
letselschade-advocaat 7http://www.am.sbi.nl/nieuws/221/221d.htm
St. Maarten-cadeau 0 
zelfhelpboek 5http://home.wxs.nl/~abnervos/bestel.htm
losstraat 0 
vlammenmelder1http://www.siemens.nl/produkt/gebouw/p3050047.htm
VN-wapeninspecteur0 
box-butler 0 
unit-eigenaar 0 
verwenunit 0 
vip-box 0 
vip-boxhouder 0 
hetero-stel3http://www.telegraaf.nl/krant/naslag/
filmrecensies/film.hollowreed.html
heterosamenleving0 
homonest 0 
elandtest0 
lijkenhond0 
zwaan-kleef-aan-dynamiek0 
transdisciplinair1http://www2.netcetera.nl/~iaaa/inaugure.html
Aziatisch-economisch0 
ex-B-verpleegkundige 0 
A2000-partner 0 
thuisservice 0 
herhalingsdader 0 

Jansens conclusie wordt door deze bevindingen uiteraard niet ondermijnd. Misschien staan er elke dag minder nieuwe woorden in de krant als we Internet in de beschouwingen betrekken, maar daar staat tegenover dat alle Internet-communicatie zelf waarschijnlijk ook weer aan veel nieuwe woorden het licht doet zien. Het is best mogelijk dat we alles bij elkaar dan nog steeds op een getal uitkomen dat groter is dan 60.

Voor goed onderzoek hebben we een Internet-programmaatje nodig dat elke dag permanent het Internet afgraast op zoek naar nieuwe woorden. Zo'n programma heeft een module die automatisch herkent in welke taal een webpagina of een bericht in een nieuwsgroep gesteld is (het zoekprogramma AltaVista heeft zo'n module al); verder houdt het uiteraard een woordenlijst bij van woorden die het al kent. Elk etmaal genereert het programma een lijst met nieuw gevonden woorden.

De eerste maanden moet het programma getraind worden en vindt het overdreven veel 'nieuwe woorden', maar na een paar testweken zijn de resultaten bruikbaar voor onderzoek. We moeten dan alleen nog uitvinden welk percentage van het web en van de nieuwsgroepen ongeveer per dag door het programma bezocht en we weten hoeveel nieuwe woorden er per dag bijkomen op Internet. Op het dagelijkse nieuwewoordenbulletin die dat programma elke dag verstuurt, zal ik me onmiddellijk abonneren.

Marc van Oostendorp

Referenties:

  • Jansen, F. `Remmend vlees in het flikkergroen; Nieuwe woorden van 1996'. Onze Taal 66.1:15-18 (1997)
  • Horst, J. van der `Ik mankeer niets'. In: P. Burger en J. de Jong, red., Taalalmanak. SDU Uitgevers/Standaard Uitgeverij/Genootschap Onze Taal, Den Haag/Antwerpen, 1997. pp. 205-209
  • Jansen, F. `Hoeveel nieuwe woorden staan er dagelijks in de krant?'. Onze Taal 67.2/3:39-41 (1998).


[Dit nummer][Columns Van Oostendorp]