|
Vac: 0712.03
Date: Wed, 12 Dec 2007 15:24:22 +0100
From: Paulette Tacx <tacx@inl.nl>
Subject: Vac: 0712.03: Vacatures voor twee named entity specialisten bij het Instituut voor Nederlandse Lexicologie (INL) te Leiden (deadline: wo 2 januari 2008)
Vacatures INL: twee named entity specialisten
Het Instituut voor Nederlandse Lexicologie zoekt per direct
twee ervaren computerlinguïsten
voor het ontwikkelen van Named Entity Processingtools in het kader
van IMPACT.
IMPACT is een nieuw Europees onderzoeksproject waar het
INL aan deelneemt. Het project start per 1 januari 2008. Het betreft
een 'Integrated Project' van een aantal bibliotheken, diverse
onderzoeksinstellingen en twee commerciële partners.
Het hoofddoel van IMPACT is de toegankelijkheid van historische
documenten aanzienlijk te verbeteren, zodat ze, waar mogelijk, even
toegankelijk zijn als moderne digitale documenten.
Om dit doel te bereiken zal IMPACT onder andere de volgende
taken omvatten:
- De ontwikkeling van OCR-software die de accuratesse van de
huidige state-of-the-art significant zal overtreffen, en het voor
het eerst mogelijk zal maken grote hoeveelheden historische
documenten betrouwbaar om te zetten in elektronische tekst.
- Ontwikkeling van lexica en computerlinguïstische tools om
de toegankelijkheid van historische teksten te verbeteren door de
historische taalbarrière, die het gevolg is van spelling- en
vormvariatie, te overbruggen, met name door de toevoeging van
moderne lemmavormen als variatie-onafhankelijke zoeksleutel
Om effectief te zijn zullen de lexica ook 'Named Entity data' moeten
bevatten en moeten ook speciale tools worden ontwikkeld voor Named
Entityherkenning en -classificatie voor historisch taalmateriaal.
Taakbeschrijving
De Named Entity-specialisten verrichten hun werkzaamheden in het
kader van de ontwikkeling van een toolbox voor het bouwen en
benutten van historische lexica t.b.v. de verbetering van
OCR-resultaten en ontsluiting van historisch tekstmateriaal. Het
werk betreft zowel implementatie als ontwerp van relevante
algoritmen.
Profielschets
- relevante wetenschappelijke opleiding op het gebied van
computerlinguïstiek, informatica of toegepaste wiskunde
- aantoonbare kennis van en ervaring met de ontwikkeling en
implementatie van machinelearning, statistische en andere
computerlinguïstische algoritmen
- stressbestendigheid, in staat tot goede samenwerking in een team
dat in een kort tijdbestek tot goede resultaten zal moeten komen
- aantoonbare ervaring met de ontwikkeling van complexe software.
Goede kennis van C, C++, en Java strekt tot aanbeveling
- promotie of andere onderzoekservaring strekt tot aanbeveling
- ervaring met Named Entityprocessing is zeer gewenst, kennis van
OCR-technieken strekt tot aanbeveling
- kennis en ervaring in de behandeling van historisch
taalmateriaal strekt tot aanbeveling
Aanbod
Een tweejarig contract bij het INL. De salarisschaal maximaal 11,
met een maximum van EUR 4.138, - bruto per maand op basis van een
38-urige werkweek. Bovendien heeft u op basis van de cao-
onderzoekinstellingen onder meer recht op 42 vakantiedagen per jaar
plus vakantiegeld.
Voor vragen en sollicitaties:
Katrien Depuydt (Taalbank) INL, Postbus 9515, 2300 RA, Leiden
tel. (+31 (0)71 527 2479), e-mail: depuydt@inl.nl.
Sluitingsdatum: 2-01-2008
|