0712.02 Terug
Vooruit 0712.04

Vac: 0712.03

Date: Wed, 12 Dec 2007 15:24:22 +0100
From: Paulette Tacx <tacx@inl.nl>
Subject: Vac: 0712.03: Vacatures voor twee named entity specialisten bij het Instituut voor Nederlandse Lexicologie (INL) te Leiden (deadline: wo 2 januari 2008)

Vacatures INL:
twee named entity specialisten

Het Instituut voor Nederlandse Lexicologie zoekt per direct twee ervaren computerlinguïsten voor het ontwikkelen van Named Entity Processingtools in het kader van IMPACT.
IMPACT is een nieuw Europees onderzoeksproject waar het INL aan deelneemt. Het project start per 1 januari 2008. Het betreft een 'Integrated Project' van een aantal bibliotheken, diverse onderzoeksinstellingen en twee commerciële partners.
Het hoofddoel van IMPACT is de toegankelijkheid van historische documenten aanzienlijk te verbeteren, zodat ze, waar mogelijk, even toegankelijk zijn als moderne digitale documenten.
Om dit doel te bereiken zal IMPACT onder andere de volgende taken omvatten:
  1. De ontwikkeling van OCR-software die de accuratesse van de huidige state-of-the-art significant zal overtreffen, en het voor het eerst mogelijk zal maken grote hoeveelheden historische documenten betrouwbaar om te zetten in elektronische tekst.
  2. Ontwikkeling van lexica en computerlinguïstische tools om de toegankelijkheid van historische teksten te verbeteren door de historische taalbarrière, die het gevolg is van spelling- en vormvariatie, te overbruggen, met name door de toevoeging van moderne lemmavormen als variatie-onafhankelijke zoeksleutel
Om effectief te zijn zullen de lexica ook 'Named Entity data' moeten bevatten en moeten ook speciale tools worden ontwikkeld voor Named Entityherkenning en -classificatie voor historisch taalmateriaal.

Taakbeschrijving

De Named Entity-specialisten verrichten hun werkzaamheden in het kader van de ontwikkeling van een toolbox voor het bouwen en benutten van historische lexica t.b.v. de verbetering van OCR-resultaten en ontsluiting van historisch tekstmateriaal. Het werk betreft zowel implementatie als ontwerp van relevante algoritmen.

Profielschets

  • relevante wetenschappelijke opleiding op het gebied van computerlinguïstiek, informatica of toegepaste wiskunde
  • aantoonbare kennis van en ervaring met de ontwikkeling en implementatie van machinelearning, statistische en andere computerlinguïstische algoritmen
  • stressbestendigheid, in staat tot goede samenwerking in een team dat in een kort tijdbestek tot goede resultaten zal moeten komen
  • aantoonbare ervaring met de ontwikkeling van complexe software. Goede kennis van C, C++, en Java strekt tot aanbeveling
  • promotie of andere onderzoekservaring strekt tot aanbeveling
  • ervaring met Named Entityprocessing is zeer gewenst, kennis van OCR-technieken strekt tot aanbeveling
  • kennis en ervaring in de behandeling van historisch taalmateriaal strekt tot aanbeveling
Aanbod

Een tweejarig contract bij het INL. De salarisschaal maximaal 11, met een maximum van EUR 4.138, - bruto per maand op basis van een 38-urige werkweek. Bovendien heeft u op basis van de cao- onderzoekinstellingen onder meer recht op 42 vakantiedagen per jaar plus vakantiegeld.

Voor vragen en sollicitaties:

Katrien Depuydt (Taalbank) INL, Postbus 9515, 2300 RA, Leiden
tel. (+31 (0)71 527 2479), e-mail: depuydt@inl.nl.

Sluitingsdatum: 2-01-2008


[Dit nummer][Alle vacatures]