Linguateca
Linguateca er et ressurssenter for portugisisk språkteknologi (2000-2008).
Prosjektet ledes fra SINTEF IKT, og binder sammen ca. 20 forskere ved 8 institusjoner i Oslo, Lisboa, Odense, Porto, Braga, São Carlos og Coimbra. Målet er å gi informasjon, stille til rådighet ressurser og vurdere språkteknologiske systemer for å utvikle portugisisk språkteknologi.
Hovedsida til Linguateca er www.linguateca.pt. Den gir tilgang til en mengde ressurser foran portugisisk språk, og har blitt oppsøkt 7 millioner ganger siden den ble lagd. Linguateca har dessuten avholdt flere vurderingstevlinger for å fremme forskning og utvikling av system som virker på portugisisk: Morfolimpíadas (som gjaldt morfologisk analyse), CLEF 2004, 2005, 2006, 2007, 2008 (informasjonsgjenfinning på tvers av språk og spørresystemer - portugisisk del) og HAREM (automatisk gjenkjennelse av navn) i 2005/2006 og 2007/2008.
Det har blitt lagd mange (ca. 250) publikasjoner og (ca. 100) presentasjoner innenfor prosjektet. Dem finner du pekere til på www.linguateca.pt/documentos/.
Ved Linguateca driver en forskning som gjelder hvordan en trekker ut semantiske kategorier fra tekst, terminologi i informasjonsgjenfinning, menneskelige faktorer ved nettsøk og ved ressursbygging, eksempelbasert automatisk oversettelse og sider ved sammenliknbare og parallelle korpora. I tillegg har en arbeidet med geografiske informasjonssystemer og ontologier.