Dömörtör Adrienne: Főurak levelei, boszorkányok perei – és egy újonnan épült adatbázis
Az MTA Nyelvtudományi Intézetében egy évvel ezelőtt lezárult „Morfológiailag elemzett nyelvtörténeti korpusz a magánéleti nyelvhasználat köréből” című négy éves projektum (OTKA 81189. sz.) arra vállalkozott, hogy szófaji és alaktani annotációkkal ellátott adatbázist épít az élőnyelvet leginkább megközelítő ó- és középmagyar kori szövegekből: magánlevelekből és peres eljárások jegyzőkönyveiből. A munkálat tovább folytatódik a most indult „Versengő szerkezetek a középmagyar élőnyelvben: változók elemzésén alapuló megközelítés” (OTKA 116217 sz.) című projektum keretein belül.
Az előadás a nyelvtörténész szemszögéből mutatja be a korpuszépítés menetét, kitérve a választott módszer előnyeire és nehézségeire. A munkafázisok közül részletesebben foglalkozik az úgynevezett szövegnormalizálás menetével, de érinti a morfológiai elemzés gépi és kézi munkálatait is. Példákkal szemlélteti a szakmai kérdések típusait, amelyekkel a korpuszépítő szembesül, amikor nyelvtörténeti szövegeket kell kezelnie, és szól arról is, hogyan befolyásolják a felhasználói érdekek a korpuszépítő szempontjait.