Lexikálně-sémantická databáze češtiny

Program: TL-Program na podporu aplikovaného společenskovědního a humanitního výzkumu, experimentálního vývoje a inovací ÉTA
Registrační číslo: TL02000041
Hlavní řešitel: prof. PhDr. Aleš Klégr, Filozofická fakulta UK, Praha
Spoluřešitel: Mgr. Jan Křivan, Ph.D., Ústav pro jazyk český AV ČR
Aplikační garanti: Ústav pro jazyk český AV ČR; Ústav formální a aplikované lingvistiky, Matematicko-fyzikální fakulta Univerzity Karlovy; Česká asociace pro digitální humanitní vědy, z. s.; Jednota tlumočníků a překladatelů; Obec překladatelů; Sjednocená organizace nevidomých a slabozrakých ČR
Doba řešení: 02/2019–02/2022

 

Anotace:

Cílem projektu je tvorba volně přístupné elektronické lexikálně-sémantické databáze založené na vytěžení lexika a struktur jediných onomaziologických slovníků češtiny: Hallerova Českého slovníku věcného a synonymického a Klégrova Tezauru jazyka českého. Projekt na základě analýzy těchto slovníků vytvoří společnou sémantickou strukturu databáze, do které zdigitalizuje data existujících slovníků, včetně jejich původních struktur. Uživatelům pak bude databáze přístupná pomocí několika rozhraní odrážejících zájmy různých skupin uživatelů: 1. Vyhledávání a čtení pro běžné uživatele; 2. Editace pro redaktory databáze; 3. Export dat a struktur v různých formátech pro výzkumníky; 4. API pro zpřístupnění dat jiným aplikacím. Databáze bude uživatelům ve všech těchto rozhraních zpřístupněna do tří let.