Lemma (lingvistika)
V lingvistice lemma (též lema, mn. č. lemmata) označuje
- základní podobu (alolex) lexému (tedy slova nebo fráze), která se uvádí jako reprezentativní ve slovnících (slovníkový tvar), nebo
- souhrn všech tvarů určité lexikální jednotky (lexému) reprezentovaný jejím základním (heslovým) tvarem (lemmatem v předchozím významu)
V textové analýze se každý konkrétní tvar daného lemmatu označuje jako typ, každá konkrétní realizace slova se nazývá token.
Např. Ve větě Netrpěliví zákazníci stáli v obchodě i před obchodem, ovšem před obchodem jich čekalo jen několik. se k lemmatu obchod vyskytují tři tokeny dvou typů (obchodě, obchodem).
Poměrem typů a tokenů lze přibližně odhadnout jazykovou bohatost textu (která je ovšem ovlivněna také délkou a specifikací textu).[1]
Ve funkčním generativním popisu (FGP) se rozlišuje morfologické (syntaktické) m-lema od tektogramatického (sémantického) t-lematu.
V češtině se jako slovníkový tvar zpravidla používá:
- pro substantiva nominativ singuláru;
- pro adjektiva nominativ singuláru pozitivu mužského rodu – obdobně též pro zájmena a číslovky;
- pro slovesa infinitiv aktiva (z hlediska slovesného vidu není lemma jednoznačně definováno);
- pro příslovce pozitiv (1. stupeň);
- pro předložky nevokalizovaný tvar;
- pro ostatní slovní druhy je lemma shodné s jediným tvarem.
V jiných jazycích může být konvence pro výběr lemmatu odlišná. V latině se za verbální lemma považuje první osoba singuláru přítomného času, případně třetí osoba u neosobních sloves jako kupř. ningit (sněží).
Nástroj (např. počítačový program), který určitému tvaru slova přiřadí jeho lemma, se nazývá lemmatizátor.
Reference
- ČERMÁK, František. Lexikon a sémantika. Praha: NLN, 2010. S. 232–233.
Externí odkazy
- Slovníkové heslo lemma ve Wikislovníku
- Lemma (lingvistika) v České terminologické databázi knihovnictví a informační vědy (TDKIV)