Lexikální podobnost
V lingvistice je lexikální podobnost míra podobnosti slovní zásoby dvou daných jazyků. Lexikální podobnost hodnoty 1 (nebo 100 %) by znamenala úplné překrytí slovní zásoby, zatímco 0 znamená, že neexistují žádná společná slova.
Existují různé definice lexikální podobnosti, které dávájí rozdílné výsledky. Například metoda Etnologue spočívá ve srovnání standardizovaných množin seznamů slov a počítání těch, které jsou si podobné jak formou, tak významem. Podle této metody je podobnost angličtiny s němčinou 60 % a s francouzštinou 27 %.
Lexikální podobnost může být použita k odhadnutí genetické příbuznosti mezi dvěma jazyky. Hodnoty vyšší než 85 % většinou znamenají, že porovnávané jazyky jsou příbuzné dialekty.[1]
Lexikální podobnost je jenom jedním z indikátorů vzájemné srozumitelnosti dvou jazyků, protože ta záleží také na stupni fonetické, morfologické (tvarosloví) a syntaktické (větná skladba) podobnosti. Dlužno podotknout, že je to ovlivněno variacemi ve váze různých seznamů slov. Například lexikální podobnost francouzštiny s angličtinou je velmi vysoká co se lexikálních oblastí souvisejících s kulturou týče, zatímco jejich podobnost je menší co se týče základních (funkčních) slov. Na rozdíl od vzájemné srozumitelnosti je být lexikální podobnost výlučně symetrická.
Indoevropské jazyky
Tabulka níže ukazuje hodnoty lexikální podobnosti pro dvojice vybraných románských, germánských a slovanských jazyků tak, jak byly publikovány Ethnologuem.
Kód jazyka | Jazyk 1 ↓ | Koeficienty lexikální podobnosti | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Katalánština | Angličtina | Francouzština | Němčina | Italština | Portugalština | Rumunština | Rétorománština | Ruština | Sardinština | Španělština | ||
cat | Katalánština | 1 | - | 0,85 | - | 0,87 | 0,85 | 0,73 | 0,76 | - | 0,76 | 0,85 |
eng | Angličtina | - | 1 | 0,27 | 0,60 | - | - | - | - | 0,24 | - | - |
fra | Francouzština | 0,85 | 0,27 | 1 | 0,29 | 0,89 | 0,75 | 0,75 | 0,78 | - | 0,80 | 0,75 |
deu | Němčina | - | 0,60 | 0,29 | 1 | - | - | - | - | - | - | - |
ita | Italština | 0,87 | - | 0,89 | - | 1 | - | 0,77 | 0,78 | - | 0,85 | 0,82 |
por | Portugalština | 0,85 | - | 0,75 | - | - | 1 | 0,72 | 0,74 | - | - | 0,89 |
ron | Rumunština | 0,73 | - | 0,75 | - | 0,77 | 0,72 | 1 | 0,72 | - | 0,74 | 0,71 |
roh | Rétorománština | 0,76 | - | 0,78 | - | 0,78 | 0,74 | 0.72 | 1 | - | 0,74 | 0,74 |
rus | Ruština | - | 0.24 | - | - | - | - | - | - | 1 | - | - |
srd | Sardinština | 0,76 | - | 0,80 | - | 0,85 | - | 0,74 | 0,74 | - | 1 | 0,76 |
spa | Španělština | 0,85 | - | 0,75 | - | 0,82 | 0,89 | 0,71 | 0,74 | - | 0,76 | 1 |
Katalánština | Angličtina | Francouzština | Němčina | Italština | Portugalština | Rumunština | Rétorománština | Ruština | Sardinština | Španělština | ||
Jazyk 2 → | cat | eng | fra | deu | ita | por | ron | roh | rus | srd | spa |
Poznámky:
- Jazykové kódy jsou ze standardu ISO 639-3.
- Ethnologue neuvádí, pro kterou variantu sardinštiny byla lexikální podobnost vypočítána.
- „-“ značí že data nejsou dostupná.
Související články
Reference
V tomto článku byl použit překlad textu z článku Lexical similarity na anglické Wikipedii.
- Ethnologue.com (lexical similarity values available at some of the individual language entries)
- Definition of lexical similarity at Ethnologue.com
- Rensch, Calvin R. 1992. "Calculating lexical similarity." In Eugene H. Casad (ed.), Windows on bilingualism , 13-15. (Summer Institute of Linguistics and the University of Texas at Arlington Publications in Linguistics, 110). Dallas: Summer Institute of Linguistics and the University of Texas at Arlington.