Evald 4.0 pro začátečníky

 

Software je určen pro automatické hodnocení textů psaných nerodilými mluvčími češtiny na úrovni začátečníků (pro software EVALD 4.0 určený pro rodilé mluvčí češtiny klikněte sem a pro software EVALD 4.0 určený pro pokročilejší nerodilé mluvčí češtiny klikněte sem). Více informací naleznete na domovských stránkách projektu.

Software rozlišuje dvě kategorie – texty, které nedosahují minimální jazykové úrovně A1 definované podle Společného evropského referenčního rámce pro jazyky (SERR), a texty, které dosahují jazykové úrovně A1 či vyšší. Je tedy nastaven na rozlišení minimální hranice, po jejímž dosažení lze autora textu označit jako uživatele základů českého jazyka (pro další rozlišení úrovně pokročilejších textů doporučujeme využít software Evald 4.0 pro cizince). Software je trénován na hodnocení prozaických textů obsahem a rozsahem (formou) odpovídajících ucelenému písemnému projevu na zadané téma, např. při zkoušce z češtiny jako cizího jazyka. Při hodnocení jiného typu textů (básní, novinových textů apod.) software nemusí pracovat spolehlivě. Vložené texty mohou být využity k výzkumným účelům, volně distribuovány a publikovány.



Vysvětlivky

Metriky porozumění textu:

Flesch-Kincaid Grade Level Formula

Čím je číslo získané touto metrikou vyšší, tím se daný text čte obtížněji. Příklad: Hodnota 8 znamená, že text by měl být dobře srozumitelný pro 13leté až 14leté žáky; je to zároveň stupeň srozumitelnosti pro širokou veřejnost: textu s hodnotou 8 by mělo bez problémů rozumět přibližně 80 % lidí.

Flesch Reading Ease1
SkórePopis
90 a víceText se čte velmi snadno. Lehce mu porozumí průměrný 11letý žák.
90–80Text se čte snadno. Konverzační úroveň jazyka.
80–70Text se čte poměrně snadno.
70–60Běžná úroveň jazyka. Textu lehce porozumí 13letý až 15letý žák.
60–50Text se čte poměrně obtížně.
50–30Text se čte obtížně. Úroveň studentů vysokých škol.
30 a méněText se čte velmi obtížně. Nejlépe mu porozumějí absolventi univerzit.
SMOG index (Simple Measure of Gobbledygook)

Čím je číslo získané touto metrikou vyšší, tím se daný text čte obtížněji.

Coleman-Liau index

Čím je číslo získané touto metrikou vyšší, tím se daný text čte obtížněji.

Automated readability index2
SkóreVěk čtenáře
1 a méně5–6
26–7
37–9
49–10
510–11
611–12
712–13
813–14
914–15
1015–16
1116–17
1217–18
1318–24
14 a více24+

Pestrost slovní zásoby:

Yuleova hodnota K

Bohatost slovní zásoby: Yuleova hodnota K: Čím vyšší je číslo K, tím častěji se opakují slova v textu, resp. tím je slovní zásoba v textu méně rozmanitá.

Simpsonův index D

Bohatost slovní zásoby: Simpsonův index D: Čím vyšší je číslo D, tím nižší je pestrost slovní zásoby užité v textu.


Poznámky pod čarou

1 Flesch, Rudolf. How to Write Plain English. University of Canterbury.

2 Senter, R.J.; Smith, E.A. (November 1967). Automated Readability Index. Wright-Patterson Air Force Base: iii. AMRL-TR-6620.

Poděkování

Vytvořeno (© 2016–2019) v Ústavu formální a aplikované lingvistiky (ÚFAL), Matematicko-fyzikální fakulta, Univerzita Karlova, s finanční podporou Ministerstva kultury České republiky, projekt Automatické vyhodnocování koherence textu v češtině (DG16P02B016).