Evald 4.0 pro cizince

 

Software EVALD 4.0 pro cizince slouží k automatickému hodnocení povrchové koherence (koheze) textů v češtině psaných nerodilými mluvčími češtiny (pro software EVALD 4.0 určený pro rodilé mluvčí češtiny klikněte sem a pro software EVALD 4.0 určený pro začínající nerodilé mluvčí češtiny klikněte sem). Více informací naleznete na domovských stránkách projektu.

Software hodnotí úroveň předloženého textu z hlediska jeho povrchové výstavby. Je určen pro hodnocení koherence autentických písemných slohových prací vytvořených nerodilými mluvčími češtiny. Je trénován na hodnocení prozaických textů obsahem a rozsahem (formou) odpovídajících běžné slohové práci vytvořené jako samostatný, ucelený písemný projev na zadané téma, např. při zkoušce z češtiny jako cizího jazyka. Při hodnocení jiného typu textů (básní, novinových textů apod.) software nemusí pracovat spolehlivě. Minimální délka vloženého textu by měla být 300 slov – kratší texty neposkytují dostatečný jazykový materiál, na kterém lze sledovat skutečnou úroveň textu. U kratších textů je uvedené hodnocení pouze orientační.
Vložené texty mohou být využity k výzkumným účelům, volně distribuovány a publikovány.



Vysvětlivky

Hodnotící škála povrchové koherence textu:

A1uživatel základů českého jazyka – nižší úroveň
A2uživatel základů českého jazyka – vyšší úroveň
B1samostatný uživatel českého jazyka – nižší úroveň
B2samostatný uživatel českého jazyka – vyšší úroveň
C1zkušený uživatel českého jazyka – nižší úroveň
C2zkušený uživatel českého jazyka – vyšší úroveň

Metriky porozumění textu:

Flesch-Kincaid Grade Level Formula

Čím je číslo získané touto metrikou vyšší, tím se daný text čte obtížněji. Příklad: Hodnota 8 znamená, že text by měl být dobře srozumitelný pro 13leté až 14leté žáky; je to zároveň stupeň srozumitelnosti pro širokou veřejnost: textu s hodnotou 8 by mělo bez problémů rozumět přibližně 80 % lidí.

Flesch Reading Ease1
SkórePopis
90 a víceText se čte velmi snadno. Lehce mu porozumí průměrný 11letý žák.
90–80Text se čte snadno. Konverzační úroveň jazyka.
80–70Text se čte poměrně snadno.
70–60Běžná úroveň jazyka. Textu lehce porozumí 13letý až 15letý žák.
60–50Text se čte poměrně obtížně.
50–30Text se čte obtížně. Úroveň studentů vysokých škol.
30 a méněText se čte velmi obtížně. Nejlépe mu porozumějí absolventi univerzit.
SMOG index (Simple Measure of Gobbledygook)

Čím je číslo získané touto metrikou vyšší, tím se daný text čte obtížněji.

Coleman-Liau index

Čím je číslo získané touto metrikou vyšší, tím se daný text čte obtížněji.

Automated readability index2
SkóreVěk čtenáře
1 a méně5–6
26–7
37–9
49–10
510–11
611–12
712–13
813–14
914–15
1015–16
1116–17
1217–18
1318–24
14 a více24+

Pestrost slovní zásoby:

Yuleova hodnota K

Bohatost slovní zásoby: Yuleova hodnota K: Čím vyšší je číslo K, tím častěji se opakují slova v textu, resp. tím je slovní zásoba v textu méně rozmanitá.

Simpsonův index D

Bohatost slovní zásoby: Simpsonův index D: Čím vyšší je číslo D, tím nižší je pestrost slovní zásoby užité v textu.


Poznámky pod čarou

1 Flesch, Rudolf. How to Write Plain English. University of Canterbury.

2 Senter, R.J.; Smith, E.A. (November 1967). Automated Readability Index. Wright-Patterson Air Force Base: iii. AMRL-TR-6620.

Poděkování

Vytvořeno (© 2016–2019) v Ústavu formální a aplikované lingvistiky (ÚFAL), Matematicko-fyzikální fakulta, Univerzita Karlova, s finanční podporou Ministerstva kultury České republiky, projekt Automatické vyhodnocování koherence textu v češtině (DG16P02B016).