Evald 4.0

 

Software EVALD 4.0 slouží k automatickému hodnocení povrchové koherence (koheze) textů v češtině psaných rodilými mluvčími češtiny (pro software EVALD 4.0 for Foreigners určený pro nerodilé mluvčí češtiny klikněte sem a pro software EVALD 4.0 for Beginners určený pro začínající nerodilé mluvčí češtiny klikněte sem). Více informací naleznete na domovských stránkách projektu.

Software hodnotí úroveň předloženého textu z hlediska jeho povrchové výstavby. Je určen pro hodnocení koherence autentických písemných slohových prací vytvořených rodilými mluvčími češtiny. Je trénován na hodnocení prozaických textů obsahem a rozsahem (formou) odpovídajících běžné slohové práci vytvořené jako samostatný, ucelený písemný projev na zadané téma, např. při hodinách českého jazyka na středních školách, odborných učilištích (popř. v nejvyšších ročnících základních škol) či při maturitní zkoušce z českého jazyka apod. Při hodnocení jiného typu textů (básní, novinových textů apod.) software nemusí pracovat spolehlivě. Minimální délka vloženého textu je 300 slov – kratší texty neposkytují dostatečný jazykový materiál, na kterém lze sledovat skutečnou úroveň textu.
Vložené texty mohou být využity k výzkumným účelům, volně distribuovány a publikovány.



Vysvětlivky

Hodnotící škála povrchové koherence textu:

1vynikající
2chvalitebný
3dobrý
4dostatečný
5nedostatečný

Metriky porozumění textu:

Flesch-Kincaid Grade Level Formula

Čím je číslo získané touto metrikou vyšší, tím se daný text čte obtížněji. Příklad: Hodnota 8 znamená, že text by měl být dobře srozumitelný pro 13leté až 14leté žáky; je to zároveň stupeň srozumitelnosti pro širokou veřejnost: textu s hodnotou 8 by mělo bez problémů rozumět přibližně 80 % lidí.

Flesch Reading Ease1
SkórePopis
90 a víceText se čte velmi snadno. Lehce mu porozumí průměrný 11letý žák.
90–80Text se čte snadno. Konverzační úroveň jazyka.
80–70Text se čte poměrně snadno.
70–60Běžná úroveň jazyka. Textu lehce porozumí 13letý až 15letý žák.
60–50Text se čte poměrně obtížně.
50–30Text se čte obtížně. Úroveň studentů vysokých škol.
30 a méněText se čte velmi obtížně. Nejlépe mu porozumějí absolventi univerzit.
SMOG index (Simple Measure of Gobbledygook)

Čím je číslo získané touto metrikou vyšší, tím se daný text čte obtížněji.

Coleman-Liau index

Čím je číslo získané touto metrikou vyšší, tím se daný text čte obtížněji.

Automated readability index2
SkóreVěk čtenáře
1 a méně5–6
26–7
37–9
49–10
510–11
611–12
712–13
813–14
914–15
1015–16
1116–17
1217–18
1318–24
14 a více24+

Pestrost slovní zásoby:

Yuleova hodnota K

Bohatost slovní zásoby: Yuleova hodnota K: Čím vyšší je číslo K, tím častěji se opakují slova v textu, resp. tím je slovní zásoba v textu méně rozmanitá.

Simpsonův index D

Bohatost slovní zásoby: Simpsonův index D: Čím vyšší je číslo D, tím nižší je pestrost slovní zásoby užité v textu.


Poznámky pod čarou

1 Flesch, Rudolf. How to Write Plain English. University of Canterbury.

2 Senter, R.J.; Smith, E.A. (November 1967). Automated Readability Index. Wright-Patterson Air Force Base: iii. AMRL-TR-6620.

Poděkování

Vytvořeno (© 2016–2019) v Ústavu formální a aplikované lingvistiky (ÚFAL), Matematicko-fyzikální fakulta, Univerzita Karlova, s finanční podporou Ministerstva kultury České republiky, projekt Automatické vyhodnocování koherence textu v češtině (DG16P02B016).