logo KREAS

Skript 2015 – korpus rodilých mluvčích češtiny 

  • Modelový typ srovnávacího akvizičního korpusu písemných prací žáků na různých jazykových úrovních
  • Současný stav:
    • 2582 textů, 380 tis. tokenů; žáci ZŠ, ZŠP, ZŠS, SOŠ a gymnázií (včetně víceletých) ve věku 10–15 let
    • Texty jsou vybaveny metadaty a faksimilii
    • U textů byla provedena ruční transkripce včetně záznamu oprav pisatele a ruční anonymizace
    • Texty byly ručně i automaticky anotovány a ručně revidovány, výsledky obsahují:
      • ruční emendaci na více rovinách: pravopis a morfematika, morfosyntax, slovník
      • automatickou morfologickou analýzu původního textu a všech oprav
      • automatickou identifikaci typu pravopisné a morfématické chyby
    • Po přihlášení uživatel může texty i anotace opravovat a doplňovat
  • Využitelnost:
    • Učitelé mohou korpus využívat při přípravě hodiny, pomocných učebních materiálů i při vlastní výuce
    • Žáci mohou korpus využívat při samostatném studiu
  • Aktuální využití a udržitelnost:
    • V kurzech DV PP i v kurzech v pregraduální přípravě učitelů
    • Při vývoji počítačových nástrojů ke zpracování textů nerodilých mluvčích češtiny nebo jiných textů odlišných od spisovné normy 

Instrukce k přípravě korpusu

Přepis a anonymizace žákovských textů 

Oprava žákovských textů

 


Tato práce vznikla za podpory projektu „Kreativita a adaptabilita jako předpoklad úspěchu Evropy v propojeném světě“, reg. č.: CZ.02.1.01/0.0/0.0/16_019/0000734, financovaného z Evropského fondu pro regionální rozvoj, projektu Univerzity Karlovy Progres Q10 "Jazyk v proměnách času, místa, kultury" a projektu OP Praha – pól růstu "Zvýšení kvality vzdělávání a začleňování žáků s OMJ spojené s jeho radikální inovací", reg. č.:CZ.07.4.68/0.0/0.0/16_037/0000299, financovaného z Evropských strukturálních a investičních fondů.