This paper works with data provided by the Czech National Corpus to consider the use of nepřizpůsobivý (inadaptable) by the Czech mainstream print media as a code word that is widely understood to signify a Roma citizen. The study shows that nepřizpůsobivý is used far more frequently in journalism than in other text genres and that its use has increased over the past decade. Examination of collocations reveals that nepřizpůsobivý typically is associated with negative reports on housing, residency and crime. This paper can also be seen as a case study to illustrate the usefulness of corpus data to critical discourse analysis and the role of the corpus in providing quantitative support to qualitative research in general. and Článek založený na datech z Českého národního korpusu zkoumá užívání slova nepřizpůsobivý v hlavních českých denících. Nepřizpůsobivý je ve skutečnosti užíváno jako zástupné slovo pro Romy / romskou populaci. Výzkum ukazuje, že toto slovo se používá daleko častěji v rámci publicistiky než v jiných typech textů a že jeho frekvence v posledních deseti letech výrazně stoupla. Kolokační analýza odhaluje, že slovo nepřizpů-sobivý se typicky vyskytuje v negativních kontextech v novinových článcích o bytech a bydlení obecně, o soužití občanů a o kriminalitě. Tento článek může být nahlížen i jako případová studie, která je příkladem využití korpusových dat v kritické analýze diskurzu a zároveň dokládá roli korpusu v poskytování kvantitativní opory v rámci kvalitativního lingvistického výzkumu.
Problematika agresivity v zařízeních ústavního typu, které pečují o osoby s mentálním postižením, bývá tradičně nahlížena jako výhradní problém osob s postižením. V příspěvku se snažíme ukázat, že k problematice agrese je potřebné přistupovat se širší perspektivou, která zahrnuje nejen dispozice osob s postižením, ale také to, do jaké míry prostředí instituce a samotní zaměstnanci (přímo či nepřímo) k agresivnímu jednání klientů přispívají. Teoretický přehled charakterizuje hypotetické zdroje agresivního jednání klientů a zaměstnanců. Vlastní výzkum se zaměřuje na způsob, jakým zaměstnanci uvažují o příčinách agrese v instituci. Výsledky mj. ukazují tendenci zaměstnanců dopouštět se v hodnocení agresivního jednání základní atribuční chyby. Studie tak nabízí konkrétní výzvu pro další práci na zlepšení kvality péče v domovech pro osoby s mentálním postižením.
SiR 1.0 is a corpus of Czech articles published on iRozhlas, a news server of a Czech public radio (https://www.irozhlas.cz/). It is a collection of 1 718 articles (42 890 sentences, 614 995 words) with manually annotated attribution of citation phrases and sources. The sources are classified into several classes of named and unnamed sources.
The corpus consists of three parts, depending on the quality of the annotations:
(i) triple-annotated articles: 46 articles (933 sentences, 13 242 words) annotated independently by three annotators and subsequently curated by an arbiter,
(ii) double-annotated articles: 543 articles (12 347 sentences, 180 622 words) annotated independently by two annotators and automatically unified,
and (iii) single-annotated articles: 1 129 articles (29 610 sentences, 421 131 words) annotated each only by a single annotator.
The data were annotated in the Brat tool (https://brat.nlplab.org/) and are distributed in the Brat native format, i.e. each article is represented by the original plain text and a stand-off annotation file.
Please cite the following paper when using the corpus for your research: Hladká Barbora, Jiří Mírovský, Matyáš Kopp, Václav Moravec. Annotating Attribution in Czech News Server Articles. In: Proceedings of the 13th Conference on Language Resources and Evaluation (LREC 2022), pages 1817–1823, Marseille, France 20-25 June 2022.