Prague Dependency Treebank 3.5
- Title:
- Prague Dependency Treebank 3.5
- Creator:
- Hajič, Jan, Bejček, Eduard, Bémová, Alevtina, Buráňová, Eva, Hajičová, Eva, Havelka, Jiří, Homola, Petr, Kárník, Jiří, Kettnerová, Václava, Klyueva, Natalia, Kolářová, Veronika, Kučová, Lucie, Lopatková, Markéta, Mikulová, Marie, Mírovský, Jiří, Nedoluzhko, Anna, Pajas, Petr, Panevová, Jarmila, Poláková, Lucie, Rysová, Magdaléna, Sgall, Petr, Spoustová, Johanka, Straňák, Pavel, Synková, Pavlína, Ševčíková, Magda, Štěpánek, Jan, Urešová, Zdeňka, Vidová Hladká, Barbora, Zeman, Daniel, Zikánová, Šárka, and Žabokrtský, Zdeněk
- Contributor:
- Ministerstvo školství, mládeže a tělovýchovy České republiky@@LM2015071@@LINDAT/CLARIN: Výzkumná infrastruktura pro jazyková data@@nationalFunds@@, Ministerstvo školství, mládeže a tělovýchovy České republiky@@LM2010013@@LINDAT/CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat@@nationalFunds@@, Ministerstvo školství, mládeže a tělovýchovy České republiky@@LH14011@@Vícejazyčná korpusová anotace@@nationalFunds@@, Ministerstvo školství, mládeže a tělovýchovy České republiky@@1P05ME752@@Vícejazyčný valenční a predikátový slovník přirozeného jazyka@@nationalFunds@@, Ministerstvo školství, mládeže a tělovýchovy České republiky@@ME10018@@K počítačové analýze struktury textu@@nationalFunds@@, Ministerstvo školství, mládeže a tělovýchovy České republiky@@LD14117@@Parseme CZ@@nationalFunds@@, Ministerstvo školství, mládeže a tělovýchovy České republiky@@VS96151@@Laboratoř počítačového zpracování jazykových dat@@nationalFunds@@, Ministerstvo školství, mládeže a tělovýchovy České republiky@@LN00A063@@Centrum komputační lingvistiky@@nationalFunds@@, Ministerstvo školství, mládeže a tělovýchovy České republiky@@LC536@@Centrum komputační lingvistiky@@nationalFunds@@, Ministerstvo školství, mládeže a tělovýchovy České republiky@@MSM 0021620838@@Moderní metody, struktury a systémy informatiky@@nationalFunds@@, Grantová agentura České republiky@@GA405/96/0198@@Formální reprezentace jazykových struktur@@nationalFunds@@, Grantová agentura České republiky@@GA405/96/K214@@Čeština ve věku počítačů@@nationalFunds@@, Grantová agentura České republiky@@GA405/03/0913@@Velké jazykové korpusy a jejich automatická analýza@@nationalFunds@@, Grantová agentura České republiky@@GA405/09/0729@@Od struktury věty k textovým vztahům@@nationalFunds@@, Grantová agentura České republiky@@GAP406/10/0875@@Komputační lingvistika: Explicitní popis jazyka a anotovaná data se zřetelem na češtinu@@nationalFunds@@, Grantová agentura České republiky@@GAP202/10/1333@@NoSCoM: nestandardní výpočetní modely a jejich aplikace ve složitosti, lingvistice a učení@@nationalFunds@@, Grantová agentura České republiky@@GPP406/10/P193@@Nástroje pro revizi a tektogramatickou anotaci českého závislostního korpusu@@nationalFunds@@, Grantová agentura České republiky@@GAP406/12/0658@@Koreference, diskurs a aktuální členění v kontrastivním pohledu@@nationalFunds@@, Grantová agentura České republiky@@GPP406/12/P175@@Vybrané derivační vztahy pro automatické zpracování češtiny@@nationalFunds@@, Grantová agentura České republiky@@GP13-03351P@@Srovnání české a anglické valence sloves na základě korpusového materiálu (teorie a praxe)@@nationalFunds@@, Grantová agentura České republiky@@GA17-07313S@@Contextually-based synonymy and valency of verbs in a bilingual setting@@nationalFunds@@, Grantová agentura České republiky@@GA17-12624S@@Subkategorizace adverbiálních významů na základě korpusových dat@@nationalFunds@@, European Union@@FP6-IST-5-034434-IP@@Companions IP@@euFunds@@, European Union@@EC/FP7/249119@@T4ME NET - Technologies for the Multilingual European Information Society@@euFunds@@info:eu-repo/grantAgreement/EC/FP7/249119, European Union@@EC/FP7/247762@@FAUST - Feedback Analysis for User adaptive Statistical Translation@@euFunds@@info:eu-repo/grantAgreement/EC/FP7/247762, European Union@@EC/FP7/610516@@QTLEAP - Quality Translation by Deep Language Engineering Approaches@@euFunds@@info:eu-repo/grantAgreement/EC/FP7/610516, COST@@IC1207@@PARSEME: PARSing and Multi-word Expressions@@euFunds@@, Grantová agentura Akademie věd České republiky@@1ET101120503@@Integrace jazykových zdrojů za účelem extrakce informací z přirozených textů@@nationalFunds@@, Grantová agentura Akademie věd České republiky@@1ET101120413@@Data a nástroje pro informační systémy@@nationalFunds@@, Grantová agentura Akademie věd České republiky@@1ET201120505@@Od jazyka ke znalostem a sémantickému webu@@nationalFunds@@, Grantová agentura Univerzity Karlovy v Praze@@GAUK 489/2004@@Tektogramatická reprezentace angličtiny - aplikace funkčního generativního popisu (FGP) na hloubkovou syntax cizích jazyků v PZK@@nationalFunds@@, Grantová agentura Univerzity Karlovy v Praze@@GAUK 350/2005@@Faktory koherence textu a jejich zpracování v syntakticky anotovaném korpusu textů@@nationalFunds@@, Grantová agentura Univerzity Karlovy v Praze@@GAUK 352/2005@@Pražský závislostní korpus: Analýza vybraných jevů z české funkční onomatologie a syntaxe@@nationalFunds@@, Grantová agentura Univerzity Karlovy v Praze@@GAUK 375/2005@@Automatická hloubková analýza mluvené češtiny: od akustického signálu k významu@@nationalFunds@@, Grantová agentura Univerzity Karlovy v Praze@@GAUK 4383/2009@@Methods of coreference resolution@@nationalFunds@@, Grantová agentura Univerzity Karlovy v Praze@@GAUK 1036/2009@@Textové (mezivětné) vztahy a jejich zachycení v jazykovém korpusu@@nationalFunds@@, National Science Foundation (USA)@@NSF IIS-9732388@@Data preparation for Workshop 1998, JHU, Baltimore, MD, USA@@Other@@, Univerzita Karlova@@PRVOUK P46@@PRVOUK P46@@nationalFunds@@, Univerzita Karlova@@PROGRES Q48@@Informatika@@nationalFunds@@, Univerzita Karlova@@PROGRES Q18@@Od víceoborovosti k mezioborovosti@@nationalFunds@@, and Ministerstvo školství, mládeže a tělovýchovy České republiky@@CZ.02.1.01/0.0/0.0/16_013/0001781@@LINDAT/CLARIN - Výzkumná infrastruktura pro jazykové technologie - rozšíření repozitáře a výpočetní kapacity@@nationalFunds@@
- Publisher:
- Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
- Identifier:
- http://hdl.handle.net/11234/1-2621
- Subject:
- treebank, dependency, tectogrammatics, topic-focus articulation, multiword expressions, coreference, bridging relations, discourse, morphology, syntax, tokenization, lemmatization, clauses, semantics, semantic relations, lexical semantics, and lexicon
- Type:
- text and corpus
- Description:
- The Prague Dependency Treebank 3.5 is the 2018 edition of the core Prague Dependency Treebank (PDT). It contains all PDT annotation made at the Institute of Formal and Applied Linguistics under various projects between 1996 and 2018 on the original texts, i.e., all annotation from PDT 1.0, PDT 2.0, PDT 2.5, PDT 3.0, PDiT 1.0 and PDiT 2.0, plus corrections, new structure of basic documentation and new list of authors covering all previous editions. The Prague Dependency Treebank 3.5 (PDT 3.5) contains the same texts as the previous versions since 2.0; there are 49,431 annotated sentences (832,823 words) on all layers, from tectogrammatical annotation to syntax to morphology. There are additional annotated sentences for syntax and morphology; the totals for the lower layers of annotation are: 87,913 sentences with 1,502,976 words at the analytical layer (surface dependency syntax) and 115,844 sentences with 1,956,693 words at the morphological layer of annotation (these totals include the annotation with the higher layers annotated as well). Closely linked to the tectogrammatical layer is the annotation of sentence information structure, multiword expressions, coreference, bridging relations and discourse relations.
- Language:
- Czech
- Rights:
- Creative Commons - Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
http://creativecommons.org/licenses/by-nc-sa/4.0/
PUB - Relation:
- http://ufal.mff.cuni.cz/pdt3.5
info:eu-repo/grantAgreement/EC/FP7/249119
info:eu-repo/grantAgreement/EC/FP7/247762
info:eu-repo/grantAgreement/EC/FP7/610516
http://hdl.handle.net/11858/00-097C-0000-0023-1AAF-3
http://hdl.handle.net/11234/1-1905
http://hdl.handle.net/11234/1-3185 - Source:
- http://ufal.mff.cuni.cz/pdt3.5
- Harvested from:
- LINDAT/CLARIAH-CZ repository
- Metadata only:
- false
- Date:
- 2018-02-19
The item or associated files might be "in copyright"; review the provided rights metadata:
- Creative Commons - Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- PUB