Prague Dependency Treebank 2.0 (PDT 2.0)
- Title:
- Prague Dependency Treebank 2.0 (PDT 2.0)
Pražský závislostní korpus 2.0 (PZK 2.0) - Creator:
- Hajič, Jan, Panevová, Jarmila, Hajičová, Eva, Sgall, Petr, Pajas, Petr, Štěpánek, Jan, Havelka, Jiří, Mikulová, Marie, Žabokrtský, Zdeněk, Ševčíková-Razímová, Magda, and Urešová, Zdeňka
- Contributor:
- Grantová agentura Akademie věd České republiky@@1ET101120413@@Data a nástroje pro informační systémy@@nationalFunds@@, Ministerstvo školství, mládeže a tělovýchovy České republiky@@MSM 0021620838@@Moderní metody, struktury a systémy informatiky@@nationalFunds@@, Grantová agentura Akademie věd České republiky@@1ET101120503@@Integrace jazykových zdrojů za účelem extrakce informací z přirozených textů@@nationalFunds@@, Ministerstvo školství, mládeže a tělovýchovy České republiky@@1P05ME752@@Vícejazyčný valenční a predikátový slovník přirozeného jazyka@@nationalFunds@@, and Ministerstvo školství, mládeže a tělovýchovy České republiky@@LC536@@Centrum komputační lingvistiky@@nationalFunds@@
- Publisher:
- Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
- Identifier:
- LDC2006T01
http://hdl.handle.net/11858/00-097C-0000-0001-B098-5 - Subject:
- corpus, Czech, treebank, and PDT
- Type:
- text and corpus
- Description:
- The Prague Dependency Treebank 2.0 (PDT 2.0) contains a large amount of Czech texts with complex and interlinked morphological (two million words), syntactic (1.5 MW) and complex semantic annotation (0.8 MW); in addition, certain properties of sentence information structure and coreference relations are annotated at the semantic level. PDT 2.0 is based on the long-standing Praguian linguistic tradition, adapted for the current Computational Linguistics research needs. The corpus itself uses the latest annotation technology. Software tools for corpus search, annotation and language analysis are included. Extensive documentation (in English) is provided as well. and 1ET101120413 (Data a nástroje pro informační systémy) MSM 0021620838 (Moderní metody, struktury a systémy informatiky) 1ET101120503 (Integrace jazykových zdrojů za účelem extrakce informací z přirozených textů) 1P05ME752 (Vícejazyčný valenční a predikátový slovník přirozeného jazyka) LC536 (Centrum komputační lingvistiky)
- Language:
- Czech
- Rights:
- PDT 2.0 License
https://lindat.mff.cuni.cz/repository/xmlui/page/license-pdt2
ACA - Relation:
- http://hdl.handle.net/11858/00-097C-0000-0006-DB11-8
- Source:
- http://ufal.mff.cuni.cz/pdt2.0/
- Harvested from:
- LINDAT/CLARIAH-CZ repository
- Metadata only:
- false
- Date:
- 2006-07-21
The item or associated files might be "in copyright"; review the provided rights metadata:
- PDT 2.0 License
- https://lindat.mff.cuni.cz/repository/xmlui/page/license-pdt2
- ACA