dc.contributor.author |
Hajič, Jan |
dc.contributor.author |
Panevová, Jarmila |
dc.contributor.author |
Hajičová, Eva |
dc.contributor.author |
Sgall, Petr |
dc.contributor.author |
Pajas, Petr |
dc.contributor.author |
Štěpánek, Jan |
dc.contributor.author |
Havelka, Jiří |
dc.contributor.author |
Mikulová, Marie |
dc.contributor.author |
Žabokrtský, Zdeněk |
dc.contributor.author |
Ševčíková-Razímová, Magda |
dc.contributor.author |
Urešová, Zdeňka |
dc.date.accessioned |
2011-11-03T21:33:25Z |
dc.date.available |
2006-07-21T00:00:00Z |
dc.date.issued |
2006-07-21 |
dc.identifier |
LDC2006T01 |
dc.identifier.uri |
http://hdl.handle.net/11858/00-097C-0000-0001-B098-5 |
dc.description |
The Prague Dependency Treebank 2.0 (PDT 2.0) contains a large amount of Czech texts with complex and interlinked morphological (two million words), syntactic (1.5 MW) and complex semantic annotation (0.8 MW); in addition, certain properties of sentence information structure and coreference relations are annotated at the semantic level.
PDT 2.0 is based on the long-standing Praguian linguistic tradition, adapted for the current Computational Linguistics research needs. The corpus itself uses the latest annotation technology. Software tools for corpus search, annotation and language analysis are included. Extensive documentation (in English) is provided as well. |
dc.description.sponsorship |
1ET101120413 (Data a nástroje pro informační systémy) MSM 0021620838 (Moderní metody, struktury a systémy informatiky) 1ET101120503 (Integrace jazykových zdrojů za účelem extrakce informací z přirozených textů) 1P05ME752 (Vícejazyčný valenční a predikátový slovník přirozeného jazyka) LC536 (Centrum komputační lingvistiky) |
dc.language.iso |
ces |
dc.publisher |
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL) |
dc.relation.isreplacedby |
http://hdl.handle.net/11858/00-097C-0000-0006-DB11-8 |
dc.rights |
PDT 2.0 License |
dc.rights.uri |
https://lindat.mff.cuni.cz/repository/xmlui/page/license-pdt2 |
dc.source.uri |
http://ufal.mff.cuni.cz/pdt2.0/ |
dc.subject |
corpus |
dc.subject |
Czech |
dc.subject |
treebank |
dc.subject.other |
PDT |
dc.title |
Prague Dependency Treebank 2.0 (PDT 2.0) |
dc.title.alternative |
Pražský závislostní korpus 2.0 (PZK 2.0) |
dc.type |
corpus |
metashare.ResourceInfo#ContentInfo.mediaType |
text |
dc.rights.label |
ACA |
has.files |
yes |
branding |
LINDAT / CLARIAH-CZ |
contact.person |
Pavel Straňák stranak@ufal.mff.cuni.cz Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL) |
sponsor |
Grantová agentura Akademie věd České republiky 1ET101120413 Data a nástroje pro informační systémy nationalFunds |
sponsor |
Ministerstvo školství, mládeže a tělovýchovy České republiky MSM 0021620838 Moderní metody, struktury a systémy informatiky nationalFunds |
sponsor |
Grantová agentura Akademie věd České republiky 1ET101120503 Integrace jazykových zdrojů za účelem extrakce informací z přirozených textů nationalFunds |
sponsor |
Ministerstvo školství, mládeže a tělovýchovy České republiky 1P05ME752 Vícejazyčný valenční a predikátový slovník přirozeného jazyka nationalFunds |
sponsor |
Ministerstvo školství, mládeže a tělovýchovy České republiky LC536 Centrum komputační lingvistiky nationalFunds |
size.info |
2000000 words |
files.size |
281012478 |
files.count |
8 |