dc.contributor.author | Ševčíková, Magda |
dc.contributor.author | Žabokrtský, Zdeněk |
dc.contributor.author | Straková, Jana |
dc.contributor.author | Straka, Milan |
dc.date.accessioned | 2014-01-09T10:24:31Z |
dc.date.available | 2014-01-09T10:24:31Z |
dc.date.issued | 2014-01-09 |
dc.identifier.uri | http://hdl.handle.net/11858/00-097C-0000-0023-1B22-8 |
dc.description | Czech Named Entity Corpus 2.0 is a corpus of 8993 Czech sentences with manually annotated 35220 Czech named entities, classified according to a two-level hierarchy of 46 named entities. |
dc.description.sponsorship | SVV 267 314 (Teoretické základy informatiky a výpočetní lingvistiky), LM2010013 (LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat), GPP406/12/P175 (Vybrané derivační vztahy pro automatické zpracování češtiny), PRVOUK (PRVOUK) |
dc.language.iso | ces |
dc.publisher | Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL) |
dc.rights | Attribution-NonCommercial-ShareAlike 3.0 Unported (CC BY-NC-SA 3.0) |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/3.0/ |
dc.source.uri | http://ufal.mff.cuni.cz/cnec/ |
dc.subject | named entity recognition |
dc.title | Czech Named Entity Corpus 2.0 |
dc.type | corpus |
metashare.ResourceInfo#ContactInfo#PersonInfo.surname | Straková |
metashare.ResourceInfo#ContactInfo#PersonInfo.givenName | Jana |
metashare.ResourceInfo#ContactInfo#PersonInfo#OrganizationInfo.organizationName | Charles University in Prague, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics in Prague |
metashare.ResourceInfo#DistributionInfo.availability | unrestrictedUse |
metashare.ResourceInfo#ResourceCreationInfo#FundingInfo#ProjectInfo.fundingType | SVV 267 314 (Teoretické základy informatiky a výpočetní lingvistiky) |
metashare.ResourceInfo#ResourceCreationInfo#FundingInfo#ProjectInfo.fundingType | LM2010013 (LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat) |
metashare.ResourceInfo#ResourceCreationInfo#FundingInfo#ProjectInfo.fundingType | GPP406/12/P175 (Vybrané derivační vztahy pro automatické zpracování češtiny) |
metashare.ResourceInfo#ResourceCreationInfo#FundingInfo#ProjectInfo.fundingType | PRVOUK (PRVOUK) |
metashare.ResourceInfo#ContentInfo.mediaType | text |
metashare.ResourceInfo#TextInfo#SizeInfo.size | 8993 |
metashare.ResourceInfo#TextInfo#SizeInfo.sizeUnit | sentences |
metashare.ResourceInfo#ContactInfo#PersonInfo#OrganizationInfo#CommunicationInfo.email | strakova@ufal.mff.cuni.cz |
dc.rights.label | PUB |
has.files | yes |
branding | LINDAT / CLARIAH-CZ |
sponsor | Univerzita Karlova v Praze (mimo GAUK) SVV 267 314 Teoretické základy informatiky a výpočetní lingvistiky nationalFunds |
sponsor | Ministerstvo školství, mládeže a tělovýchovy České republiky LM2010013 LINDAT/CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat nationalFunds |
sponsor | Grantová agentura České republiky GPP406/12/P175 Vybrané derivační vztahy pro automatické zpracování češtiny nationalFunds |
sponsor | Univerzita Karlova v Praze (mimo GAUK) PRVOUK PRVOUK nationalFunds |
size.info | 8993 sentences |
files.size | 13931704 |
files.count | 1 |
Soubory tohoto záznamu
Licenční kategorie:
Licence: Attribution-NonCommercial-ShareAlike 3.0 Unported (CC BY-NC-SA 3.0)
Publicly Available
Licence: Attribution-NonCommercial-ShareAlike 3.0 Unported (CC BY-NC-SA 3.0)
- Název
- Czech_Named_Entity_Corpus_2.0.zip
- Velikost
- 13.29 MB
- Formát
- application/zip
- Popis
- Czech Named Entity Corpus 2.0
- MD5
- e4962225af8aea82bdcb8ac9bdad6c3b
- cnec2.0
- LICENSE21 kB
- README3 kB
- data
- xml
- named_ent_train.xml1 MB
- named_ent_etest.xml190 kB
- named_ent_dtest.xml188 kB
- named_ent.xml1 MB
- html
- named_ent_train.html1 MB
- named_ent.html2 MB
- named_ent_dtest.html247 kB
- named_ent_etest.html249 kB
- plain
- named_ent_train.txt1 MB
- named_ent_etest.txt137 kB
- named_ent_dtest.txt137 kB
- named_ent.txt1 MB
- treex
- named_ent.treex56 MB
- named_ent_train.treex44 MB
- named_ent_dtest.treex5 MB
- named_ent_etest.treex5 MB
- xml
- tools
- doc
- techrep-ne-2007.pdf600 kB
- doc.pdf162 kB
- statistics.txt746 B
- ne-type-hierarchy.pdf53 kB