Show simple item record

 
dc.contributor.author Ševčíková, Magda
dc.contributor.author Žabokrtský, Zdeněk
dc.contributor.author Straková, Jana
dc.contributor.author Straka, Milan
dc.date.accessioned 2014-01-09T10:24:31Z
dc.date.available 2014-01-09T10:24:31Z
dc.date.issued 2014-01-09
dc.identifier.uri http://hdl.handle.net/11858/00-097C-0000-0023-1B22-8
dc.description Czech Named Entity Corpus 2.0 is a corpus of 8993 Czech sentences with manually annotated 35220 Czech named entities, classified according to a two-level hierarchy of 46 named entities.
dc.description.sponsorship SVV 267 314 (Teoretické základy informatiky a výpočetní lingvistiky), LM2010013 (LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat), GPP406/12/P175 (Vybrané derivační vztahy pro automatické zpracování češtiny), PRVOUK (PRVOUK)
dc.language.iso ces
dc.publisher Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
dc.rights Attribution-NonCommercial-ShareAlike 3.0 Unported (CC BY-NC-SA 3.0)
dc.rights.uri http://creativecommons.org/licenses/by-nc-sa/3.0/
dc.source.uri http://ufal.mff.cuni.cz/cnec/
dc.subject named entity recognition
dc.title Czech Named Entity Corpus 2.0
dc.type corpus
metashare.ResourceInfo#ContactInfo#PersonInfo.surname Straková
metashare.ResourceInfo#ContactInfo#PersonInfo.givenName Jana
metashare.ResourceInfo#ContactInfo#PersonInfo#OrganizationInfo.organizationName Charles University in Prague, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics in Prague
metashare.ResourceInfo#DistributionInfo.availability unrestrictedUse
metashare.ResourceInfo#ResourceCreationInfo#FundingInfo#ProjectInfo.fundingType SVV 267 314 (Teoretické základy informatiky a výpočetní lingvistiky)
metashare.ResourceInfo#ResourceCreationInfo#FundingInfo#ProjectInfo.fundingType LM2010013 (LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat)
metashare.ResourceInfo#ResourceCreationInfo#FundingInfo#ProjectInfo.fundingType GPP406/12/P175 (Vybrané derivační vztahy pro automatické zpracování češtiny)
metashare.ResourceInfo#ResourceCreationInfo#FundingInfo#ProjectInfo.fundingType PRVOUK (PRVOUK)
metashare.ResourceInfo#ContentInfo.mediaType text
metashare.ResourceInfo#TextInfo#SizeInfo.size 8993
metashare.ResourceInfo#TextInfo#SizeInfo.sizeUnit sentences
metashare.ResourceInfo#ContactInfo#PersonInfo#OrganizationInfo#CommunicationInfo.email strakova@ufal.mff.cuni.cz
dc.rights.label PUB
has.files yes
branding LINDAT / CLARIAH-CZ
sponsor Univerzita Karlova v Praze (mimo GAUK) SVV 267 314 Teoretické základy informatiky a výpočetní lingvistiky nationalFunds
sponsor Ministerstvo školství, mládeže a tělovýchovy České republiky LM2010013 LINDAT/CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat nationalFunds
sponsor Grantová agentura České republiky GPP406/12/P175 Vybrané derivační vztahy pro automatické zpracování češtiny nationalFunds
sponsor Univerzita Karlova v Praze (mimo GAUK) PRVOUK PRVOUK nationalFunds
size.info 8993 sentences
files.size 13931704
files.count 1


 Files in this item

This item is
Publicly Available
and licensed under:
Attribution-NonCommercial-ShareAlike 3.0 Unported (CC BY-NC-SA 3.0)
Distributed under Creative Commons Attribution Required Noncommercial Share Alike
Icon
Name
Czech_Named_Entity_Corpus_2.0.zip
Size
13.29 MB
Format
application/zip
Description
Czech Named Entity Corpus 2.0
MD5
e4962225af8aea82bdcb8ac9bdad6c3b
 Download file  Preview
 File Preview  
  • cnec2.0
    • LICENSE21 kB
    • README3 kB
    • data
      • xml
        • named_ent_train.xml1 MB
        • named_ent_etest.xml190 kB
        • named_ent_dtest.xml188 kB
        • named_ent.xml1 MB
      • html
        • named_ent_train.html1 MB
        • named_ent.html2 MB
        • named_ent_dtest.html247 kB
        • named_ent_etest.html249 kB
      • plain
        • named_ent_train.txt1 MB
        • named_ent_etest.txt137 kB
        • named_ent_dtest.txt137 kB
        • named_ent.txt1 MB
      • treex
        • named_ent.treex56 MB
        • named_ent_train.treex44 MB
        • named_ent_dtest.treex5 MB
        • named_ent_etest.treex5 MB
    • tools
      • statistics.pl509 B
      • Treex
      • namedent_annotations_to_html.pl3 kB
      • compare_ne_outputs_v3.pl14 kB
      • namedent_annotations_to_xml_simple.pl559 B
    • doc
      • techrep-ne-2007.pdf600 kB
      • doc.pdf162 kB
      • statistics.txt746 B
      • ne-type-hierarchy.pdf53 kB

Show simple item record