Show simple item record

 
dc.contributor.author Ševčíková, Magda
dc.contributor.author Žabokrtský, Zdeněk
dc.contributor.author Straková, Jana
dc.contributor.author Straka, Milan
dc.date.accessioned 2014-01-09T10:03:56Z
dc.date.available 2014-01-09T10:03:56Z
dc.date.issued 2014-01-09
dc.identifier.uri http://hdl.handle.net/11858/00-097C-0000-0023-1B04-C
dc.description Czech Named Entity Corpus 1.1 fixes some issues of the Czech Named Entity Corpus 1.0: misannotated entities are fixed, all formats contain the same data, tmt format is replaced with treex format, all formats contain splitting into training, development and testing portion of the data.
dc.description.sponsorship SVV 267 314 (Teoretické základy informatiky a výpočetní lingvistiky), LM2010013 (LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat), GPP406/12/P175 (Vybrané derivační vztahy pro automatické zpracování češtiny), PRVOUK (PRVOUK)
dc.language.iso ces
dc.publisher Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
dc.relation.replaces http://hdl.handle.net/11858/00-097C-0000-0022-C73C-7
dc.rights Attribution-NonCommercial-ShareAlike 3.0 Unported (CC BY-NC-SA 3.0)
dc.rights.uri http://creativecommons.org/licenses/by-nc-sa/3.0/
dc.source.uri http://ufal.mff.cuni.cz/cnec/
dc.subject named entity recognition
dc.subject corpus
dc.title Czech Named Entity Corpus 1.1
dc.type corpus
metashare.ResourceInfo#ContactInfo#PersonInfo.surname Straková
metashare.ResourceInfo#ContactInfo#PersonInfo.givenName Jana
metashare.ResourceInfo#ContactInfo#PersonInfo#OrganizationInfo.organizationName Charles University in Prague, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics in Prague
metashare.ResourceInfo#DistributionInfo.availability unrestrictedUse
metashare.ResourceInfo#ResourceCreationInfo#FundingInfo#ProjectInfo.projectName SVV 267 314 (Teoretické základy informatiky a výpočetní lingvistiky)
metashare.ResourceInfo#ResourceCreationInfo#FundingInfo#ProjectInfo.projectName LM2010013 (LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat)
metashare.ResourceInfo#ResourceCreationInfo#FundingInfo#ProjectInfo.projectName GPP406/12/P175 (Vybrané derivační vztahy pro automatické zpracování češtiny)
metashare.ResourceInfo#ResourceCreationInfo#FundingInfo#ProjectInfo.projectName PRVOUK (PRVOUK)
metashare.ResourceInfo#ContentInfo.mediaType text
metashare.ResourceInfo#TextInfo#SizeInfo.size 5868
metashare.ResourceInfo#TextInfo#SizeInfo.sizeUnit sentences
metashare.ResourceInfo#ContactInfo#PersonInfo#OrganizationInfo#CommunicationInfo.email strakova@ufal.mff.cuni.cz
dc.rights.label PUB
has.files yes
branding LINDAT / CLARIAH-CZ
sponsor Univerzita Karlova v Praze (mimo GAUK) SVV 267 314 Teoretické základy informatiky a výpočetní lingvistiky nationalFunds
sponsor Ministerstvo školství, mládeže a tělovýchovy České republiky LM2010013 LINDAT/CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat nationalFunds
sponsor Grantová agentura České republiky GPP406/12/P175 Vybrané derivační vztahy pro automatické zpracování češtiny nationalFunds
sponsor Univerzita Karlova v Praze (mimo GAUK) PRVOUK PRVOUK nationalFunds
size.info 5868 sentences
files.size 10987946
files.count 1


 Files in this item

This item is
Publicly Available
and licensed under:
Attribution-NonCommercial-ShareAlike 3.0 Unported (CC BY-NC-SA 3.0)
Distributed under Creative Commons Attribution Required Noncommercial Share Alike
Icon
Name
Czech_Named_Entity_Corpus_1.1.zip
Size
10.48 MB
Format
application/zip
Description
Czech Named Entity Corpus 1.1
MD5
9457d49807c494a23a5f029f88fa09a6
 Download file  Preview
 File Preview  
  • cnec1.1
    • LICENSE21 kB
    • README3 kB
    • data
      • xml
        • named_ent_train.xml1 MB
        • named_ent_etest.xml156 kB
        • named_ent_dtest.xml153 kB
        • named_ent.xml1 MB
      • html
        • named_ent_train.html1 MB
        • named_ent.html1 MB
        • named_ent_dtest.html207 kB
        • named_ent_etest.html212 kB
      • plain
        • named_ent_train.txt835 kB
        • named_ent_etest.txt106 kB
        • named_ent_dtest.txt105 kB
        • named_ent.txt1 MB
      • treex
        • named_ent.treex43 MB
        • named_ent_train.treex34 MB
        • named_ent_dtest.treex4 MB
        • named_ent_etest.treex4 MB
    • tools
      • statistics.pl509 B
      • Treex
      • namedent_annotations_to_html.pl3 kB
      • namedent_annotations_to_xml_simple.pl559 B
      • compare_ne_outputs_v2.pl14 kB
    • doc
      • techrep-ne-2007.pdf600 kB
      • doc.pdf151 kB
      • statistics.txt923 B
      • ne-type-hierarchy.pdf54 kB

Show simple item record