Soubory tohoto záznamu

Licenční kategorie:
Publicly Available

Licence: Creative Commons - Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Distributed under Creative Commons Attribution Required Share Alike
Icon
Název
geccc.zip
Velikost
15.08 MB
Formát
application/zip
Popis
corpus data and metadata, zipped
MD5
c1516ca240d97c6b6fae021cfea57ce4
 Stáhnout soubor  Náhled
 Náhled souboru  
  • data
    • meta.tsv3 MB
    • dev
      • paragraph.m21 MB
      • paragraph.meta81 kB
      • sentence.meta191 kB
      • sentence.input523 kB
      • paragraph.gold817 kB
      • sentence.gold823 kB
      • sentence.m22 MB
      • paragraph.input518 kB
    • test
      • paragraph.m22 MB
      • paragraph.meta70 kB
      • sentence.meta170 kB
      • sentence.input506 kB
      • paragraph.gold1009 kB
      • sentence.gold1009 kB
      • sentence.m22 MB
      • paragraph.input507 kB
    • train
      • paragraph.m213 MB
      • paragraph.meta460 kB
      • sentence.meta1 MB
      • sentence.input3 MB
      • paragraph.gold4 MB
      • sentence.gold4 MB
      • sentence.m215 MB
      • paragraph.input3 MB
    • detokenizer.perl12 kB
    • LICENSE19 kB
    • README.md3 kB