Zobrazit minimální záznam

 
dc.contributor.author Suchomel, Vít
dc.contributor.author Rychlý, Pavel
dc.date.accessioned 2018-01-11T15:32:58Z
dc.date.available 2018-01-11T15:32:58Z
dc.date.issued 2016
dc.identifier.uri http://hdl.handle.net/11234/1-2592
dc.description Tigrinya web corpus. Crawled by SpiderLing in January 2016. Encoded in UTF-8, cleaned, deduplicated.
dc.language.iso tir
dc.publisher Masaryk University, NLP Centre
dc.relation.isreferencedby https://www.sketchengine.co.uk/wp-content/uploads/2015/05/Corpus_Factory_2010.pdf
dc.relation.isreferencedby http://habit-project.eu/wiki/TigrinyaCorpus
dc.rights NLP Centre Web Corpus License
dc.rights.uri https://lindat.mff.cuni.cz/repository/xmlui/page/license-NLPC-WeC
dc.source.uri http://habit-project.eu/wiki/HabitSystemFinal
dc.subject text corpora
dc.subject Ethiopian languages
dc.subject web corpora
dc.subject under-resourced languages
dc.subject Tigrinya
dc.subject Tigrigna
dc.title Tigrinya Web Corpus
dc.type corpus
metashare.ResourceInfo#ContentInfo.mediaType text
dc.rights.label ACA
has.files yes
branding LINDAT / CLARIAH-CZ
demo.uri https://corpora.fi.muni.cz/habit/run.cgi/first_form?corpname=tiwac16
contact.person Marie Stará nlpassist@aurora.fi.muni.cz Masaryk University, NLP Centre
sponsor Norway Grants 7F14047 Harvesting big text data for under-resourced languages (HaBiT) Other
sponsor Ministerstvo školství, mládeže a tělovýchovy České republiky LM2015071 LINDAT/CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat nationalFunds
size.info 2531443 tokens
size.info 2087613 words
size.info 139357 sentences
files.size 14005208
files.count 1


 Soubory tohoto záznamu

Licenční kategorie:
Academic Use

Licence: NLP Centre Web Corpus License
Icon
Název
ti16.tag.vert.gz
Velikost
13.36 MB
Formát
application/x-gzip
Popis
Tigrinya web corpus
MD5
f88d42ad6c989e472a35d56a1aed4003
 Stáhnout soubor

Zobrazit minimální záznam