Zobrazit minimální záznam

 
dc.contributor.author Hajič, Jan
dc.contributor.author Hric, Jan
dc.date.accessioned 2020-09-09T06:52:30Z
dc.date.available 2020-09-09T06:52:30Z
dc.date.issued 2017-09-14
dc.identifier.uri http://hdl.handle.net/11234/1-3277
dc.description Slovak morphological dictionary modeled after the Czech one. It consists of (word form, lemma, POS tag) triples, reusing the Czech morphological system for POS tags and lemma descriptions.
dc.language.iso slk
dc.publisher Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
dc.rights Creative Commons - Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.rights.uri http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subject Slovak
dc.subject morphological dictionary
dc.title MorfFlex SK 170914
dc.type lexicalConceptualResource
metashare.ResourceInfo#ContentInfo.mediaType text
metashare.ResourceInfo#ContentInfo.detailedType computationalLexicon
dc.rights.label PUB
has.files yes
branding LINDAT / CLARIAH-CZ
contact.person Milan Straka straka@ufal.mff.cuni.cz Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
sponsor Ministerstvo školství, mládeže a tělovýchovy České republiky LM2018101 LINDAT/CLARIAH-CZ: Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy nationalFunds
sponsor Ministerstvo školství, mládeže a tělovýchovy České republiky LM2015071 LINDAT/CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat nationalFunds
size.info 36464145 lexicalTypes
files.size 77022484
files.count 1


 Soubory tohoto záznamu

Icon
Název
morfflex-sk.2017-09-14.utf8.lemmaID_suff-tag-form.tab.csv.xz
Velikost
73.45 MB
Formát
application/x-xz
Popis
Full (morphologically analyzed) wordlist for Slovak language, with lemma (which includes sense suffix (-<number>) and semantic/synt. suffixes and comments in PDT format, full positional tag in PDT format, and form (3 fields). Fields are tab separated, always filled by non-empty string, lines end with linefeed only, and coding is UTF-8.
MD5
be7124e9418be32678abb9de3f352cba
 Stáhnout soubor

Zobrazit minimální záznam