Katalog
Repozitář
Vzdělávání
Projekty
Nástroje
Služby
O nás
Partneři
Prohlášení o poslání
CLARIN
DARIAH
Integrace služeb
Projektové partnerství
Přihlásit se
Domovská stránka repozitáře LINDAT/CLARIAH-CZ
Zobrazit záznam
Show/Hide Menu
Procházet
Vše v repozitáři
Dle data publikování
Autoři
Názvy
Klíčová slova
Vydavatel
Jazyk
Typ
Dle práv
Můj účet
Přihlásit se
Statistiky
Statistiky
BETA
Obecné informace
Nahrát
Cituj
Stavy záznamu
FAQ
O repozitáři
Poradna
Victor
LINDAT / CLARIAH-CZ
Autoři
Marek, Michal
Identifikátor
http://hdl.handle.net/11858/00-097C-0000-0001-48FD-B
URL projektu
http://ufal.mff.cuni.cz/victor/
Datum vydání
2009-11-02
Typ
toolService
Popis
Victor is a web page cleaning tool. It is aimed at removing menu, ads, footers, headers, etc. from HTML web pages, so that only main web page content remains. Victor is based on a conditional random fields algorithm.
Nakladatel
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Klíčová slova
html cleaning
Kolekce
LINDAT / CLARIAH-CZ Data & Tools
Zobrazit celý záznam
Soubory tohoto záznamu
Licenční kategorie:
Publicly Available
Licence:
GNU General Public License, version 2
Název
victor-1.0-beta.tar.bz2
Velikost
1.79 MB
Formát
application/x-bzip2
Popis
Installation file (Linux, 32bits)
MD5
3cbeda259d5eefee2d5bd8fed1a531ee
Stáhnout soubor