Plánovaný rozvoj soustavy vědeckých, technických a ekonomických informací jako jedné ze tří základních složek připravovaného jednotného federálního informačního systému spočívá na principech jednotnosti, komplexnosti, integrace a optimálního využití moderní techniky při zabezpečování informačních potřeb národního hospodářství, zejména vědecké a vývojové základny.
Program státní informační politiky pro vědeckotechnický rozvoj je pro tuto pětiletku konkrétní nosnou bází, která svým pojetím, hospodářskými prostředky a organizací může znamenat rozhodující krok ke splnění uvedených zásad.
Charakteristickým rysem programu je zdůraznění realizačních aspektů, v průběhu této pětiletky provádět změny a zavádět inovace za účelem zlepšení informační služby a připravit pro další pětiletku kvalitativní skok této činnosti důsledným využitím systémového inženýrství, výpočetní, reprografické a spojovací techniky a ostatních oborů.
Aby využití jmenovaných nástrojů bylo v nejbližší budoucnosti nejen možné, ale i plně efektivní, bylo nutno v úvodní řešitelské etapě jmenovaného státního úkolu stanovit na základě shrnutí a analýzy soudobých světových vývojových trendů v oblasti racionalizace informačního procesu a také na základě vyvození závěrů z dosavadního vývoje, zejména automatizace, v naší informační soustavě zásadní koncepci a určit hlavní článek strategie příštího reálného postupu.
Především je to komplexní pojetí informačního systému, nejen racionalizace jeho bibliografickoinformačních služeb, ale prosazování komplexní racionalizace zaváděním prostředků výpočetní, spojovací, reprografické a jiné kancelářské a skladové techniky do celého systému informačních agend.
Tento systém informačních agend je chápán jako systém vzájemně navazujících činností od objednávky a akvizice primárních dokumentů přes jejich katalogizační, bibliografické, dokumentační zpracování až po výpůjční služby, registraci koloběhu primárních fondů a sledování jejich využití se zpětnou vazbou na akviziční politiku a tvorbu sekundárních fondů.
Základem tohoto směru je orientace na maximální využití počítačů spojených s dostatečně kapacitní reprografickou technikou, která již v mnohých rysech souvisí s polygrafií, programový tisk.
V oblasti nasazování výpočetní techniky je závažným rysem orientace na počítače # a vyšších generací, neboť jenom tento typ splňuje dnes již nezbytnou podmínku technické a softwarové kompatibility více výpočetních systémů a tím i přenosu a výměny informací mezi jednotlivými informačními systémy a subsystémy.
V tomto směru jde o plné využití všech charakteristických vlastností generace, zejména pokud jde o kapacitu uložení hromadných dat, krátkost času odezvy systému při výběrových operacích z rozsáhlých souborů sekundárních informačních fondů, pestrý sortiment přídavných zařízení, zejména displejových terminalů, mnohonásobné napojení dálkových spojů přímo na centrální systém a do budoucna také otevřené koncepce dalšího stavebnicového růstu celého systému.
Podstatou těchto systémů je racionální využití jednou intelektuálně zpracovaného sekundárního informačního fondu, zejména věcné analýzy primárních pramenů informací.
Na základě důsledné delimitace intelektuálního informatického zpracování dokumentů dochází v rámci systémů magnetopáskových služeb k šíření výsledků tohoto zpracování ve formě záznamů uložených na magnetické pásce do všech informačních pracovišť, pro která jsou relevantní a která, aniž tyto soubory musí tvořit, mohou je prostřednictvím výpočetní techniky a příslušných rozmnožovacích technik využívat adresně a v širokém sortimentu výstupních forem pro svůj specifický okruh uživatelských informačních potřeb.
Tato forma informačního zabezpečení nese s sebou mimo kvality intelektuálního informačního zpracování i výhodu značné ekonomické efektivnosti ve snížení nákladů na pořízení jednoho záznamu.
Proporcionální a harmonické informační pokrytí potřeb vědy a rozvoje národního hospodářství v Československu předpokládá řešení nejen vnitrostátní informační soustavy.
Zdůraznění integračního aspektu a potřeby mezinárodní spolupráce je významné právě z hlediska technologického řešení budovaného informačního systému, protože technické prostředky na určitém stupni vývoje mohou do značné míry ovlivnit organizační řešení systému, avšak pouze za předpokladu správné strategie jejich nasazení a využívání.
Vezmeme- li v úvahu dosavadní neharmonický a v podstatě živelný rozvoj využívání především výpočetní techniky v informatických procesech, jehož výsledkem je současná existence různých, většinou nepropojitelných programových systémů, jejichž ekonomická efektivnost navíc značně pokulhává za skutečnými možnostmi využití počítače, musíme nutně dospět k názoru, že integrovanou, to znamená přinejmenším vnitřně propojenou a systémově organizovanou informační soustavu nelze stavět dosavadním způsobem.
Klíčový vliv na kvalitu celého informačního systému, který dnes více než kdy jindy mají moderní technické prostředky, je třeba v další výstavbě soustavy respektovat.
Především v zásadě, že síť vzájemně propojitelných technických zařízení, na nichž má být v budoucnu integrace soustavy založena, nelze stavět zdola od decentralizovaných subsystémů.
Naopak je především nutné vytvořit jednotnou koncepci a vybudovat nejprve centrální technologický celek, na který se budou decentralizované systémy postupně napojovat a který tím pro tyto subsystémy určí parametry, kterým se musí, jestliže se chtějí napojit, ve své technologii podřídit.
Tuto jednotnou linii je možné realizovat jedině z centra, po důkladné analýze světových vývojových trendů a domácích uživatelských potřeb a za podmínky soustředění kapacit jinak neúčelně roztroušených po drobných navzájem nekoordinovaných informačních subsystémech.
Shrnutím těchto zásadních výchozích úvah o strategii dalšího postupu výstavby informační soustavy na bázi optimálního využití moderní techniky, především kybernetizace, dospíváme k hlavním zásadám, na nichž je třeba tuto výstavbu koncipovat.
Zajištění možnosti výměny bází zpracovaných sekundárních informačních dat prostřednictvím magnetopáskových služeb vnitrostátně i se zahraničními systémy.
Přednostní výstavba hlavního technologického uzlu při postupném budování integrované informační soustavy pracující na zásadách systémového řízení a kybernetizace.
Z těchto zásad vyplynula v rámci řešení státního výzkumného úkolu kybernetizace soustavy VTEI s návazností na mezinárodní systémy koncepce vybudování ústřední technické základny UVTEI, která by svou pracovní náplní centrálně zabezpečovala technický servis pro celou naši informační soustavu.
Ústřední technická základna, dále jen ÚTZ, je chápána jako technologický komplex technicky zabezpečující vstupní zpracování, uložení a adresní šíření vědeckých informací pro celou soustavu VTEI a hlavní státní orgány řídící vědeckotechnický rozvoj ČSSR, dále řízení informační soustavy a spolupráci této soustavy jako celku se světovými informačními systémy.
Technologický komplex ÚTZ bude jako systém na svém vstupu a výstupu napojen jednak na hlavní informační centra v rámci soustavy VTEI, na řídící odvětvová informační centra a státní knihovny, jednak na hlavní zahraniční informační centra, viz volně vložené schéma.
Obě tyto větve splynou v dokonalý technický a intelektuální servis sloužící celé soustavě VTEI k podpoře vědeckotechnické revoluce v celém národním hospodářství.
Strojové zpracování, akvizice zahraničních knih a časopisů spolu s koordinací nákupu mezinárodní výměny publikací a hospodářsko-administrativnímzabezpečováním akvizice.
Výstupní doklady budou dostávat odborné útvary ústředních evidencí, které si již samy budou organizovat jejich distribuci, jako vedlejší zpracovatelské operace bude nutno provádět u některých evidencí cest do zahraničí průběžná i jednorázová retrospektivní statistická šetření.
V této agendě by se mohl strojově organizovat a zabezpečovat nákup a výměna zahraničních publikací, především pro tvorbu centrálních knižních a časopiseckých fondů a dále i pro jednotlivá informační pracoviště sítě VTEI, zejména knihovny.
Organizační a intelektuálně zpracovatelské zajištění by pochopitelně prováděly příslušné odborné knihovnické útvary, ÚTZ by zajišťovala pouze hotový projekt a strojové zpracování.
Katalog bude zachycovat veškeré získané zahraniční publikace spolu s informacemi o místě, instituci, kde jsou uloženy a odtud jsou dostupné pro celou informační soustavu.
Základem pro komplexní dokumentační a bibliografické pokrytí světové literární vědeckoinformační produkce bude využití oborových a odvětvových magnetopáskových bází dat.
Vstupem do systému bude periodicky zasílaný soubor strojově zpracovaných dat z národní produkce a z řady magnetopáskových služeb, jako CAS, INSPEC, MEDLARS, obsahujících již zpracované úplné dokumentační a bibliografické záznamy nových pramenů informací a sloužících informačním potřebám v jednotlivých odvětvích národního hospodářství.
Vzhledem k rozdílům ve strojové struktuře záznamů u různých magnetopáskových zpracování bude třeba konverze na jednotnou strukturu vhodnou pro další výběrové operace.
Lze předpokládat, že některé z těchto záznamů budou v podobě magnetopáskových souborů a ostatní bude nutno z jiného média na magnetickou pásku převést.
Na základě těchto operací budou rozděleny na podsoubory podle obsahových, tematických a částečně formálních, název časopisu, druh pramene, kritérií a utříděny podle dalších obsahových a formálních kritérií, tematicky, podle autorů.
Výstupem ze systému po výběrových operacích budou jednak tištěné adresní průběžné rešerše pro užší okruh řídících a koncepčních pracovníků, periodické informační bulletiny a též magnetopáskové soubory záznamů v jednotné struktuře v rámci vymezené tematické oblasti informací určené pro zpracovatelské účely v jednotlivých odvětvích soustavy VTEI.
Hlavním účelem strojového zpracování národní bibliografie je zefektivnění řadících a edičních prací s možnostmi statistických analýz obsáhlých souborů bibliografických dat v národní knižní a časopisecké produkci.
Celý postup projekce a zpracování české národní bibliografie bude třeba důsledně koordinovat s postupy vytváření Slovenské národní bibliografie v Matici slovenské v Martině.
Vstup do systému strojového zpracování bude tvořen různými druhy záznamů v položkách, s nimiž se ve výpůjčním procesu operuje, a záznamů o transakcích s těmito položkami.
Zpracovatelské operace počítače budou různorodé a vzájemně se prolínající, složené vesměs z řadících operací, kontrol duplicit, doplňování, oprav a rušení celých nebo částí uložených záznamů, výběrových operací a statistických šetření, podobně jako v automatizovaných systémech skladového hospodářství.
Řada těchto operací se bude provádět v režimu OLRT, online, real time, registrace, výpůjčky, zjišťovací operace o stavu určité knihovní jednotky a další operace, zabezpečování rezervací, urgence, zaznamenání čtenářů, statistiky se budou provádět v režimu offline podle připravovaných projektů.
Většina výstupů ze systému bude permanentně zpracována pro displejové obrazovkové terminaly v režimu online, odpovědi na dotazy o možnosti výpůjčky určité publikace, potvrzení registrace výpůjčky z diskového paměťového souboru, záznamů výpůjček.
Náleží sem počítačové zpracování výběrů pro vyhledávání na mikrofilmových pásech, předběžná selekce a zjištění pořadového čísla příslušné mikrokopie dokumentu, podle něhož se v druhé fázi vyhledává již na filmovém selektoru, a dále počítačové zpracování programové sazby fototisku některých bulletinů, bibliografií a katalogů.
Požadavky na vstupní, vnitřní i výstupní počítačové zpracování pro potřeby automatického tisku jsou dány předpokládanými parametry vstupního zpracování především národní bibliografie, agenda * , dále některých magnetopáskových odvětvových služeb, pokud by se příslušné bulletiny tiskly polygraficky, agenda * , a případně větších kumulátů souborného katalogu zahraniční literatury.
Tato báze dat, která bude tvořit nutný předpoklad pro efektivní řízení a další rozvoj soustavy VTEI, bude napájena soubory komplexních faktografických údajů o jednotlivých informačních pracovištích a vztazích mezi nimi.
Do databanky budou permanentně přicházet zprvu především komplexní soubory údajů o informačních pracovištích, jeden komplexní faktografický záznam bude odpovídat jednomu pracovišti, a dále soubory jednotlivých údajů, které budou doplňovat a korigovat dosud získané údaje o jednotlivých informačních pracovištích a jejich vzájemných vztazích.
Výstupní zpracování bude mít charakter jednak výpisů odpovědí na různé vyhledávací požadavky formulované věcně i formálně včetně numerických vymezení odpovědi buď v režimu online, v softcopy, nebo v obou režimech online, offline a hardcopy, jednak budou vyúsťovat do různých utříděných soupisů, rejstříků a statistických sestav.
Při koncipování zpracovatelských funkcí ÚTZ byl záměrně kladen důraz na komplexnost a vzájemnou návaznost všech základních forem informační obsluhy uživatele.
Soustředěním těchto nosných funkcí vzniká předpoklad koordinace informačních činností v celostátním měřítku nejen ve sféře sekundárních zpracování dokumentů, ale zejména v oblasti získávání a zprostředkování primárních dokumentů podle permanentně zjišťovaných potřeb.
Ze systémového hlediska řešení integrace soustavy VTEI bude ÚTZ technickou bází pro úzkou spolupráci mezi jednotlivými odvětvovými subsystémy a regionálními subsystémy.
Vyvolá nutně tlak na vytváření technických bází v těchto subsystémech, ovšem s jasně formulovanou koncepcí, pokud jde o obsahové a technické parametry pro zajištění vzájemné kompatibility.
V komplexním programu dalšího prohlubování a zdokonalování spolupráce a rozvoje socialistické ekonomické integrace členských států RVHP přijatém na # zasedání RVHP v červenci # je výslovně doporučena spolupráce národních soustav VTEI na základě budování jednotného systému.
Zároveň daný záměr zapadá do vytčených hlavních směrů racionalizačních opatření podle usnesení vlády ze dne # srpna # o koncepci dalšího rozvoje komplexní socialistické racionalizace v ČSSR.
Pro oblast racionalizace informačních soustav je tímto usnesením vlády uloženo zaměřit se na nasazení moderní výpočetní techniky při sběru, přenosu, uchování a zpracování informací.
V současné době probíhá v souvislosti se zabezpečením potřebných kapacit na vybudování ÚTZ, včetně získání vhodné výpočetní techniky, proces analýzy a zpracování řady podkladových materiálů pro schvalovací řízení ve vedoucích orgánech FMTIR a UVTEI.
Je naprosto jasné, že celý proces nutných přípravných prací před zahájením provozu, který je v prozatímních návrzích plánován na # léta, bude nesmírně náročný a vyžádá si soustředění příslušné intelektuální a finanční kapacity nejen v centru, ale v podstatě v celé informační soustavě.
Vhodným nástrojem pro toto soustředěné úsilí bude především platforma programu SIP, v jehož řadě státních i dílčích úkolů budou příslušné problémy řešeny.
Bylo vyvinuto mnoho různých metod lišících se jak přístupem ke zpracovávaným podkladům, tak i použitým typem selekčního jazyka, dále SJ, stupněm využití výsledků teoretických výzkumů.
Cílem tohoto článku proto nemůže být vyčerpávající přehled všech dosud realizovaných experimentů s AI, musíme se omezit pouze na stručný popis několika vybraných charakteristických metod AI založených na různých principech.
Indexování tedy budeme pokládat za jakýsi překlad textu v přirozeném jazyce, dále PJ, do zápisu v SJ, při kterém však na rozdíl od překladu mezi dvěma PJ dochází k současné redukci přenášeného informačního obsahu a překládá se především ta část, která je důležitá z hlediska dalšího zpracování při následujících operacích selekce dokumentů na základě příslušných rešeršních požadavků.
Proces AI pak můžeme rozdělit na dvě části, analýzu textu v PJ a syntézu v SJ, přičemž cílem analýzy je získat soubor charakteristik, které budou jednoznačně a explicitně vyjadřovat obsah redukované části dokumentu a poslouží jako dostačující podklad pro následující syntézu v SJ.
Jelikož jsou metody analýzy i syntézy podstatně obtížnější při indexování do SJ se složitějšími formami syntaxe, jsou zde popsané metody rozděleny do dvou základních oddílů, metody AI pracující se SJ s nejjednoduššími formami syntaxe a metody AI pracující se SJ se složitější syntaxí.