Arhiserv

Lun - Vin 8.00 - 16.00

Sâmbătă, Duminică ÎNCHIS

Str. Mircea cel Bătrân nr 119

Ploiești, PRAHOVA

0757.329.670

Apel Taxabil Normal

0757.329.670

Apel Taxabil Normal

Inceputurile arhivarii electronice

Despre arhivarea electronica a inceput sa se discute inca din 1999, an in care Romeo Mihai Pavelescu, doctorand la acea vreme al Academiei de Studii Economice, publica in Revista Informatica Economica nr. 10/1999, articolul: Arhivarea electronica a Documentelor. Mai jos puteti citi articolul.

Articolul de fata încearca sa scoata în evidenta importanta exploatarii la maxim a surselor interne de date si informatii în adoptarea rapida a deciziilor. Pentru aceasta este necesara implementarea în cadrul organizatiei respective a unui sistem de gestiune si arhivare electronica a documentelor. Proiectarea si implementarea unui sistem de gestiune si arhivare electronica a documentelor în cadrul unei firmei sau institutii este o activitate complexa si consumatoare de resurse financiare, în special pe linia achizitiei de tehnica de calcul, însa eforturile vor fi rasplatite din plin de eficienta accesului la informatie si de eliminarea timpilor morti în circuitul documentelor.

Cuvinte cheie: arhivare, proiectare, resurse, gestiune eficienta.

Evolutia spectaculoasa a tehnologiei informatiei (IT) din ultimul deceniu ridica stacheta în privinta accesului rapid si facil la o informatie corecta si de actualitate. Managerii zilei de azi pot obtine informatii, în domeniul lor de activitate, din doua tipuri de surse:

  • Surse externe organizatiei pe care o conduc;
  • Surse interne organizatiei pe care o conduc.

Sursele externe sunt variate si INTERNETUL ar trebui sa ocupe un loc important printre acestea. Sursele interne se refera la acele instrumente care ar trebui sa existe în cadrul unei organizatii astfel încât, periodic sau ori de câte ori este nevoie, sa ofere date despre activitatea interna: flux informational, calitatea serviciilor si produselor, probleme de personal, etc.

Arhivarea electronica a documentelor poate fi vazuta ca parte componenta a unui sistem de gestiune a documentelor, dar poate constitui si o activitatea de sine statatoare, mai ales în cadrul institutiilor publice detinatoare de arhive impresionante ca volum si valoare a continutului.

Datele si informatiile existente în arhive se afla sub cele mai diverse forme, cum ar fi hârtie, fisiere electronice, înregistrari audio, clipuri video, microfilme. Preluarea acestora într-un sistem de prelucrare automata a datelor presupune, în principal, scanarea/importarea, indexarea, stocarea lor pe suporti de memorare de mare capacitate si caracterizati de o fiabilitate foarte ridicata si regasirea lor dupa diferite criterii.

Înainte de a intra în amanuntele procesului de arhivare electronica este necesara definirea exacta a notiunii de arhiva.

O arhiva este formata din date si informatii, indiferent de suportul pe care se afla, care trebuiesc protejate si conservate în vederea consultarii ulterioare pe criterii istorice, culturale sau juridice. Chiar si în ziua de astazi cea mai mare parte a informatiei se afla înregistrata pe hârtie ceea ce necesita un spatiu mare de stocare si este foarte vulnerabila la conditiile de mediu ca umiditate, foc, aciditate, etc.

Concluzionând, poate deveni foarte dificil de organizat si conservat în bune conditii informatia existenta într-o arhiva. Solutia la aceste probleme este transferul informatiilor existente pe suporti de memorare mai putin vulnerabili si care sa ocupe spatiu fizic de stocare cât mai mic.

Scanarea presupune „fotografierea” documentelor (hârtie sau microfilm) si constituirea documentelor electronice pe baza imaginilor obtinute.

Viteza de scanare a hârtiei poate atinge valori mari (40 pag./minut) în cazurile în care calitatea acesteia este buna, altfel depinde de viteza de manevrare a operatorului. Revista Informatica Economica, nr. 10/1999 73 În cazul scanarii microfilmelor, viteza poate fi mare doar daca documentele se afla pe role de film.

În proiectarea unui sistem de arhivare este foarte importanta alegerea formatului în care se vor memora imaginile scanate. Acesta trebuie sa asigure pe lânga o usoara manevrare si un algoritm bun de compresie.

În mod evident, unele imagini au o rata de comprimare mai buna decât altele. Un document cu un procentaj mare de spatiu alb va putea fi comprimat cu o rata foarte ridicata spre deosebire de o fotografie care nu poate fi comprimata chiar deloc. În acest scop Consultative Committee on International Telephones and Telegraphy (CCITT), o agentie a Natiunilor Unite, a elaborat câteva standarde internationale pentru transmisia de imagini digitizate sau FAX. Aceste metode, cunoscute ca Group III si Group IV FAX, utilizeaza algoritmii Huffman si run-length. Diferenta între cele doua metode de compresie consta în faptul ca Group IV FAX se bazeaza pe o analiza bidimensionala a imaginii spre deosebire de o analiza unidimensionala în cazul Group III.

Este recomandabila utilizarea fisierelor multipagina în format TIFF datorita usurintei în manipulare a acestora. În etapa de scanare a documentelor este necesara uneori prelucrarea si reconditionarea imaginilor obtinute datorita calitatii scazute a documentelor originale. Indexarea documentelor electronice, obtinute în urma scanarii sau în urma importarii, în cazul email-urilor sau fisierelor electronice existente pe diferiti suporti magnetici, consta în atasarea unui numar unic de identificare si a mai multor cuvinte cheie dupa care acesta va putea fi regasit.

O alta metoda de indexare se bazeaza pe recunoasterea optica a caracterelor (OCR) din cadrul imaginilor si introducerea textului obtinut în baza de date având ca referinta numarul unic de identificare a documentului. Aceasta ultima varianta devine eficienta atunci când documentul original a fost batut la o masina de scris sau scos la imprimanta si în plus software-ul de recunoastere optica a caracterelor utilizeaza un dictionar de cuvinte specific limbii în care a fost scris documentul. Totodata prin indexare se converteste informatia nestructurata în informatie ce poate fi accesata cu usurinta, din orice punct al intranet-ului.

O alternativa la structurarea documentelor electronice (non imagine) o constituie utilizarea motoarelor dedicate de indexare/cautare documente precum: dtSearch si ISIS. Pe scurt, acestea pot fi configurate sa indexeze automat orice document (în diverse formate) la adaugarea sa într-un director pe disk. Cu ajutorul unei aplicatii client se pot genera cereri de cautare bazate pe operatori logici si subsiruri obtinându-se ca rezultat documente si pozitiile acestora în structura de directoare indexata. Toate informatiile introduse sau obtinute în etapa de indexare vor constitui o baza de date care va permite regasirea rapida a documentelor si efectuarea de statistici cu privire la vechimea fondului arhivistic, categoriile de documente existente, calitatea documentelor originale la momentul introducerii în prelucrare automata, etc. Imaginile digitizate necesita capacitati foarte mari de memorare.

În paralel cu alte calitati stocarea imaginilor trebuie sa se faca la un pret scazut per bit pentru a realiza un sistem viabil de arhivare. Tehnologia discurilor magneto-optice ofera o solutie buna pentru stocare pe termen lung a imaginilor digitizate.

Un disc magneto-optic este un disc pe care se pot memora date prin schimbarea polaritatii locale cu ajutorul unei raze laser folosita pentru încalzirea locala la temperaturi mari si a unui mic câmp magnetic extern aplicat dupa atingerea punctului curie.

Citirea discului se bazeaza pe reflexia diferita a razei laser atunci când aceasta întâlneste un spot polarizat al discului. Un disc magneto-optic poate memora pâna la 5 GB. Daca sunt necesare capacitati mari de stocare se pot utiliza jukebox-uri ce pot 74 Revista Informatica Economica, nr. 10/1999 incorpora de la 20 de discuri magneto-optice pâna la 258. La alegerea sistemului de stocare trebuie tinut cont de faptul ca nu exista o standardizare a discurilor magneto-optice si deci schimbarea ulterioara a producatorului de jukebox-uri sau de drive-uri magneto-optice poate ridica probleme serioase.

Software-ul de arhivare va trebui sa permita o anumita ritmicitate a operatiilor mai sus mentionate, astfel încât sa nu apara supra- încarcari ale retelei de arhivare si totodata sa permita consultarea facila a documentelor electronice introduse. Datorita faptului ca o arhiva presupune existenta unui volum foarte mare de date, în etapa de proiectare a aplicatiei de arhivare electronica trebuie sa se aleaga un sistem de gestiune a bazelor de date relationale (SGBDR) care poate prelucra asemenea cantitati de informatie (ORACLE, SQLSERVER, INFORMIX, etc.)

Totodata, integritatea bazei de date, create în etapa de indexare, este la fel de importanta ca documentele existente pe discuri magneto-optice. De aceea, trebuiesc prevazute sisteme de siguranta corespunzatoare precum: backup-uri periodice, utilizarea sistemelor redundante de discuri ca RAID 1 (mirroring) si RAID 5 (disk stripting).

Problematica arhivarii electronice a documentelor este veche însa odata cu evolutia tehnicii de calcul pot fi identificate solutii din ce în ce mai fiabile. La ora actuala exista pe piata româneasca câteva solutii software integrate însa pentru ca acestea sa poata fi implementate cu succes trebuiesc particularizate functie de specificul si istoricul documentelor ce vor face obiectul arhivarii electronice. Arhivarea electronica a documentelor prin scanare este o activitate foarte mare consumatoare de resurse si de aceea în paralel cu aceasta ar trebui sa functioneze un sistem de gestiune electronica a documentelor care va minimiza crearea de documente sub forma de hârtie sau film. Piata aplicatiilor de management a documentelor este foarte dinamica, mai ales în ultima vreme, datorita faptului ca în acest moment exista din punct de vedere hardware solutii viabile însa din punct de vedere software mai sunt multe de pus la punct.

Astfel, Xerox Corporation si Compaq Computer Corporation au anuntat, pe data de 18 mai, stabilirea unei întelegeri prin care sa se realizeze conectarea informatiilor preluate de pe hârtie, scanate cu ajutorul sistemului Xerox Document Centre, cu Compaq Work Expeditor, cel mai important produs software de management al activitatilor, care extinde facilitatile oferite de Microsoft Exchange prin adaugarea unor procese care automatizeaza si ofera siguranta managementului activitatilor. Totodata, pe piata româneasca si-a facut aparitia firma FILENET, o firma cu experienta foarte mare în domeniul managementului documentelor, care a realizat pâna în acest moment mai multe implementari la firme, institutii si corporatii cu renume în lume.

Bibliografie:

  • Archival Information System (AIS), 1992, by Standard Technology Incorporated
  • Optical Digital Image Storage System, 1991, by National Archives and Records Administration – Study on the Automation of the Archiving System, 1995, by Ampaco