Il sottosistema di acquisizione dati massiva è composto di un insieme di agenti e moduli utente dedicati all’archiviazione ed alla dematerializzazione documentale, che permettono di acquisire qualunque tipo di documento cartaceo o elettronico. È possibile definire specifici processi di acquisizione in grado di catturare informazioni e documenti da qualsiasi fonte: sistemi gestionali, banche dati, flussi informativi, scanner, cartelle di file, stampanti, caselle email e fax. I processi possono essere completamente automatici o prevedere l’intervento di un operatore per attività di indicizzazione, verifica o classificazione manuale. Le informazioni acquisite possono essere rilasciate direttamente nel sistema di gestione documentale di Coopera® o in eventuali sistemi esterni.

Nel caso di processi automatizzati, gli “Agenti” sono dei servizi, eseguiti in background e senza il controllo dell’utente, che si occupano di svolgere attività automatiche che possono riguardare l’importazione di file e dati, il riconoscimento ottico, l’analisi delle immagini, l’estrazione del testo, la manipolazione dei dati per la costruzione di indici o l’eventuale rilascio di file e dati per l’utilizzo da parte di sistemi esterni.

Scansione massiva

Modulo utente che consente di acquisire volumi elevati di documenti cartacei e trasformarli in documenti elettronici, in grado di gestire tutti gli scanner che supportano driver ISIS, TWAIN, o KOFAX, e di interfacciarsi con scanner speciali e driver proprietari. Il modulo dispone, inoltre, di una funzionalità di separazione delle pagine, utile a distinguere i diversi documenti e salvarli automaticamente in file separati.

Analisi e riconoscimento

Appartengono a questa categoria un insieme di agenti automatici dedicati al riconoscimento ottico delle informazioni presenti nelle immagini e nei documenti elettronici ed alla loro classificazione automatica in base all’aspetto grafico e al contenuto.

Le funzionalità di riconoscimento identificano (anche dinamicamente) le aree di interesse da cui estrarre il testo secondo differenti modalità (OCR, ICR, OMR, BCR, TXT, …). La classificazione avviene grazie all’analisi di fattori, quali il modello grafico, la presenza di simboli e contenuti, utili a determinare automaticamente il tipo di documento.

Gestione dati

Questa categoria di agenti automatici consente di importare dati in forma tabellare presenti in tracciati record (ASCII posizionali e con separatore, CSV, XLS, etc.) o in database esterni, trasformarli e formattarli nel formato richiesto. I valori importati possono essere associati ai documenti presenti nel sistema di archiviazione documentale per integrarne gli indici di ricerca.

Validazione

Modulo utente utilizzato per verificare, registrare e classificare manualmente le informazioni acquisite dagli agenti di riconoscimento ottico o quelle estratte dagli agenti di gestione dati che non abbiano superato le fasi di verifica automatica. La verifica avviene direttamente su una zona dell’immagine del documento, contenente il dato di interesse, ingrandita per aumentarne la leggibilità e minimizzare eventuali errori di interpretazione.

Gestione file

Questa categoria di agenti ha l’obiettivo di trattare i file che sono già in formato elettronico. Nello specifico è possibile:

  • monitorare determinate cartelle o spazi ftp, in maniera continua, ed importare i documenti nella piattaforma;
  • analizzare il contenuto e l’aspetto grafico dei documenti per classificarli ed archiviarli nella libreria documentale dedicata;
  • convertire i file in diversi formati in base alle specifiche necessità;
  • separare i file multi-pagina in documenti distinti in base a regole predefinite.