Che cos'è lntelligent Document Processing e a cosa serve​?

lntelligent Document Processing

L’lntelligent Document Processing automatizza l’acquisizione dei dati presenti nei documenti informatici non strutturati o semistrutturati (documenti di testo DOCX/PDF/HTML, messaggi di posta elettronica, file di immagini), per registrarli senza intervento umano nei database aziendali. Esempi di documenti di questo tipo sono: ordini di acquisto, istruttorie di mutui, questionari.

L’esigenza di gestire documenti di questo tipo è tanto più sentita quanto maggiori sono le dimensioni dell’organizzazione. Nell’articolo “The Unstructured Side of Big Data” del 2013,  Gartner riportava che i dati rilevabili nei documenti non strutturati erano oltre l’80% di tutti quelli memorizzati negli archivi aziendali e l’andamento è peggiorato negli anni (Researchworld).

I software di lntelligent Document Processing evitano la lavorazione manuale dei documenti, utilizzando tecniche di Intelligenza Artificiale per coprire tutte le fasi di elaborazione, compreso l’acquisizione iniziale: estrazione, classificazione, validazione e registrazione automatica dei dati nei database aziendali. In più, possono anche automatizzare decisioni e rivelare tendenze su cui intervenire. 

Perché utilizzare i software di lntelligent Document Processing 

I gestionali elaborano dati registrati in campi il cui significato semantico è netto: cognome, data di nascita, prezzo unitario. 

Quando arrivano nuovi documenti, come avviene l’inserimento dei dati negli archivi aziendali che hanno una struttura ben definita? Possono arrivare già qualificati e corrispondenti ai campi del database per essere registrati manualmente o automaticamente se il formato informatico rispetta quello previsto dagli applicativi. 

Spesso, però, i dati da inserire sono riportati in forma libera all’interno di messaggi di posta elettronica, documenti di testo, fogli elettronici. Quando arrivano file di immagini, gli operatori devono necessariamente leggerne il contenuto per rilevare gli elementi significativi e inserirli manualmente nel gestionale. Se il documento è cartaceo, poi, per archiviarlo in un file occorre prima acquisirlo con uno scanner. 

I software di lntelligent Document Processing, invece, acquisiscono l’immagine dei documenti cartacei, se occorre, dopo di che utilizzano algoritmi di Intelligenza artificiale per navigare nei documenti informatici ed estrarne automaticamente i dati da registrare, evitando del tutto le operazioni manuali. 

Quali sono le fasi operative dell’lntelligent Document Processing 

Nell’acquisire i documenti, una piattaforma di lntelligent Document Processing può intervenire con algoritmi di Computer Vision sull’inclinazione e sulla risoluzione grafica delle pagine per rendere meglio leggibile il contenuto. 

Ottenuto il documento informatico, gli interventi successivi sui dati sono: 

  • estrazione 
  • classificazione 
  • validazione
  • registrazione 

Nella fase di estrazione, vengono identificate le zone del documento contenenti il testo da sottoporre ad algoritmi di riconoscimento automatico (OCR), anche se scritto a mano (HTR), per convertirlo in caratteri gestibili via software. 

Dopo l’estrazione vengono utilizzati specifici software di Intelligenza artificiale (elaborazione del linguaggio naturale/NLP, Deep Learning) per una corretta classificazione (curriculum, ordine, questionario), grazie ai modelli impostati con i tecnici della piattaforma di lntelligent Document Processing. 

Classificato il documento, i dati enucleati dal contesto vengono analizzati per controllarli e verificarne la validità, confrontandoli con termini di appositi database e/o vocabolari semantici. 

Quelli ritenuti validi secondo gli schemi predisposti nella fase di installazione del software, infine, vengono registrati automaticamente negli archivi dei gestionali aziendali per le elaborazioni successive. 

Quali vantaggi comporta l’utilizzo di software di lntelligent Document Processing 

Con i software di lntelligent Document Processing è possibile il riconoscimento della maggioranza dei dati ma non si può arrivare sempre al 100% per via della natura degli algoritmi alla base. I dati dubbi (per esempio per modelli di documenti diversi da quelli definiti con l’azienda) vengono segnalati per essere gestiti manualmente dagli operatori.

Gli algoritmi di Machine Learning, inoltre, possono: 

  • segnalare tendenze/andamenti su cui intervenire 
  • integrare automaticamente i dati acquisiti con altri prelevati dall’esterno, quando opera in maniera congiunta un software di RPA
  • “prendere decisioni” autonome con software RPA, come concedere finanziamenti in determinate condizioni o convocare candidati a un impiego 

In ogni caso, abbattere i tempi di acquisizione dei dati da documenti non strutturati comporta sempre vantaggi concreti: velocizzazione dell’acquisizione, elaborazione di molti più documenti di quelli gestibili manualmente, minori errori, maggiore qualità e impiego del personale in attività più qualificate. 

L’utilizzo dei software di lntelligent Document Processing, quindi, complessivamente è altamente produttivo ed è veramente difficile pensare di poterne fare a meno, in qualsiasi organizzazione. 

Scopri la soluzione