Recupero delle banche dati di Anagrafe in SIUSA
di Giuseppe Mesoraca

Nel decreto di istituzione del Gruppo di lavoro che ha elaborato il Sistema Informativo Unificato delle Soprintendenze Archivistiche (SIUSA) si fa riferimento specifico alla necessità di recuperare le banche dati costituite con il progetto “Anagrafe informatizzata degli archivi italiani”, progetto che ha dato l’avvio nella maggior parte degli istituti archivistici all’utilizzazione del computer per lavori archivistici.
L’occasione per la costituzione della banca dati di “Anagrafe” si presentò con i finanziamenti straordinari provenienti da leggi speciali (84/90 e 145/92) in concomitanza con la libera circolazione dei beni culturali in Europa e l’esigenza di salvaguardare il patrimonio documentario esistente sul territorio nazionale, attraverso la costituzione della carta conoscitiva aggiornata della situazione di rischio del patrimonio.
In questo quadro e sulla scia della strada imboccata dall’Amministrazione archivistica negli anni precedenti per l’automazione delle attività di tutela si è mosso il progetto “Anagrafe”.
Mi piace ricordare a riguardo ciò che disse l’allora Direttore generale dell’Amministrazione archivistica, prof. Renato Grispo, all’apertura dei lavori al convegno di Torino del 1985 su Informatica e archivi. Egli, dopo aver ricordato gli impegni dell’Amministrazione archivistica nel campo della ricerca, nonché l’avvio di alcuni esperimenti di ordinamento e di elaborazione di strumenti di corredo presso alcuni archivi di Stato, così si esprimeva: “Per quanto riguarda una gestione automatica dell'attività di tutela, l’amministrazione archivistica ha già previsto l’avviamento di un vasto progetto per l’acquisizione dei dati essenziali relativi agli archivi non statali ( regime giuridico, possessore, provenienza, ubicazione, consistenza estremi cronologici, stato di conservazione e ordinamento , mezzi di ricerca predisposti e via discorrendo) allo scopo di creare una banca di dati centralizzata, aggiornabile mediante procedure automatizzate, nonché banche locali presso le Soprintendenze archivistiche per la gestione dell’attività di tutela nella propria area di competenza. La banca centralizzata consentirebbe una programmazione a livello nazionale relativa all’attività da svolgere nei confronti degli archivi vigilati…”.
“Anagrafe”, frutto dunque di una politica ben precisa dell’Amministrazione, ha interessato nella prima fase gli archivi non statali vigilati dalle Soprintendenze archivistiche e successivamente si è esteso anche a molti Archivi di Stato.
Il progetto, che si sviluppava in fasi successive, puntava in primis alla costituzione di banche dati anagrafiche degli archivi esistenti sul territorio nazionale; gli archivi dovevano essere identificati con i dati essenziali a connotarli e ad ubicarli e le banche dati relative erano lo strumento per un utilizzo delle informazioni sia a fini gestionali che di fruizione.
A questa struttura informativa di individuazione degli enti di conservazione e degli archivi descritti ai livelli alti potevano successivamente essere collegati progetti specifici di inventariazione di singoli complessi archivistici o progetti di acquisizione delle immagini o banche dati analitiche, quali la cartografia o la riproduzione di sicurezza di documentazione particolare (vedi progetto sui catasti onciari dell’Archivio di Stato di Napoli).

L’architettura del sistema prevedeva la creazione di banche dati locali presso ciascun istituto archivistico, con l’utilizzo immediato dei propri dati, e di banche dati centrali, finalizzate quest’ultime sia al recupero delle informazioni di tipo gestionale per l’attuazione della programmazione e tutela a livello nazionale, che a quelle di tipo descrittivo. Le banche dati locali e quelle centrali sarebbero state allineate tra di loro ed implementate sia dagli istituti periferici che dall’Ufficio centrale.
Questa, in sintesi, la genesi e l’architettura del sistema.
In realtà il progetto, nuovo nella sua tipologia e di dimensione nazionale, ha incontrato alcune difficoltà che ne hanno condizionato lo sviluppo.
Innanzitutto, il progetto, facendo uso in modo massiccio di strumenti informatici per la creazione di banche dati, in un’epoca in cui questi non erano ancora molto diffusi e calandosi in una realtà archivistica complessa e diversificata, avrebbe avuto bisogno di un ampio dibattito e confronto tra gli archivisti, in modo che fossero chiari gli obiettivi da raggiungere e condivise le modalità di attuazione.
Purtroppo, la stessa tipologia del progetto, rientrante nel quadro dei finanziamenti speciali, ha di fatto impedito il confronto e il dibattito, in quanto furono previsti tempi limitati per l’attuazione, e l’utilizzo di personale esterno all’Amministrazione, oltre che complessi adempimenti di ordine amministrativo-contabile.
Non ultima tra le difficoltà che il progetto “Anagrafe” ha incontrato nella sua realizzazione è la mancata manutenzione del software e l’obsolescenza repentina dell’hardware utilizzato, in un momento in cui le tecnologie informatiche hanno fatto passi da gigante.
In questo contesto una pausa di riflessione sugli obiettivi del progetto e sulle modalità di costruzione del sistema archivistico nazionale avrebbe permesso di aggiustare il tiro e rimodulare il progetto alla luce anche dello sviluppo delle nuove tecnologie informatiche e di comunicazione.
Un piano articolato di interventi successivi prevedeva, comunque, il miglioramento del software e il successivo adeguamento delle banche dati. Il piano non è stato varato, per il venir meno della struttura centrale di coordinamento a cui faceva capo il progetto. Non essendoci direttive chiare sugli obiettivi da perseguire, alcuni, invero pochissimi, istituti periferici, hanno assunto autonome iniziative per il recupero delle informazioni immesse nel sistema su altre piattaforme informatiche, per renderne, comunque, utilizzabili i dati.
E’ utile dire che al 1998, data di ultimazione dei lavori presso le sole Soprintendenze archivistiche, risultano essere acquisite più di 5000 schede ente e circa 160.000 schede archivio. Esse riguardavano nella maggior parte i Comuni, con delle eccezioni riguardanti alcuni enti privati ed enti ecclesiastici. Tra questi ultimi si segnalano:

  • per la Puglia 19 diocesi e 18 tra collegi e ordini,
  • per l’Emilia Romagna 62 tra fondazioni e asili, 29 tra consorzi e partecipanze agrarie
  • per il Friuli 125 parrocchie, 4 diocesi e 3 camere di commercio

    In anni recenti, sotto l’impulso della Divisione vigilanza dell’Ufficio centrale per i beni archivistici, sono state costituite due commissioni con il compito di fare il punto sul progetto e procedere quindi alla reingegnerizzazione di “Anagrafe”. La commissione incaricata della revisione del sistema di descrizione, alla luce anche di ciò che nel frattempo stava maturando a livello internazionale nel campo degli standard internazionali (ISAD e ISAAR) della descrizione archivistica e anche in rapporto allo sviluppo delle nuove tecnologie e degli standard di comunicazione delle informazioni (INTERNET), ha proceduto nell’analisi di ciò che non ha funzionato in “Anagrafe” ed ha fatto delle proposte di modifiche ed integrazioni al progetto originario, per la creazione di un nuovo sistema informativo, che permettesse comunque di recuperare, oltre che l’esperienza maturata con quel progetto a livello nazionale, anche le banche dati, costituite da un patrimonio informativo molto importante, alla creazione del quale hanno partecipato buona parte degli istituti archivistici.
    Nella fase successiva, è stato istituito il Gruppo di lavoro che ha dato vita al Sistema Informativo Unificato per le Soprintendenze Archivistiche.
    Il Gruppo di lavoro, istituito nel 2000 con il compito di reingegnerizzare “Anagrafe”, ha proceduto nell’analisi del modello concettuale del sistema informativo unificato per le Soprintendenze archivistiche, sulla base anche di ciò che erano state le conclusioni delle due precedenti commissioni.
    Il sistema che ne è venuto fuori si articola in due aree informative, fisicamente e logicamente distinte ma tra loro collegate: un’area informativa del “descrittivo”, destinato ad essere utilizzato e consultato anche dall’utenza esterna e un’area del “gestionale”, finalizzata all’uso interno delle Soprintendenze, a supporto della loro opera sul territorio e per lo scambio delle informazioni con la Direzione generale.
    Nella definizione della struttura dell’ambito descrittivo la rappresentazione delle informazioni è basata sugli standard internazionali ISAD (G) e ISAAR (CPF).

    Raffronto tra Anagrafe e SIUSA

    Dal raffronto delle banche dati di “Anagrafe” con il modello del nuovo progetto, basato sulla separazione netta delle informazioni di tipo descrittivo da quelle di tipo gestionale, viene fuori, pur essendo diversa la filosofia dei due progetti, che molti sono i punti in comune.
    Le riflessioni maturate sulla scia degli standard descrittivi a livello internazionale, nonché lo sviluppo delle tecnologie di comunicazione hanno fatto emergere i limiti di “Anagrafe”, ma anche alcuni pregi. Il recupero delle banche dati di “Anagrafe” con la trasposizione in SIUSA potrà essere utile per una riflessione su come descrivere e rappresentare le informazioni sugli archivi e gli enti produttori in ambiente di rete.
    Si può affermare che il SIUSA è frutto delle riflessioni avviate nel decennio scorso sulla rappresentazione dei dati e sugli standard di descrizione archivistica, ma è anche il frutto dell’esperienza e delle riflessioni maturate con il progetto “Anagrafe”.

    Prima, però, di analizzare le soluzioni specifiche da adottare nel recupero dei dati di “Anagrafe” per alcune aree informative del SIUSA, preme sottolineare che in “Anagrafe” la struttura degli archivi è rappresentata effettivamente secondo il diagramma allegato alle norme ISAD(G), in cui i fondi e le sue partizioni sono rappresentati in modo gerarchico e multilivellare (fondo, serie e sottoserie). E’ questo uno dei grandi pregi di “Anagrafe” che, molto prima delle ISAD(G), ha proposto una rappresentazione della sedimentazione documentaria e della struttura degli archivi fedele alla realtà e in linea con ciò che veniva proposto nel frattempo a livello internazionale
    Un altro aspetto interessante, come si è constatato dall’import dei dati in SIUSA, è quello relativo allo sganciamento della definizione della fonte dall’indicazione del livello in cui si pone. Il risultato è una corretta rappresentazione della struttura del fondo.
    Ulteriore soddisfazione si ricava anche dalla semplicità con cui si ottiene il collegamento (relazione), quasi automatico, tra i complessi archivistici e il soggetto conservatore ed in parte il soggetto produttore, anche se per quest’ultimo bisognerà fare attenzione, in quanto non è sempre identificato in modo chiaro in “Anagrafe”. Se da una parte, quindi, i dati di “Anagrafe” sono tranquillamente leggibili nel SIUSA, almeno quelli più importanti ed essenziali della struttura dell’archivio, bisogna, dall’altra, effettuare una revisione più puntuale per tutte le altre informazioni. Vi è, infatti, in “Anagrafe” un’articolata presenza di campi con un ricco corollario di note.
    Le banche dati sono state esportate dal vecchio programma di “Anagrafe” in un file in formato MDB, leggibile da un qualsiasi programma di DBMS relazionale. La struttura originaria delle tabelle è salvaguardata e gli elementi informativi suddivisi in più campi sono recuperati grazie alla struttura del codice unico che collega i complessi archivistici all’ente, che li conserva a diverso titolo.
    I dati rilevati in “Anagrafe” possono essere distribuiti in SIUSA sia nel serbatoio del descrittivo tra le schede del soggetto produttore, del soggetto conservatore, del complesso archivistico e degli strumenti, che in quello gestionale tra il titolare, il complesso vigilato, la sede di conservazione e le attività.
    Le operazioni di revisione dei dati possono essere fatte in locale con un prodotto informatico semplice e di immediato utilizzo, prima della importazione definiva in SIUSA. Il prodotto Access, utilizzato per il recupero dei dati, è di estrema facilità e diffuso in tutti gli istituti. Con l’aiuto di alcune maschere, in cui vengono rappresentati i campi interessati alle correzioni ed attraverso le operazioni di taglia e incolla, si può procedere ad una revisione rapida ed immediata.
    Le banche dati di “Anagrafe” delle Soprintendenze archivistiche, importate provvisoriamente in SIUSA, per la mole di dati e di informazioni di cui dispongono, credo, diano il senso dell’importanza del progetto “Anagrafe” e siano nello stesso tempo il banco di prova per il nuovo sistema, perché offrono molti elementi di riflessione sulle modalità di rappresentazione e di interrogazione dei dati.
    Per una maggiore comprensione della problematica relativa al recupero delle banche dati, si presenta, in appendice, la struttura delle schede del SIUSA, con l’indicazione delle tabelle di legame che qualificano il legame stesso, e i collegamenti (relazioni) che ogni scheda può avere con le altre.
    Vorrei ora commentare alcuni degli esiti dell’importazione che suscitano problemi e le modalità per ovviare agli stessi all’interno delle aree informative del SIUSA, esaminandoli partitamente.

    Complesso archivistico

    1. Denominazione - In “Anagrafe” si era stabilito, seguendo una ormai consolidata tradizione, di dare la denominazione con cui è conosciuto il fondo, corrispondente, per lo più alla provenienza; in un campo a parte si sarebbero date le eventuali altre denominazioni. Era stato previsto un ulteriore campo delle Denominazioni uniformate che avrebbe permesso di dare ai fondi una denominazione standardizzata a livello nazionale, per cui in fase di interrogazione dei dati la ricerca poteva essere fatta su entrambe le denominazioni.
      La struttura dei codici, molto importante in “Anagrafe”, era tale per cui l’immissione dei complessi archivistici presupponeva l’esistenza di una scheda ente alla quale il complesso veniva collegato tramite il codice di livello. In sostanza i codici riflettevano i livelli di organizzazione di un complesso. Per la denominazione dei complessi propri di quell’ente e per gli istituti non di concentrazione, si era ritenuto, in una prima fase, data la struttura del codice “parlante”, superfluo e nello stesso tempo elemento di appesantimento della banca dati ripetere per ogni complesso di quell’ente l’apposizione dell’ente stesso. Cosa diversa, invece, era per gli archivi aggregati di provenienza diversa e naturalmente per i fondi censiti all’interno degli Archivi di Stato, per i quali la denominazione completa dei complessi era indispensabile. Ciò ha determinato che le denominazioni dei complessi propri degli enti non avessero l’apposizione dell’ente di appartenenza.
      Si fa un esempio per chiarire la questione: in fase di immissione dei dati relativi all’archivio di un determinato Comune, per i complessi archivistici prodotti da quel Comune, in quanto collegati attraverso il codice di livello a quello della scheda ente, dare la denominazione archivio storico, archivio di deposito, stato civile, ente comunale di assistenza sarebbe stato sufficiente a farne capire la provenienza. In fase di ricerca ciò, tra l’altro, non comportava nessun problema, in quanto la rappresentazione della provenienza di quel complesso era data proprio dal legame con la scheda ente.
      Lo stretto legame tra scheda ente e scheda archivio, che da una parte costituiva il modo più naturale di riportare i complessi archivistici nell’alveo dell’ente di appartenenza, si è dimostrato, d’altra parte, limitativo nella reale rappresentazione delle informazioni dei complessi archivistici, una volta sganciati dall’ente di appartenenza.
      In SIUSA, infatti, la descrizione del complesso archivistico viene data separatamente (e successivamente collegata) da quella del soggetto conservatore e del soggetto produttore; non essendoci un legame univoco con l’ente di appartenenza, come avveniva in “Anagrafe”, le stesse informazioni non sono più sufficienti a far capire l’appartenenza di un determinato fondo all’ente di riferimento. E’ quindi indispensabile rilevare la denominazione del fondo, con tutti gli elementi, compresa la località.
      In fase di import sperimentale delle banche dati di “Anagrafe” in SIUSA questo traspare in modo eclatante: ed infatti, nella lista dei complessi archivistici di primo livello, in buona parte, compaiono le denominazioni dei fondi senza l’apposizione dell’ente di appartenenza, per cui si fa fatica a capire a quale ente facciano riferimento, salvo che essi non vengano rappresentati aggregati per soggetto conservatore.
      Il tema delle denominazioni d’autorità è uno dei problemi più spinosi e credo venga fuori in tutta la sua importanza, anche negli esempi che sono stati fatti durante il test del SIUSA, per cui è indispensabile che vengano date istruzioni precise su come rilevare le denominazioni e porsi il problema di come rappresentare le stesse in fase di ricerca (lo stesso discorso vale anche per le denominazioni del soggetto conservatore e del soggetto produttore).
      Una volta stabilite le modalità delle denominazioni d’autorità, le correzioni dei dati in “Anagrafe” non dovrebbero essere molto gravose.

    2. Consistenza - In “Anagrafe” è stata individuata la quantità per ogni tipologia di documentazione, mentre in SIUSA sono previsti un campo per la descrizione della consistenza, uno per i metri lineari e uno per la quantità. Credo sia agevole mettere nel campo Descrizione del SIUSA le diciture dei campi con i rispettivi valori di “Anagrafe”. Peraltro, solamente alcuni campi sulla consistenza, facilmente individuabili per singola Soprintendenza, sono riempiti (voll./fasci/mazzi/pergamene).
      Un altro aspetto della consistenza su cui bisognerà intervenire è quello relativo ai campi lasciati vuoti dai compilatori delle schede ai livelli alti della struttura degli archivi (il discorso vale anche per gli estremi cronologici). Per questi campi il manuale dei rilevatori di “Anagrafe” dava indicazione di non immettere i valori, in quanto un applicativo informatico specifico avrebbe fatto automaticamente la somma delle articolazioni basse, riportando il totale, per ogni tipologia, nei livelli alti, evitando in questo modo il rischio di errori. Orbene, questo applicativo, pronto nel 1995, non è stato mai utilizzato.
      In fase di importazione definitiva dei dati nel SIUSA si può pensare di utilizzare questo strumento. L’operazione è banalissima e della durata di pochi minuti per ogni banca dati.

    3. Storia archivistica - Le informazioni sulla storia archivistica e il contenuto, in buona parte degli archivi censiti, in “Anagrafe” sono stati inseriti sia alla fine del campo Notizie storiche giuridiche della scheda ente che nella Descrizione della fonte della scheda archivio.
      Il motivo per cui le informazioni sono state date in campi differenti è da far risalire a quella non netta distinzione tra le informazioni riguardanti l’ambito gestionale e quelle relative all’ambito della descrizione archivistica. La scheda ente, di natura essenzialmente gestionale, ha rivestito in alcuni campi il ruolo di collettore di informazioni sul soggetto conservatore ma anche sul soggetto produttore, nei casi in cui vi era identità tra i due soggetti (vedi il caso dei Comuni, in cui l’identità tra i due soggetti, di norma, è palese).

    4. Altre denominazioni - Per le altre denominazioni, la tabella A_INDI di “Anagrafe” contiene sia i codici delle altre denominazioni con cui è conosciuto il fondo, che quelli relativi alla provenienza. Le descrizioni, con codici AD/Altre denominazioni e GG/denominazione nella Guida generale, possono trovare spazio nel campo Altre denominazioni del SIUSA. Quelle relative alla Provenienza possono andare a costituire le schede del soggetto produttore (anche se le informazioni riguarderanno solamente la denominazione con gli estremi cronologici).

    5. Estremi cronologici - Le informazioni sugli estremi cronologici, una volta risolto l’aspetto dei campi lasciati vuoti, non presentano particolari problemi. In “Anagrafe” i campi sono dati in sequenza anno/mese /giorno oppure con il secolo, così come in SIUSA. Le note agli estremi cronologici possono andare a confluire nelle Note alla Datazione.

    6. Archivi di deposito e archivi correnti - La presenza della descrizione di archivi di deposito e di archivi correnti in “Anagrafe” si deve alla impostazione originaria del progetto, relativo alla costituzione di banche dati per la conoscenza di tutti i tipi di archivi esistenti sul territorio, qualsiasi fosse lo stato di vita dell’archivio, al fine di tutelarli e salvaguardarli. La scelta anticipa singolarmente i principi recati dal molto più tardi Testo unico (D.L.vo 490/99) delle disposizioni legislative in materie di beni culturali e ambientali. Le informazioni relative a questi archivi, quando non siano particolarmente articolati, potranno essere inserite nel “complesso vigilato” del gestionale del SIUSA.

    7. Note - In “Anagrafe” è stato fatto largo uso, oltre che di campi strutturati e di lunghezza limitata, che permettessero delle aggregazioni di tipo sintetico e statistico, anche di campi Note, in cui convogliare informazioni di natura descrittiva, ritenuti essenziali per la comprensione degli elementi rilevati. Questi campi, che in non pochi casi contengono informazioni importanti, dovrebbero essere recuperati in SIUSA e allocati nei campi di riferimento.

    Soggetto Conservatore
    Le informazioni della prima parte della scheda ente di “Anagrafe” (comprendente, oltre alla denominazione dell’ente conservatore, anche la regione, il comune, la provincia, l’indirizzo e quant’altro ritenuto necessario ad individuare l’ente) potranno essere tranquillamente riversati nella scheda del soggetto conservatore del SIUSA. Mentre bisognerà verificare la congruità delle informazioni immesse nel campo Notizie della stessa scheda, in quanto, come si è accennato, in alcuni casi è stata fatta la storia dell’ente conservatore, in altri invece le informazioni sono relative al soggetto produttore, e dovranno dunque essere manualmente spostati nel pertinente serbatoio del SIUSA.

    Soggetto Produttore
    In “Anagrafe”, il problema del soggetto produttore non era ancora emerso nella sua importanza e le informazioni relative non erano state date in un’area informativa nettamente separata rispetto ai complessi archivistici. Esso non fu trattato in modo adeguato e nei modi in cui fu successivamente analizzato dagli standard archivistici internazionali.
    Le informazioni sul soggetto produttore o meglio “sulla provenienza della fonte archivistica” sono state rilevate sia nella scheda ente, nelle Notizie storico-giuridiche, quando vi era coincidenza tra fonte ed ente titolare, sia nelle Notizie sulla provenienza della scheda archivio, per i complessi archivistici di provenienza diversa rispetto a quelli prodotti dall’ente. E’ il caso, per questi ultimi, degli archivi aggregati all’interno dello stesso ente.

    Bibliografia e Fonti
    In “Anagrafe” le informazioni bibliografiche venivano date nella scheda ente in campi strutturati e riguardavano sia l’ente conservatore che i suoi archivi. Recano l’indicazione dell’autore o del curatore, il titolo, il numero del volume, il luogo, la casa editrice e l’anno di edizione; in SIUSA si è optato invece per un campo unico a testo libero in cui immettere le diverse informazioni, vista la difficoltà di definire dei campi esaustivi per la descrizione bibliografica. Con le opportune verifiche le informazioni contenute in “Anagrafe” possono essere collegate alle diverse schede presenti in SIUSA (complesso archivistico, soggetto produttore etc.). Lo stesso discorso vale per le Fonti, identificate con il tipo di atto istitutivo, l’anno o il secolo (con in nota le informazioni relative al titolo), i dati bibliografici della fonte a stampa e il luogo di conservazione della fonte.

    Strumenti di corredo
    Per quanto riguarda gli strumenti di corredo, la differenza tra “Anagrafe” e SIUSA risiede nel fatto che in quest’ultimo le informazioni sono date in più campi, mentre in “Anagrafe” erano previsti solamente la tipologia dello strumento, il procedimento di formazione, l’anno di inizio o ultimazione delle operazioni ed in nota tutte le altre informazioni (il numero dello strumento, il responsabile ed altri indicazioni).

    Per concludere, si può affermare che, nonostante alcune aporie, il progetto “Anagrafe” è un progetto non troppo invecchiato, nonostante i dieci anni trascorsi, ma anzi vitale e compatibile in larga misura con SIUSA, certamente il prodotto concettualmente più raffinato disponibile al momento. Ad “Anagrafe” va anche riconosciuto il merito di aver mobilitato risorse umane interne ed esterne all’Amministrazione archivistica e di aver fatto emergere, oltre a problemi e situazioni mai affrontati prima sulla gestione e valorizzazione del patrimonio archivistico italiano, una serie di problematiche nella creazione e realizzazione delle banche dati, per le quali SIUSA ha trovato soluzioni informative adeguate.


    GIUSEPPE MESORACA

    Appendice