La Banca Dati è denominata BiTdata in assonanza ai Big data, poiché si tratta di "dati molecolari BioTecnologici” che fungono quasi da "Biglietto Tecnologico" dell'esposizione occupazionale a xenobiotici.
L’elevata quantità di dati analizzati e raccolti dalle diverse banche dati della comunità scientifica ha evidenziato come la loro elaborazione in forma di database li possa rendere più facilmente fruibili, fornendo un punto di accesso alla consultazione di questi dati. L'analisi dei dati inoltre potrebbe evidenziare mutazioni o alterazioni dell'epigenoma in seguito ad esposizione occupazionale, fornendo quindi le basi per poter identificare potenziali biomarkers utili per l'attività di screening e diagnosi precoce in categorie a rischio.
La raccolta dati è stata effettuata per ogni sostanza e per ciascuna patologia riportata nel nuovo elenco delle malattie professionali soggette all'obbligo di denuncia/segnalazione da parte dei medici, ai sensi dell'art. 139 del Testo unico (d.p.r. 1124/1965). Sono stati interrogati i seguenti repository: Sequence Read Archive (SRA), Gene Expression Omnibus (GEO), ArrayExpress e NCBI.
Per ciascun esperimento è stata elaborata una breve descrizione in lingua inglese che permetta all'utilizzatore di comprendere rapidamente il disegno sperimentale e il tipo di dati. Questa prima fase del lavoro ha portato alla collezione di alcune centinaia di set di dati che sono stati successivamente utilizzati per la costruzione del Database.
Tramite un apposito form di ricerca è possibile richiamare tutti i set di dati che corrispondono alle parole chiave inserite, limitando la ricerca a singoli campi o estendendola a più campi. Dai risultati della ricerca si può facilmente accedere tramite collegamenti ipertestuali alle pagine di accesso ai dati pubblici. Da tali pagine è possibile il download dei dati originali che possono poi essere utilizzati dall'utente finale del database per effettuare analisi in locale.