'" + "removeChild(firstChild)" // come trick per creare un elemento
v1.1.10 · Knowledge Layer in beta

Da archivio a conoscenza.

// gestione documentale aziendale · wiki AI · WikiLM · chat RAG

Theka è la piattaforma SaaS di gestione documentale aziendale con AI integrata: centralizza contratti, schede tecniche, manuali e immagini in un archivio digitale versionato e tracciabile. L'AI estrae argomenti ricorrenti dai tuoi documenti e genera wiki autogenerate (WikiLM) con citazioni verificabili, mentre la chat RAG risponde a domande in linguaggio naturale citando le fonti. Versioning, workflow di approvazione, audit log e ricerca semantica — il tutto multi-tenant e GDPR-compliant.

topic-graph
14 connessioniattivo
// definizione

Cos'è Theka

Theka è un DAM (Digital Asset Management) italiano con knowledge layer AI. Pensato per PMI e organizzazioni con archivi documentali estesi (manifatturiero, servizi, multi-sede), trasforma la gestione documenti aziendali in una base di conoscenza navigabile: ogni argomento ricorrente diventa una wiki autogenerata, ogni affermazione AI è tracciabile alla fonte. Niente vendor lock-in: porti il tuo storage (S3, Azure, SharePoint, MinIO) e la tua chiave AI (OpenAI, Anthropic, Gemini, Mistral).

// il problema

Documenti aziendali ovunque, tranne dove servono.

I documenti aziendali oggi sono frammentati tra cartelle condivise, email, ERP, SharePoint e drive personali. Trovare l'ultima versione di un contratto, sapere quale certificato è ancora valido o estrarre informazioni da centinaia di pagine richiede ore di lavoro manuale. Senza un sistema centralizzato di gestione documentale, ogni nuovo dipendente perde settimane a capire dove cercare e cosa è autoritativo.

01

File frammentati.

Documentazione critica distribuita fra drive condivisi, caselle email, supporti rimovibili e cartelle locali, senza un punto di accesso unificato.

02

Versioni incerte.

Nessuna garanzia su quale sia la versione corrente di un documento. Bozze, revisioni e copie firmate convivono senza un ciclo di vita chiaro.

03

Tracciabilità assente.

Nessuna evidenza affidabile di chi ha letto, modificato, condiviso o approvato un documento — un rischio significativo in ottica di compliance.

// come funziona

Tre passi per trasformare l'archivio in conoscenza.

Theka ti guida in tre passaggi: carichi i documenti nel tuo storage, l'intelligenza artificiale li analizza e genera wiki tematiche, poi puoi chiedere alla chat AI o navigare il grafo dei topic per trovare informazioni in secondi invece che in ore. Tutto resta nella tua infrastruttura, nel rispetto del GDPR.

01step

Caricamento.

I documenti vengono caricati via drag-and-drop, connettori (SharePoint, S3, Azure) o API. Theka li classifica automaticamente per categoria, progetto e direzione applicando il field schema definito.

  • PDF, DOCX, XLSX, immagini, scansioni
  • Versioning automatico
  • Custom field per categoria
02step

Analisi AI.

La pipeline AI estrae metadati, compila campi custom, genera riassunti ed embedding vettoriali. Il motore analizza i contenuti a livello profondo: OCR su scansioni, estrazione strutturata di tabelle e riconoscimento di immagini nei documenti. Ogni file diventa ricercabile semanticamente e contribuisce al knowledge layer.

  • OCR su scansioni
  • Estrazione tabelle + immagini
  • Indicizzazione vettoriale
03step

Collaborazione.

Workflow di approvazione configurabili, versioning granulare, notifiche al team e permessi multi-livello. Ogni utente accede esclusivamente ai contenuti per cui è autorizzato.

  • Approval workflow multi-stage
  • Audit log immutabile
  • Share-link controllati
// confronto

La differenza, in concreto.

Stesso contesto operativo, due modi opposti di gestirlo. Da una parte l'archivio aziendale tradizionale, dall'altra Theka.

prima

Senza Theka.

  • ×Documenti dispersi tra drive condivisi, email e cartelle locali
  • ×Versioni multiple in circolazione, nessuna autoritativa
  • ×Ricerche full-text limitate al nome del file
  • ×Conoscenza operativa nelle teste delle persone
  • ×Approvazioni gestite via email senza tracciabilità
  • ×Nessuna evidenza di chi ha letto, modificato, condiviso
  • ×Per rispondere a una domanda servono ore di consultazione
dopo

Con Theka.

  • Archivio digitale unico, organizzato per categoria, progetto e Master Data
  • Versioning con status workflow chiaro (draft → final → signed)
  • Ricerca semantica vettoriale su contenuto, topic e claim
  • Wiki AI autogenerate (WikiLM) sui contenuti ricorrenti
  • Approval workflow multi-stage tracciato in audit log
  • Audit log immutabile su ogni accesso e modifica
  • Risposte immediate dalla chat AI con citazioni verificabili
// funzioni

Gestione documentale, Wiki AI, intelligenza artificiale, governance.

Quattro aree del prodotto: archivio digitale aziendale (DAM), Wiki AI con chat RAG (WikiLM), configurazione granulare dei task di intelligenza artificiale per categoria, governance multi-tenant. Ognuna è approfondita in una pagina dedicata.

// 01 · DAMcore

Archivio digitale aziendale, versioning, approvazioni.

La piattaforma di gestione documenti aziendali completa. Ogni documento è gestito come gruppo di versioni con uno status definito nel ciclo di vita (draft → review → approved → final → signed → archived). Workflow di approvazione configurabile con stage multipli, organizzazione su cartelle, progetti, tag e categorie con field schema personalizzato; riferimento a Master Data per clienti, fornitori, prodotti e altre entità di business.

Asset versioning
Approval workflow
Master data / Entità
Folder · Project · Tag
Custom fields
Share-link
Approfondisci
// 02 · Wiki AI · WikiLMopzionale

Wiki autogenerate dai tuoi documenti.

Sul livello documentale, l'AI individua argomenti ricorrenti ed estrae affermazioni atomiche con la fonte. Per ogni argomento genera una wiki AI sintetica (WikiLM); gli stessi contenuti alimentano una chat RAG che risponde a domande citando i documenti d'origine. Sono inclusi grafo degli argomenti navigabile e ricerca semantica.

Wiki AI · WikiLM
Chat RAG con [N]
Topic graph
Ricerca semantica
Citazioni verificabili
Knowledge management
Approfondisci Wiki AI
// 03 · AI configurabilecore

Task AI configurabili per categoria.

L'AI non è un blocco monolitico. Per ogni categoria di asset l'amministratore stabilisce quali task abilitare e con quale modello: estrazione metadati, compilazione campi custom, riassunto, OCR, estrazione tabelle e immagini dai documenti, embedding, sintesi knowledge. I provider AI (OpenAI, Anthropic, Gemini, Mistral) sono gestiti come connettori, con override per categoria, deprecation tracking sui modelli e monitoraggio dei costi token tramite Knowledge stats.

extract_metadata
fill_custom_fields
generate_summary
ocr · tabelle · immagini
override per categoria
cost cap + monitoring
Approfondisci
// 04 · Sicurezzacore

Sicurezza multi-tenant, ruoli, audit.

Architettura multi-tenant con storage isolato per organizzazione, ruoli DAM con permessi granulari (view, edit, manage; admin, audit view) e audit log immutabile su workflow, system event e user action. Autenticazione a due fattori opzionale, SSO via Microsoft e Google OAuth. Il workflow di approvazione è uno strumento di compliance documentale, oltre che operativo.

Multi-tenant
Roles + permessi
Audit log
MFA
SSO Microsoft + Google
Approval governance
Approfondisci
Manifatturiero/Studi professionali/Multi-sede/R&D/Pubblica amministrazione/Dati in UE/Multi-tenant isolato/Manifatturiero/Studi professionali/Multi-sede/R&D/Pubblica amministrazione/Dati in UE/Multi-tenant isolato/
// numeri

L'architettura in cifre.

Sintesi della copertura funzionale del prodotto. Numeri reali della codebase, non valori di marketing.

17
Connettori

Storage, AI, SSO, search, ERP, webhook — già implementati e in produzione.

8
Task AI configurabili

OCR, estrazione tabelle, estrazione immagini, metadati, summary, fill custom fields, embedding, knowledge synthesis.

6
Status workflow

draft → review → approved → final → signed → archived.

100%
Citazioni verificabili

Ogni claim della wiki e ogni risposta della chat è tracciata fino al documento sorgente.

// privacy & sicurezza

I tuoi dati restano tuoi.

La sicurezza non è una funzionalità aggiuntiva di Theka, ma un principio progettuale. Quattro pilastri costanti, indipendenti dalla configurazione AI o dal piano scelto.

01

Isolamento totale.

Architettura multi-tenant con storage segregato. I dati di un'organizzazione non sono accessibili da un altro tenant in nessuna circostanza.

02

Proprietà dei dati.

I documenti restano nella piena disponibilità del proprietario. Esportazione completa e cancellazione definitiva sono disponibili in qualsiasi momento.

03

AI sotto controllo.

Le funzionalità di intelligenza artificiale sono opzionali e configurabili per categoria. Nessun dato viene trasmesso a provider esterni senza un'attivazione esplicita.

04

Tracciabilità completa.

Audit log immutabile su ogni azione documentale e su ogni interazione con la chat AI: utente, momento, contesto, sempre verificabili.

// a chi si rivolge

Per organizzazioni con archivi documentali estesi.

Theka è progettato per organizzazioni con patrimonio documentale strategico e team che devono accedere a informazioni affidabili rapidamente: studi tecnici e di consulenza, aziende manifatturiere con certificazioni e schede prodotto, retailer e wholesale con cataloghi articolati, multi-sede con normative locali. Se il tuo archivio cresce più velocemente della tua capacità di organizzarlo, sei nel posto giusto.

// manifatturiero

Schede prodotto e certificati.

Aziende con centinaia di codici prodotto, ciascuno corredato da datasheet, certificati, manuali e revisioni di collaudo, distribuiti su cartelle e reparti differenti.

applicazione tipica
Ogni codice prodotto è gestito come Topic con relativa wiki sintetica; datasheet, certificazioni, manuali e collaudi figurano come fonti citate. Il prodotto è registrato come Master Data, le revisioni come versioni dell'asset.
// servizi professionali

Fascicoli e clienti.

Studi legali, società di consulenza e agenzie con un parco clienti articolato. La documentazione operativa (contratti, mandati, comunicazioni) tende ad accumularsi nel tempo e a perdere accessibilità in caso di turn-over.

applicazione tipica
Il cliente è registrato come Entity. La wiki ne riassume lo storico operativo; la chat fornisce risposte puntuali su pratiche aperte, scadenze e referenti, sempre con citazioni ai documenti di riferimento.
// multi-sede

Conoscenza condivisa, accesso governato.

Organizzazioni con più filiali o reparti operativi distinti, in cui lo stesso fornitore, cliente o procedura è documentato da prospettive diverse (es. acquisti, qualità, logistica).

applicazione tipica
Lo stesso Topic aggrega documenti provenienti da reparti diversi e ciascun claim mantiene il riferimento alla fonte di origine. I permessi granulari regolano la visibilità per ruolo e per area.
// lessico

Glossario essenziale.

Termini chiave del prodotto e dell'ecosistema. Una breve definizione per orientarsi tra DAM, knowledge layer AI, RAG, embedding semantici e gestione documentale moderna.

DAMDigital Asset Management
Piattaforma per organizzare, versionare, ricercare e proteggere asset digitali aziendali (documenti, immagini, file tecnici). In Italia spesso chiamato anche software di gestione documentale o archivio digitale aziendale.
Knowledge Layer
Strato di estrazione AI sopra al DAM. Individua argomenti ricorrenti (topic) ed estrae affermazioni atomiche con la fonte (claim). Alimenta wiki autogenerate e chat con citazioni.
WikiLM
Wiki autogenerata da un Language Model. Per ogni argomento ricorrente nell'archivio aziendale viene composta una pagina sintetica — riassunto, claim, citazioni — che si aggiorna in modo incrementale al variare dei documenti.
RAGRetrieval Augmented Generation
Tecnica che combina ricerca semantica e generazione AI. Il sistema cerca le informazioni rilevanti nei documenti aziendali, le passa al modello linguistico e produce una risposta citando le fonti — senza inventare.
Embedding semantici
Rappresentazioni vettoriali del contenuto di un documento. Permettono di trovare file simili a livello di significato, anche se non condividono parole chiave letterali — abilitano la ricerca semantica.
Topic graph
Visualizzazione force-directed degli argomenti estratti dall'archivio e delle loro connessioni. Ogni nodo è un topic, ogni arco una relazione desunta dai documenti. Utile per navigare la conoscenza aziendale.
Master Data
Anagrafiche di business (clienti, fornitori, prodotti, persone) modellate come Entity con field schema personalizzato. Gli asset documentali vi si collegano per costruire una memoria aziendale strutturata.
Audit log
Registro immutabile delle azioni svolte nella piattaforma: chi ha letto, modificato, scaricato, condiviso o approvato un documento, e quando. Pilastro della compliance documentale e del controllo accessi.
// FAQ

Domande frequenti.

L'AI può inventare cose? Come verifico?+

Ogni claim della wiki e ogni risposta della chat hanno citazioni cliccabili che linkano al documento sorgente. Se non c'è una fonte verificabile, la frase non viene generata.

Posso usare Theka senza il knowledge layer?+

Sì. Il knowledge layer è un modulo opzionale. Disattivato, Theka resta un DAM completo con asset, versioni, approvazioni, master data, audit. I dati estratti in precedenza restano salvati: se riattivi, riparti da dove eri.

Posso scegliere quale modello AI usare per ogni categoria?+

Sì. Ogni Categoria può avere i suoi task AI configurati indipendentemente: quali abilitare (extract metadata, OCR, summary, embedding, knowledge…), con quale provider e modello. Override per categoria sopra ai default del tenant.

Come funziona il workflow di approvazione?+

Per ogni Asset Type definisci stage di approvazione e modalità (all = tutti devono approvare, any = basta uno, sequential = in ordine). Le decisioni possibili sono approve, reject, request_changes. Il tutto tracciato in audit log.

Dove vivono i dati?+

Storage isolato per tenant. I documenti restano sotto tuo controllo: puoi esportarli o cancellarli in qualunque momento, e il knowledge layer si aggiorna di conseguenza.

Si integra con SSO?+

Sì, via OAuth Microsoft e Google (sia per login utente sia per connessione organization). MFA disponibile come opzione.

// contatto

Valutiamo Theka
sul vostro archivio.

Una call di 30 minuti per una demo guidata e una valutazione preliminare di idoneità al vostro contesto operativo.