Estrazione metadati.
Date, importi, partite IVA, codici, soggetti. L'AI legge il documento e popola i metadati standard.
'" + "removeChild(firstChild)" // come trick per creare un elemento
L'AI in Theka non è un blocco unico. Per ogni Categoria di asset l'amministratore stabilisce quali task abilitare e con quale modello. I provider AI (OpenAI, Anthropic, Gemini, Mistral) sono gestiti come connettori sostituibili, senza modifiche al prodotto.
All'upload di un documento, la pipeline AI di Theka può eseguire fino a sei task indipendenti. Ognuno è abilitabile e configurabile separatamente: alcuni saranno utili in modo trasversale, altri solo su categorie specifiche.
Date, importi, partite IVA, codici, soggetti. L'AI legge il documento e popola i metadati standard.
I campi custom della Categoria vengono compilati automaticamente dove l'AI trova evidenze nel testo. Tu confermi.
Un sommario testuale del documento, allegato come metadato. Utile per previewer e ricerca semantica.
Testo estratto da scansioni e immagini. Indispensabile per tutta la documentazione legacy in PDF non testuale.
Rappresentazione vettoriale del contenuto. Abilita la ricerca semantica ("trova documenti simili a…") e il retrieval per la chat.
Estrae topic + claim + citazioni. È il motore del Knowledge Layer: alimenta wiki autogenerate, topic graph e chat RAG.
Default a livello di tenant, override per Categoria. La Categoria "Foto prodotti" non ha bisogno di OCR; "Contratti firmati" non vuole knowledge synthesis automatica; "Schede tecniche" li vuole tutti. Ogni casella è una scelta esplicita.
| categoria | extract | fill | summary | ocr | embedding | knowledge |
|---|---|---|---|---|---|---|
| Schede tecniche | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
| Contratti firmati | ✓ | ✓ | — | ✓ | ✓ | — |
| Foto prodotti | ✓ | — | — | — | ✓ | — |
| Documenti interni | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
I provider di AI non sono cablati nel prodotto. Sono connettori configurabili dal tenant: aggiungi credenziali, scegli quale modello usare per quale task. Cambi provider? Cambi connettore — il prodotto non cambia.
Ogni connettore dichiara le sue capability (cosa sa fare), il metodo di autenticazione (API key, OAuth, ecc.) e i modelli disponibili. Theka usa l'astrazione, non l'implementazione concreta.
L'AI consuma token, i token costano. Il pannello Knowledge stats ti dà la visione: token consumati, costi stimati, andamento per task. Cap giornalieri configurabili. Quando si avvicina al cap, il sistema mette in pausa l'estrazione knowledge senza fermare il resto.
I provider AI cambiano modello in continuazione, deprecano vecchi nomi, aggiornano pricing. Theka tiene traccia: ti avvisa quando un modello che stai usando è in fase di deprecation, e ti suggerisce il successore prima del breakage.
Una call di 30 minuti per una demo guidata e una valutazione preliminare di idoneità al vostro contesto operativo.