29/06/2026 TuaGPT

TuaGPT + TuaGate + LM Studio: Best practice di configurazione

Configuriamo la piattaforma dalla prima connessione al contesto ottimale

TuaGPT: tre livelli, una catena

La piattaforma TuaGPT non è un singolo programma: è un ecosistema a strati. Configurarlo bene significa capire cosa fa ciascun componente e in che ordine intervenire, così da ottenere chat stabili senza saturare la memoria del PC.

Livello	Ruolo	Cosa configuri
TuaGPT	Client desktop Windows	Connessione, parametri chat, prompt, agenti, tool, RAG, aspetto
TuaGate	Gateway API	Backend LLM, token, routing verso LM Studio/Ollama/cloud
LM Studio	Motore di inferenza locale	Modello, contesto, GPU, quantizzazione

TuaGPT → TuaGate → LM Studio

Ordine consigliato: prima LM Studio (modello caricato e server attivo), poi TuaGate, infine TuaGPT — partendo dalla scheda Connessioni.

Panoramica delle impostazioni TuaGPT

La finestra Impostazioni è organizzata in 7 schede. Ogni scheda contiene uno o più Gruppi (riquadri) che raggruppano controlli correlati.

Scheda	GroupBox principali	Effetto globale
Connessioni	Server, Email	Come TuaGPT raggiunge il backend e invia email
Generali	Client, Notifiche, Backup, Manutenzione DB, Chat	Comportamento app, sicurezza, aspetto
Prompt & Chat	Categorie, Gruppi, Titoli, System prompt, QueryBoost	Organizzazione e arricchimento automatico
LLM & OCR	OCR, Impostazioni LLM, Modelli riservati	Parametri modello e OCR su immagini
LLM e Classificazione	Selezione automatica, Profili Modelli (Importante per abilitare Tool & Visione), Feedback, Mapping	Scelta intelligente del modello, abilitazione o meno dei Tool e Visione per modelli classificati
Tool LLM	Tool base, Browser, Thunderbird, TuaVoice, Immagini, Planner	Funzioni invocabili dal modello
LaTeX	Rendering, Padding, Bitmap, Display, RTF, Limiti	Formule matematiche in chat

Le modifiche si salvano confermando la finestra. Dopo cambiamenti a URL, token o abilitazioni importanti, usa sempre Verifica connessione o i pulsanti Test dove presenti.

Per il dettaglio di ogni scheda vedi anche la guida Impostazioni.

Scheda «Connessioni»

Gruppo «Imposta connessione al Server»

Questo è il punto di partenza: senza una connessione valida nulla funziona.

Controllo	Effetto
URL del server TuaGPT	Indirizzo base API compatibile OpenAI. Es.: `http://localhost:5000` (TuaGate Locale), `https://tuo.gateway.com` (TuaGate su server remoto).
Token di sicurezza	Chiave Bearer per il gateway, obbligatorio per TuaGate.
Timeout HTTP/LLM (sec)	Tempo massimo di attesa per ogni richiesta. Default 30 s; per modelli locali grandi conviene 120–300 s.
Verifica connessione	Controlla raggiungibilità e credenziali senza avviare una chat.
Connetti	Stabilisce la sessione con il server.
Scopri Endpoint	Individua endpoint e modelli disponibili.

Effetto del gruppo: definisce dove parla TuaGPT e quanto è paziente in attesa. Un timeout troppo basso con un PC con sola CPU è la causa più frequente di «connessione OK ma chat che fallisce».

Gruppo «Impostazioni Invio Email»

Modalità SMTP o client di posta, host, porta, credenziali, SSL, Test SMTP. Non influenza la chat LLM: va configurato per l'interfacciamento con Thunderbird se usato. Potrebbe essere richiesto per completare eventuale attivazione della licenza.

Scheda «Generali»

Gruppo «Opzioni Generali TuaGPT Client»

Controllo	Effetto
Connetti al server all'avvio	Consente di fare in modo che TuaGPT effettui la connessione automatica all'URL configurato subito dopo il lancio.
Abilita Crittografia Dati	Cifra il database locale. Solo TuaGPT installato nel tuo computer potrà accedervi. Attivala solo dopo un backup: non è reversibile senza file di recupero.
Salva / Aggiorna recupero	Gestione passphrase per migrare o ripristinare dati cifrati.
Link cliccabili nelle chat	Consente di aprire direttamente nel browser web i link che compaiono in chat al click con il mouse.
Riduci nell'area di notifica	Consente di evitare la chiusura di TuaGPT quando si fa click sulla X in alto a destra. L'app sarà minimizzata nella tray area in basso a destra di windows e rimarrà pronta per altro uso in qualsiasi momento istantaneamente.
Mostra conferme e notifiche	Dialoghi per operazioni sensibili.
Salva log su file / Abilita tutti i log	Abilita i log per la Diagnostica su disco; utile per supporto, aumenta uso disco se lasciati attivi.
Abilita invio con tasto Enter	Consente di inviare le domande digitate nella query area, premendo il tasto enter della tastiera
Usa endpoint nativi (/v1/responses)	Per LM Studio ≥ 0.4.1 e backend stateful. Attiva solo se il server lo supporta. (Funzione che sarà deprecata a breve..)
Propaga modello principale su QueryBoost e AutoTitle	Usa lo stesso modello della barra strumenti per titoli e QueryBoost. Consente di ottenere velocemente la titolazione automatica delle chat, e consete di accedere al queryboost più velocemente perchè evita il caricamento di un secondo modello predefinito per queste funzioni, su server con risorse limitate.
Titolo gruppo tasti funzione	Server a stampare un titolo descrittivo per il riquadro dei pulsanti funzioni nella finestra principale dell'applicazione.

Gruppo «Notifiche Windows»

Consente di ricevere notifiche Toast di sistema e avviso a fine risposta del modello.

Gruppo «Backup Database»

Consente di effettuare un Backup locale automatico alla chiusura, dei dati di TuaGPT, + possibile scegliere cartella destinazione e se effettuare un backup su richiesta.

Gruppo «Manutenzione database»

Verifica e compatta il database, svuota l'archivio dati RAG globale (irreversibile), consente la ricostruzione degli indici se necessario.

Gruppo «Visualizzazione Chat»

In questo gruppo di controlli è possibile selezionare il tipo di Tema tra chiaro o scuro, tipo di font usato per la chat, padding, spaziatura, timestamp, icone azioni sui messaggi (ChatDisplayBox).

Scheda «Prompt & Chat»

Gruppo «Imposta le Categorie dei Prompt»

Consente di creare categorie per classificare i Prompt. Non impatta si inferenza, ha il solo scopo di organizzare le informazioni con cui si effettueranno le richieste al modello.

Gruppo «Imposta i Gruppi delle Chat»

Consente di creare Gruppi o Categorie per organizzare le conversazioni.

Gruppo «Generazione Automatica Titoli Chat»

Controllo	Effetto
Genera titoli automaticamente	Dopo la prima risposta, propone un titolo (+1 chiamata LLM).
Modello per titoli	Quale LLM usare (meglio uno veloce).
Lunghezza massima / max token	Limita token spesi per il titolo.

Gruppo «Prompt di Sistema Chat»

Abilita prompt di sistema chat — contesto globale (tono, regole). Influenza ogni risposta: usalo con parsimonia all'inizio.

Gruppo «QueryBoost»

Riformula la domanda prima dell'invio (+1 chiamata LLM). Modello dedicato, avviso prima della sostituzione, prompt personalizzabile. Per iniziare: lascialo disattivato.

Scheda «LLM & OCR»

Gruppo «Configurazione OCR»

Tesseract su immagini: percorso dati, lingua (ita+eng), soglia confidenza, OCR parallelo, pool, retry. Necessario solo con scansioni o PDF immagine. Parallelismo alto può saturare la CPU.

Gruppo «Impostazioni LLM»

Controllo	Default	Effetto
Modello di riferimento	—	Predefinito per le chat (allineato al selettore principale).
Temperature	0.7	Creatività della risposta.
Top P	0.9	Campionamento nucleare; varia preferibilmente temperature o top_p.
Max Tokens	1000	Lunghezza massima della risposta.
Limita lunghezza risposta	On	Se off, vale il default del backend (non è «illimitato»).
Presence / Frequency Penalty	0	Penalizza ripetizioni e cambio argomento.

I parametri sono salvati per modello: cambiando modello si caricano i valori del profilo associato.

Gruppo «Modelli Riservati»

Modelli contrassegnati per funzioni di sistema (QueryBoost, titoli). Evita modelli pesanti per compiti brevi.

Scheda «LLM e Classificazione»

Gruppo «Selezione Automatica LLM»

Sceglie il modello in base a complessità, tipo, contesto, topic, lingua (pesi predefiniti: 30, 25, 20, 15, 10). Comodo con molti modelli; per iniziare può confondere — disattivala e usa Propaga modello principale.

Gruppo «Profili Modelli» / «Statistiche Feedback» / «Mapping Manuale»

Setup avanzato: profili per scenario, statistiche selezione automatica, modello forzato per categoria di prompt.

Scheda «Tool LLM»

Gruppo «Impostazioni Tool LLM»

Controllo	Effetto
Abilita Tool per LLM	Master switch: senza di esso nessun tool per il modello.
Limite iterazioni tool	Chiamate tool consecutive per turno (0 = illimitato).
Messaggi cronologia inviati all'API	Default 10. Incide su RAM/contesto lato server.
execute_workflow	DSL batch web/planner con limiti step, foreach, timeout, output.
Porta TuaGPT	Default 8765 per estensioni browser/Thunderbird.

Altri Gruppi

Estensione Browser — ricerca web reale via Chrome/Firefox
Estensione Thunderbird — tool email
TuaVoice — dettatura/sintesi satellite
Generazione Immagini — tool generate_image via TuaGate
Planner — calendario interno (richiede licenza TuaGPT)

Senza licenza TuaGPT i tool RAG e il ramo RAG della ricerca unificata sono bloccati; la chat base resta utilizzabile.

Scheda «LaTeX»

Rendering formule con CSharpMath: motore, padding, dimensioni bitmap, display inline/blocco, parametri RTF, limiti lunghezza formula, anteprima. Solo estetica e performance matematica — i default vanno bene per l'uso quotidiano.

Profilo di base: partire subito senza effetti collaterali

Configurazione minima per chat funzionante senza timeout, tool indesiderati o crittografia irreversibile.

Stack consigliato per la prima prova

LM Studio con modello Q4/Q5 adatto alla RAM disponibile
TuaGate che ascolta su http://localhost:5050
TuaGPT su http://localhost:5050

Area	Impostazione	Valore
Connessioni	URL	`http://localhost:5000` o URL remoto dove risiede TuaGate
Connessioni	Token	Token generato da TuaGate in configurazione utenti
Connessioni	Timeout	180 s
Generali	Connetti all'avvio	Consente di connettere automaticamente TuaGPT quando lo lonciamo
Generali	Crittografia / log verbosi	No
Generali	Endpoint nativi	No (solo se serve LM Studio 0.4.1+) - Sarà elimianta nelle prossime relase
Generali	Propaga modello principale	Si - Consente di ottenere la titolazione della chat automaticamente dallo stesso modello che usiamo per fare inferenza
LLM	Temperature / Max tokens	0.7 / 1024–2048 con limite attivo
LLM	OCR	SI
Prompt	QueryBoost / system prompt	SI / NO dipende dalla RAM disponibile dal sistema
Classificazione	Selezione automatica	NO - non attivare almeno che la workstation che state usando abbia RAM in abbondanza e CPU di fascia alta, richiede download modelli ONNX
Tool	Attivati / Disattivati	SI ma limitate alle sole funzioni base - se si vuole far fare ricerca web e se supportati altrimenti NO

Senza licenza TuaGPT

Disponibili: chat, file contestuali, ricerca web base, esportazione. Bloccati (richiedono licenza): RAG globale, Planner, Condivisione, tool rag_vector_search.

Checklist prima della prima chat

LM Studio: modello caricato e Local Server attivo (porta 1234)
TuaGate, server avviato, che ascolta porta 5050 su localhost / 127.0.0.1
TuaGPT: Verifica connessione → OK su http://127.0.0.1:5050
Modello selezionato → Test LLM da TuaGPT con esito positivo

TuaGate: impostazioni essenziali (modalità trial senza licenza)

TuaGate è il gateway che espone un'API OpenAI-compat verso uno o più backend. TuaGPT non deve conoscere i dettagli del backend: parla solo con TuaGate.

Parametro	Valore tipico (trial)
URL in TuaGPT	`http://127.0.0.1:5000 (il numero di porta è arbitrario a vostra discrezione)`
Token	Generato in gestione utenti e da incollare in TuaGPT
Timeout TuaGPT	180–300 s

Non abilitare tool avanzati finché la connessione base non funziona
Un endpoint ma più modelli senza licenza
Niente crittografia DB sulla prima installazione se prevedi migrazione
RAG, Planner, Condivisione richiedono licenza TuaGPT anche con TuaGate attivo

Per TuaGate privato: esporre API HTTP/HTTPS, configurare backend verso LM Studio, impostare token server, verificare /v1/models.

LM Studio: i parametri che fanno la differenza

LM Studio consuma RAM e VRAM. TuaGPT invia messaggi; LM Studio decide quanto contesto tenere in memoria.

1. Context Length — il parametro critico

Contesto	Uso	RAM indicativa (7B Q4)
4 096	Chat brevi	~6–8 GB
8 192	Uso quotidiano	~8–10 GB
16 384	Documenti, RAG	~12–16 GB
32 768+	Contesti lunghi	24 GB+

La KV cache cresce linearmente con il contesto. Raddoppiare da 8K a 16K può aggiungere diversi GB di RAM.

2. Quantizzazione

Formato	RAM	Quando
Q4_K_M	Bassa	8–16 GB RAM — default
Q5_K_M	Media	16–32 GB RAM
Q8 / FP16	Alta	32 GB+ o GPU con VRAM ampia

3. GPU offload

Tutti i layer su GPU = velocità massima ma VRAM sufficiente. Split CPU/GPU = più lento ma compatibile. In OOM: riduci prima il context, poi i layer GPU, poi modello più piccolo.

4. Max tokens (server vs client)

Context totale = input (cronologia + prompt + documenti) + output. Se supera il context length, il server tronca o fallisce.

Esempio: 3000 token cronologia + 3500 documento + 2048 risposta = 8548 token su context 8192 → errore. Soluzione: meno cronologia, documento più piccolo, o context maggiore (se la RAM lo consente).

5. Temperature e endpoint

Configura temperature/top_p solo in TuaGPT (scheda LLM). Per LM Studio ≥ 0.4.1: endpoint nativi in TuaGPT solo se necessario (vision, sessioni stateful). A breve aggiorneremo e aggiungeremo ulteriori dettagli su questo articolo.

6. Modelli vision

Ogni immagine può equivalere a centinaia–migliaia di token. Preferisci modelli vision 7B quantizzati su hardware consumer.

Schema decisionale: quanto contesto posso usare?

RAM sistema (es. 16 GB) ├── OS + altre app: ~4–6 GB └── Budget LLM: ~10 GB ├── Modello 7B Q4: ~4–5 GB └── Margine KV cache: ~5 GB └── Context sicuro: 8192 token

Con RAG o file contestuali grandi, riduci il contesto in LM Studio o i messaggi di cronologia in TuaGPT.

Riepilogo best practice

Priorità	Azione
Alta	Timeout ≥ 120 s; verifica connessione prima dei tool
Alta	LM Studio: context allineato alla RAM reale
Media	Disattiva tool, QueryBoost e selezione automatica all'inizio
Media	Max tokens 1024–2048; cronologia API 10 messaggi
Bassa	OCR, LaTeX avanzato, log verbosi: solo se servono
Attenzione	Crittografia DB: solo dopo backup
Attenzione	Senza licenza: niente RAG/Planner/Condivisione, ma chat OK

Conclusione

Configura dal basso verso l'alto: LM Studio (modello, quantizzazione, contesto), poi TuaGate, infine TuaGPT da Connessioni con il profilo minimo. La finestra Impostazioni è ampia, ma per l'uso quotidiano bastano poche scelte corrette.