Blog TuaGPT
Home
/
Blog
/
TuaGPT + TuaGate + LM Studio: Best practice di configurazione
TuaGPT + TuaGate + LM Studio: Best practice di configurazione
29/06/2026 TuaGPT

TuaGPT + TuaGate + LM Studio: Best practice di configurazione

Configuriamo la piattaforma dalla prima connessione al contesto ottimale

TuaGPT: tre livelli, una catena

La piattaforma TuaGPT non è un singolo programma: è un ecosistema a strati. Configurarlo bene significa capire cosa fa ciascun componente e in che ordine intervenire, così da ottenere chat stabili senza saturare la memoria del PC.

Livello Ruolo Cosa configuri
TuaGPT Client desktop Windows Connessione, parametri chat, prompt, agenti, tool, RAG, aspetto
TuaGate Gateway API Backend LLM, token, routing verso LM Studio/Ollama/cloud
LM Studio Motore di inferenza locale Modello, contesto, GPU, quantizzazione
TuaGPT → TuaGate → LM Studio
Ordine consigliato: prima LM Studio (modello caricato e server attivo), poi TuaGate, infine TuaGPT — partendo dalla scheda Connessioni

Panoramica delle impostazioni TuaGPT

La finestra Impostazioni è organizzata in 7 schede. Ogni scheda contiene uno o più Gruppi (riquadri) che raggruppano controlli correlati.

Scheda GroupBox principali Effetto globale
Connessioni Server, Email Come TuaGPT raggiunge il backend e invia email
Generali Client, Notifiche, Backup, Manutenzione DB, Chat Comportamento app, sicurezza, aspetto
Prompt & Chat Categorie, Gruppi, Titoli, System prompt, QueryBoost Organizzazione e arricchimento automatico
LLM & OCR OCR, Impostazioni LLM, Modelli riservati Parametri modello e OCR su immagini
LLM e Classificazione Selezione automatica, Profili Modelli (Importante per abilitare Tool & Visione), Feedback, Mapping Scelta intelligente del modello, abilitazione o meno dei Tool e Visione per modelli classificati
Tool LLM Tool base, Browser, Thunderbird, TuaVoice, Immagini, Planner Funzioni invocabili dal modello
LaTeX Rendering, Padding, Bitmap, Display, RTF, Limiti Formule matematiche in chat

Le modifiche si salvano confermando la finestra. Dopo cambiamenti a URL, token o abilitazioni importanti, usa sempre Verifica connessione o i pulsanti Test dove presenti.

Per il dettaglio di ogni scheda vedi anche la guida Impostazioni.

Scheda «Connessioni»

Gruppo «Imposta connessione al Server»

Questo è il punto di partenza: senza una connessione valida nulla funziona.

Controllo Effetto
URL del server TuaGPT Indirizzo base API compatibile OpenAI. Es.: http://localhost:5000 (TuaGate Locale),  https://tuo.gateway.com (TuaGate su server remoto).
Token di sicurezza Chiave Bearer per il gateway, obbligatorio per TuaGate.
Timeout HTTP/LLM (sec) Tempo massimo di attesa per ogni richiesta. Default 30 s; per modelli locali grandi conviene 120–300 s.
Verifica connessione Controlla raggiungibilità e credenziali senza avviare una chat.
Connetti Stabilisce la sessione con il server.
Scopri Endpoint Individua endpoint e modelli disponibili.
Effetto del gruppo: definisce dove parla TuaGPT e quanto è paziente in attesa. Un timeout troppo basso con un PC con sola CPU è la causa più frequente di «connessione OK ma chat che fallisce».

 

Gruppo «Impostazioni Invio Email»

Modalità SMTP o client di posta, host, porta, credenziali, SSL, Test SMTP. Non influenza la chat LLM: va configurato per l'interfacciamento con Thunderbird se usato. Potrebbe essere richiesto per completare eventuale attivazione della licenza.

Scheda «Generali»

 

Gruppo «Opzioni Generali TuaGPT Client»

Controllo Effetto
Connetti al server all'avvio Consente di fare in modo che TuaGPT effettui la connessione automatica all'URL configurato subito dopo il lancio.
Abilita Crittografia Dati Cifra il database locale. Solo TuaGPT installato nel tuo computer potrà accedervi. Attivala solo dopo un backup: non è reversibile senza file di recupero.
Salva / Aggiorna recupero Gestione passphrase per migrare o ripristinare dati cifrati.
Link cliccabili nelle chat Consente di aprire direttamente nel browser web i link che compaiono in chat al click con il mouse.
Riduci nell'area di notifica Consente di evitare la chiusura di TuaGPT quando si fa click sulla X in alto a destra. L'app sarà minimizzata nella tray area in basso a destra di windows e rimarrà pronta per altro uso in qualsiasi momento istantaneamente.
Mostra conferme e notifiche Dialoghi per operazioni sensibili.
Salva log su file / Abilita tutti i log Abilita i log per la Diagnostica su disco; utile per supporto, aumenta uso disco se lasciati attivi.
Abilita invio con tasto Enter Consente di inviare le domande digitate nella query area, premendo il tasto enter della tastiera
Usa endpoint nativi (/v1/responses)
Per LM Studio ≥ 0.4.1 e backend stateful. Attiva solo se il server lo supporta.
(Funzione che sarà deprecata a breve..) 
 
Propaga modello principale su QueryBoost e AutoTitle Usa lo stesso modello della barra strumenti per titoli e QueryBoost. Consente di ottenere velocemente la titolazione automatica delle chat, e consete di accedere al queryboost più velocemente perchè evita il caricamento di un secondo modello predefinito per queste funzioni, su server con risorse limitate.
Titolo gruppo tasti funzione Server a stampare un titolo descrittivo per il riquadro dei pulsanti funzioni nella finestra principale dell'applicazione.

Gruppo «Notifiche Windows»

Consente di ricevere notifiche Toast di sistema e avviso a fine risposta del modello.

Gruppo «Backup Database»

Consente di effettuare un Backup locale automatico alla chiusura, dei dati di TuaGPT, + possibile scegliere cartella destinazione e se effettuare un backup su richiesta.

Gruppo «Manutenzione database»

Verifica e compatta il database, svuota l'archivio dati RAG globale (irreversibile), consente la ricostruzione degli indici se necessario.

Gruppo «Visualizzazione Chat»

In questo gruppo di controlli è possibile selezionare il tipo di Tema tra chiaro o scuro, tipo di font usato per la chat, padding, spaziatura, timestamp, icone azioni sui messaggi (ChatDisplayBox).

Scheda «Prompt & Chat»

Gruppo «Imposta le Categorie dei Prompt»

Consente di creare categorie per classificare i Prompt. Non impatta si inferenza, ha il solo scopo di organizzare le informazioni con cui si effettueranno le richieste al modello.

Gruppo «Imposta i Gruppi delle Chat»

Consente di creare Gruppi o Categorie per organizzare le conversazioni.

Gruppo «Generazione Automatica Titoli Chat»

Controllo Effetto
Genera titoli automaticamente Dopo la prima risposta, propone un titolo (+1 chiamata LLM).
Modello per titoli Quale LLM usare (meglio uno veloce).
Lunghezza massima / max token Limita token spesi per il titolo.

Gruppo «Prompt di Sistema Chat»

Abilita prompt di sistema chat — contesto globale (tono, regole). Influenza ogni risposta: usalo con parsimonia all'inizio.

Gruppo «QueryBoost»

Riformula la domanda prima dell'invio (+1 chiamata LLM). Modello dedicato, avviso prima della sostituzione, prompt personalizzabile. Per iniziare: lascialo disattivato.

Scheda «LLM & OCR»

Gruppo «Configurazione OCR»

Tesseract su immagini: percorso dati, lingua (ita+eng), soglia confidenza, OCR parallelo, pool, retry. Necessario solo con scansioni o PDF immagine. Parallelismo alto può saturare la CPU.

Gruppo «Impostazioni LLM»

Controllo Default Effetto
Modello di riferimento Predefinito per le chat (allineato al selettore principale).
Temperature 0.7 Creatività della risposta.
Top P 0.9 Campionamento nucleare; varia preferibilmente temperature o top_p.
Max Tokens 1000 Lunghezza massima della risposta.
Limita lunghezza risposta On Se off, vale il default del backend (non è «illimitato»).
Presence / Frequency Penalty 0 Penalizza ripetizioni e cambio argomento.

I parametri sono salvati per modello: cambiando modello si caricano i valori del profilo associato.

Gruppo «Modelli Riservati»

Modelli contrassegnati per funzioni di sistema (QueryBoost, titoli). Evita modelli pesanti per compiti brevi.

Scheda «LLM e Classificazione»

Gruppo «Selezione Automatica LLM»

Sceglie il modello in base a complessità, tipo, contesto, topic, lingua (pesi predefiniti: 30, 25, 20, 15, 10). Comodo con molti modelli; per iniziare può confondere — disattivala e usa Propaga modello principale.

Gruppo «Profili Modelli» / «Statistiche Feedback» / «Mapping Manuale»

Setup avanzato: profili per scenario, statistiche selezione automatica, modello forzato per categoria di prompt.

Scheda «Tool LLM»

Gruppo «Impostazioni Tool LLM»

Controllo Effetto
Abilita Tool per LLM Master switch: senza di esso nessun tool per il modello.
Limite iterazioni tool Chiamate tool consecutive per turno (0 = illimitato).
Messaggi cronologia inviati all'API Default 10. Incide su RAM/contesto lato server.
execute_workflow DSL batch web/planner con limiti step, foreach, timeout, output.
Porta TuaGPT Default 8765 per estensioni browser/Thunderbird.

Altri Gruppi

  • Estensione Browser — ricerca web reale via Chrome/Firefox
  • Estensione Thunderbird — tool email
  • TuaVoice — dettatura/sintesi satellite
  • Generazione Immagini — tool generate_image via TuaGate
  • Planner — calendario interno (richiede licenza TuaGPT)
Senza licenza TuaGPT i tool RAG e il ramo RAG della ricerca unificata sono bloccati; la chat base resta utilizzabile.

Scheda «LaTeX»

Rendering formule con CSharpMath: motore, padding, dimensioni bitmap, display inline/blocco, parametri RTF, limiti lunghezza formula, anteprima. Solo estetica e performance matematica — i default vanno bene per l'uso quotidiano.

Profilo di base: partire subito senza effetti collaterali

Configurazione minima per chat funzionante senza timeout, tool indesiderati o crittografia irreversibile.

Stack consigliato per la prima prova

  1. LM Studio con modello Q4/Q5 adatto alla RAM disponibile
  2. TuaGate che ascolta su http://localhost:5050
  3. TuaGPT su http://localhost:5050 
Area Impostazione Valore
Connessioni URL http://localhost:5000 o URL remoto dove risiede TuaGate
Connessioni Token Token generato da TuaGate in configurazione utenti
Connessioni Timeout 180 s
Generali Connetti all'avvio Consente di connettere automaticamente TuaGPT quando lo lonciamo
Generali Crittografia / log verbosi No
Generali Endpoint nativi No (solo se serve LM Studio 0.4.1+) - Sarà elimianta nelle prossime relase
Generali Propaga modello principale Si - Consente di ottenere la titolazione della chat automaticamente dallo stesso modello che usiamo per fare inferenza
LLM Temperature / Max tokens 0.7 / 1024–2048 con limite attivo
LLM OCR SI
Prompt QueryBoost / system prompt SI / NO dipende dalla RAM disponibile dal sistema 
Classificazione Selezione automatica NO - non attivare almeno che la workstation che state usando abbia RAM in abbondanza e CPU di fascia alta, richiede download modelli ONNX
Tool Attivati / Disattivati SI ma limitate alle sole funzioni base - se si vuole far fare ricerca web e se supportati altrimenti NO
     

Senza licenza TuaGPT

Disponibili: chat, file contestuali, ricerca web base, esportazione. Bloccati (richiedono licenza): RAG globale, Planner, Condivisione, tool rag_vector_search.

Checklist prima della prima chat

  1. LM Studio: modello caricato e Local Server attivo (porta 1234)
  2. TuaGate, server avviato, che ascolta porta 5050 su localhost / 127.0.0.1 
  3. TuaGPT: Verifica connessione → OK su http://127.0.0.1:5050
  4. Modello selezionato → Test LLM da TuaGPT con esito positivo

TuaGate: impostazioni essenziali (modalità trial senza licenza)

TuaGate è il gateway che espone un'API OpenAI-compat verso uno o più backend. TuaGPT non deve conoscere i dettagli del backend: parla solo con TuaGate.

Parametro Valore tipico (trial)
URL in TuaGPT http://127.0.0.1:5000 (il numero di porta è arbitrario a vostra discrezione)
Token Generato in gestione utenti e da incollare in TuaGPT
Timeout TuaGPT 180–300 s
  • Non abilitare tool avanzati finché la connessione base non funziona
  • Un endpoint ma più modelli senza licenza  
  • Niente crittografia DB sulla prima installazione se prevedi migrazione
  • RAG, Planner, Condivisione richiedono licenza TuaGPT anche con TuaGate attivo

Per TuaGate privato: esporre API HTTP/HTTPS, configurare backend verso LM Studio, impostare token server, verificare /v1/models.

LM Studio: i parametri che fanno la differenza

LM Studio consuma RAM e VRAM. TuaGPT invia messaggi; LM Studio decide quanto contesto tenere in memoria.

1. Context Length — il parametro critico

Contesto Uso RAM indicativa (7B Q4)
4 096 Chat brevi ~6–8 GB
8 192 Uso quotidiano ~8–10 GB
16 384 Documenti, RAG ~12–16 GB
32 768+ Contesti lunghi 24 GB+

La KV cache cresce linearmente con il contesto. Raddoppiare da 8K a 16K può aggiungere diversi GB di RAM.

2. Quantizzazione

Formato RAM Quando
Q4_K_M Bassa 8–16 GB RAM — default
Q5_K_M Media 16–32 GB RAM
Q8 / FP16 Alta 32 GB+ o GPU con VRAM ampia

3. GPU offload

Tutti i layer su GPU = velocità massima ma VRAM sufficiente. Split CPU/GPU = più lento ma compatibile. In OOM: riduci prima il context, poi i layer GPU, poi modello più piccolo.

4. Max tokens (server vs client)

Context totale = input (cronologia + prompt + documenti) + output. Se supera il context length, il server tronca o fallisce.

Esempio: 3000 token cronologia + 3500 documento + 2048 risposta = 8548 token su context 8192 → errore. Soluzione: meno cronologia, documento più piccolo, o context maggiore (se la RAM lo consente).

5. Temperature e endpoint

Configura temperature/top_p solo in TuaGPT (scheda LLM). Per LM Studio ≥ 0.4.1: endpoint nativi in TuaGPT solo se necessario (vision, sessioni stateful). A breve aggiorneremo e aggiungeremo ulteriori dettagli su questo articolo.

6. Modelli vision

Ogni immagine può equivalere a centinaia–migliaia di token. Preferisci modelli vision 7B quantizzati su hardware consumer.

Schema decisionale: quanto contesto posso usare?

RAM sistema (es. 16 GB) ├── OS + altre app: ~4–6 GB └── Budget LLM: ~10 GB ├── Modello 7B Q4: ~4–5 GB └── Margine KV cache: ~5 GB └── Context sicuro: 8192 token

Con RAG o file contestuali grandi, riduci il contesto in LM Studio o i messaggi di cronologia in TuaGPT.