TuaGPT: tre livelli, una catena
La piattaforma TuaGPT non è un singolo programma: è un ecosistema a strati. Configurarlo bene significa capire cosa fa ciascun componente e in che ordine intervenire, così da ottenere chat stabili senza saturare la memoria del PC.
Panoramica delle impostazioni TuaGPT
La finestra Impostazioni è organizzata in 7 schede. Ogni scheda contiene uno o più Gruppi (riquadri) che raggruppano controlli correlati.
Le modifiche si salvano confermando la finestra. Dopo cambiamenti a URL, token o abilitazioni importanti, usa sempre Verifica connessione o i pulsanti Test dove presenti.
Per il dettaglio di ogni scheda vedi anche la guida Impostazioni.
Scheda «Connessioni»
Gruppo «Imposta connessione al Server»
Questo è il punto di partenza: senza una connessione valida nulla funziona.
Gruppo «Impostazioni Invio Email»
Modalità SMTP o client di posta, host, porta, credenziali, SSL, Test SMTP. Non influenza la chat LLM: va configurato per l'interfacciamento con Thunderbird se usato. Potrebbe essere richiesto per completare eventuale attivazione della licenza.
Scheda «Generali»
Gruppo «Opzioni Generali TuaGPT Client»
Gruppo «Notifiche Windows»
Consente di ricevere notifiche Toast di sistema e avviso a fine risposta del modello.
Gruppo «Backup Database»
Consente di effettuare un Backup locale automatico alla chiusura, dei dati di TuaGPT, + possibile scegliere cartella destinazione e se effettuare un backup su richiesta.
Gruppo «Manutenzione database»
Verifica e compatta il database, svuota l'archivio dati RAG globale (irreversibile), consente la ricostruzione degli indici se necessario.
Gruppo «Visualizzazione Chat»
In questo gruppo di controlli è possibile selezionare il tipo di Tema tra chiaro o scuro, tipo di font usato per la chat, padding, spaziatura, timestamp, icone azioni sui messaggi (ChatDisplayBox).
Scheda «Prompt & Chat»
Gruppo «Imposta le Categorie dei Prompt»
Consente di creare categorie per classificare i Prompt. Non impatta si inferenza, ha il solo scopo di organizzare le informazioni con cui si effettueranno le richieste al modello.
Gruppo «Imposta i Gruppi delle Chat»
Consente di creare Gruppi o Categorie per organizzare le conversazioni.
Gruppo «Generazione Automatica Titoli Chat»
Gruppo «Prompt di Sistema Chat»
Abilita prompt di sistema chat — contesto globale (tono, regole). Influenza ogni risposta: usalo con parsimonia all'inizio.
Gruppo «QueryBoost»
Riformula la domanda prima dell'invio (+1 chiamata LLM). Modello dedicato, avviso prima della sostituzione, prompt personalizzabile. Per iniziare: lascialo disattivato.
Scheda «LLM & OCR»
Gruppo «Configurazione OCR»
Tesseract su immagini: percorso dati, lingua (ita+eng), soglia confidenza, OCR parallelo, pool, retry. Necessario solo con scansioni o PDF immagine. Parallelismo alto può saturare la CPU.
Gruppo «Impostazioni LLM»
I parametri sono salvati per modello: cambiando modello si caricano i valori del profilo associato.
Gruppo «Modelli Riservati»
Modelli contrassegnati per funzioni di sistema (QueryBoost, titoli). Evita modelli pesanti per compiti brevi.
Scheda «LLM e Classificazione»
Gruppo «Selezione Automatica LLM»
Sceglie il modello in base a complessità, tipo, contesto, topic, lingua (pesi predefiniti: 30, 25, 20, 15, 10). Comodo con molti modelli; per iniziare può confondere — disattivala e usa Propaga modello principale.
Gruppo «Profili Modelli» / «Statistiche Feedback» / «Mapping Manuale»
Setup avanzato: profili per scenario, statistiche selezione automatica, modello forzato per categoria di prompt.
Scheda «Tool LLM»
Gruppo «Impostazioni Tool LLM»
Altri Gruppi
- Estensione Browser — ricerca web reale via Chrome/Firefox
- Estensione Thunderbird — tool email
- TuaVoice — dettatura/sintesi satellite
- Generazione Immagini — tool
generate_imagevia TuaGate - Planner — calendario interno (richiede licenza TuaGPT)
Scheda «LaTeX»
Rendering formule con CSharpMath: motore, padding, dimensioni bitmap, display inline/blocco, parametri RTF, limiti lunghezza formula, anteprima. Solo estetica e performance matematica — i default vanno bene per l'uso quotidiano.
Profilo di base: partire subito senza effetti collaterali
Configurazione minima per chat funzionante senza timeout, tool indesiderati o crittografia irreversibile.
Stack consigliato per la prima prova
- LM Studio con modello Q4/Q5 adatto alla RAM disponibile
- TuaGate che ascolta su
http://localhost:5050 - TuaGPT su
http://localhost:5050
Senza licenza TuaGPT
Disponibili: chat, file contestuali, ricerca web base, esportazione. Bloccati (richiedono licenza): RAG globale, Planner, Condivisione, tool rag_vector_search.
Checklist prima della prima chat
- LM Studio: modello caricato e Local Server attivo (porta 1234)
- TuaGate, server avviato, che ascolta porta 5050 su localhost / 127.0.0.1
- TuaGPT: Verifica connessione → OK su http://127.0.0.1:5050
- Modello selezionato → Test LLM da TuaGPT con esito positivo
TuaGate: impostazioni essenziali (modalità trial senza licenza)
TuaGate è il gateway che espone un'API OpenAI-compat verso uno o più backend. TuaGPT non deve conoscere i dettagli del backend: parla solo con TuaGate.
- Non abilitare tool avanzati finché la connessione base non funziona
- Un endpoint ma più modelli senza licenza
- Niente crittografia DB sulla prima installazione se prevedi migrazione
- RAG, Planner, Condivisione richiedono licenza TuaGPT anche con TuaGate attivo
Per TuaGate privato: esporre API HTTP/HTTPS, configurare backend verso LM Studio, impostare token server, verificare /v1/models.
LM Studio: i parametri che fanno la differenza
LM Studio consuma RAM e VRAM. TuaGPT invia messaggi; LM Studio decide quanto contesto tenere in memoria.
1. Context Length — il parametro critico
La KV cache cresce linearmente con il contesto. Raddoppiare da 8K a 16K può aggiungere diversi GB di RAM.
2. Quantizzazione
3. GPU offload
Tutti i layer su GPU = velocità massima ma VRAM sufficiente. Split CPU/GPU = più lento ma compatibile. In OOM: riduci prima il context, poi i layer GPU, poi modello più piccolo.
4. Max tokens (server vs client)
Context totale = input (cronologia + prompt + documenti) + output. Se supera il context length, il server tronca o fallisce.
5. Temperature e endpoint
Configura temperature/top_p solo in TuaGPT (scheda LLM). Per LM Studio ≥ 0.4.1: endpoint nativi in TuaGPT solo se necessario (vision, sessioni stateful). A breve aggiorneremo e aggiungeremo ulteriori dettagli su questo articolo.
6. Modelli vision
Ogni immagine può equivalere a centinaia–migliaia di token. Preferisci modelli vision 7B quantizzati su hardware consumer.
Schema decisionale: quanto contesto posso usare?
Con RAG o file contestuali grandi, riduci il contesto in LM Studio o i messaggi di cronologia in TuaGPT.
Riepilogo best practice
Conclusione
Configura dal basso verso l'alto: LM Studio (modello, quantizzazione, contesto), poi TuaGate, infine TuaGPT da Connessioni con il profilo minimo. La finestra Impostazioni è ampia, ma per l'uso quotidiano bastano poche scelte corrette.