
BigQuery export di GA4: perché (e come) esportare i dati grezzi gratuitamente
Setup BigQuery export gratuito di GA4: come superare i limiti di campionamento, costi reali, query basilari, casi d'uso concreti per PMI.
In questa pagina
Introduzione
GA4 ha un limite di campionamento sopra una certa soglia di dati, e ti mostra "stime" invece di "numeri veri". BigQuery export è la valvola che apre i dati grezzi della tua proprietà, gratis, in un database SQL che diventa tuo. Sembra enterprise, è alla portata di qualunque PMI seria.
C'è un momento in cui apri un report di GA4 e leggi, in piccolo sotto al grafico, una scritta che cambia tutto: "this report is based on sampled data". Tradotto: il numero che vedi è una stima statistica, non un dato vero. Per una PMI con poco traffico raramente succede. Per una PMI in crescita, con qualche centinaia di migliaia di sessioni mensili, succede sempre più spesso, sempre nei report più interessanti, sempre nei momenti in cui ti serve precisione vera. BigQuery export è il modo ufficiale e gratuito con cui Google ti restituisce i dati grezzi della tua proprietà, in un database SQL su cui hai controllo totale. Non è enterprise: è alla portata di qualunque PMI con uno minimo di disciplina tecnica.

Perché GA4, prima o poi, inizia a stimare
GA4 applica due meccanismi di "approssimazione" sui dati: il thresholding (per privacy, sotto certe soglie di utenti per dimensione non mostra il dato) e il data sampling (quando il volume di dati da analizzare supera certi limiti, calcola la stima su un campione). Entrambi sono trasparenti nei report, ma molti utenti non li notano e leggono numeri stimati come fossero verità.
Le soglie di campionamento si attivano in modo diverso a seconda del report. Sui report standard, di solito non si campiona fino a milioni di eventi. Sulle exploration, dove sei tu a costruire la query, il campionamento può scattare già da 10 milioni di eventi mensili. Per una PMI sopra le 100.000 sessioni/mese che fa exploration custom, il campionamento è una realtà concreta.
Il thresholding è più subdolo. Sotto certe soglie (gruppi di utenti con dimensioni troppo specifiche, come geo + età + interesse), GA4 nasconde proprio il dato per non rivelare individui. Se fai segmentazione fine sui tuoi utenti, alcuni numeri ti spariscono semplicemente. BigQuery export non ha né thresholding né sampling: tutti gli eventi grezzi, sempre.
Cosa è BigQuery export, spiegato in due righe
BigQuery export è una funzionalità nativa di GA4: collega la tua proprietà a un progetto Google Cloud, e ogni giorno GA4 copia tutti gli eventi grezzi della giornata precedente in un dataset BigQuery. I dati sono strutturati come tabelle SQL, una per giorno, con uno schema documentato pubblicamente da Google. Tu hai accesso completo, puoi farci query, dashboard, export verso altri tool.
L'export è gratuito fino a 1 TB di query processate al mese e 10 GB di storage attivi: limiti che una PMI standard non raggiunge nemmeno per sbaglio. Lo storage costa pochi centesimi al mese se cresce oltre i 10 GB. Le query costano 5 dollari per TB processato dopo la free tier. Per dare un riferimento reale, una PMI con 500.000 eventi/mese consuma tipicamente sotto 1 GB di storage all'anno e zero costi di query, se le scrive bene.
C'è anche una modalità streaming, che spinge i dati in BigQuery in tempo reale invece che giornaliero. Costa di più (a partire dai centesimi per GB streamato) e serve solo se hai casi d'uso che richiedono latenza sub-oraria. Per la maggior parte delle PMI, l'export giornaliero standard è più che sufficiente.
Come si fa il setup, in 20 minuti reali
Primo passaggio: serve un progetto Google Cloud. Se non ne hai uno, lo crei dal Google Cloud Console in due clic, gratis. Il progetto è il contenitore amministrativo che fattura (eventuali) costi e gestisce permessi. Per una PMI, un progetto dedicato a "analytics-aziendanome" è la prassi.
Secondo passaggio: dentro il progetto, abilita l'API BigQuery (un toggle). Crea un dataset (un contenitore di tabelle) con il nome che vuoi, regione preferibilmente "EU" se sei italiano per non avere dati GA4 transatlantici (questione GDPR-friendly).
Terzo passaggio: in GA4, sezione Amministratore, vai su "Collegamenti BigQuery", clicca "Collega", scegli il progetto Cloud, scegli il dataset, scegli la frequenza (daily) e le proprietà da esportare. Conferma. Dal giorno successivo, vedrai tabelle nuove apparire in BigQuery con nome `events_YYYYMMDD`. È fatta. Sul setup base GA4 c'è un quadro più ampio in Setup GA4 da zero.
Quali sono i costi reali per una PMI
Per la stragrande maggioranza delle PMI italiane, il costo mensile di BigQuery export è zero o pochi centesimi. La free tier copre tutto, e i casi che superano i limiti sono identificabili a colpo d'occhio. Storage: 10 GB gratis, poi 0,02 dollari per GB/mese. Una PMI con 500.000 eventi al mese mette 600 MB di dati all'anno, sta dentro free tier praticamente sempre.
Query: 1 TB processato gratis al mese, poi 5 dollari per TB. Se scrivi query su tabella mensile (es. SELECT con WHERE su _TABLE_SUFFIX per limitare i giorni), processi pochi MB per query. Una dashboard Looker Studio che gira 50 volte al giorno su BigQuery, ben fatta, consuma meno di 100 GB di query/mese, dentro la free tier.
Il caso in cui i costi salgono davvero è quello di chi fa query "SELECT *" senza filtri su tabelle annuali. Una query del genere su un dataset da 50 GB processa 50 GB ogni volta, e se la lanci 30 volte processi 1,5 TB in un mese e paghi 2-3 euro. Cifre comunque ridicole rispetto al valore: si tratta di disciplina nello scrivere query, non di costo strutturale.
Le tre query basilari che servono subito
Prima query: estrazione di tutte le conversioni con i parametri di contesto. Selezioni dalla tabella eventi gli `event_name = 'generate_lead'` (o quello che è il tuo evento), insieme a `traffic_source`, `device.category`, `geo.country`, e tutti i parametri custom del tuo dataLayer. Output: un foglio dove ogni riga è una conversione con il suo profilo completo. Da lì puoi fare analisi di segmentazione che GA4 nativo non ti permette.
Seconda query: analisi session-level. GA4 traccia eventi, non sessioni esplicite. Per ricostruire sessioni con metriche custom (durata, pagine viste, conversioni per sessione), serve una query che raggruppa gli eventi per `user_pseudo_id` e `(select value.int_value from unnest(event_params) where key = 'ga_session_id')`. È SQL standard, ed è la base per analisi che con GA4 nativo sono impossibili.
Terza query: user journey. Per ogni utente, la sequenza ordinata degli eventi che ha fatto: dalla prima visita alla conversione finale. È il dato di partenza per attribuzione custom, per modelli di marketing mix, per qualunque analisi seria sul percorso del cliente. Senza BigQuery, questo dato non lo hai: vedi solo aggregati. Su questo si appoggia anche la scelta del modello di attribuzione GA4.
Casi d'uso concreti per una PMI
Il primo caso, quello da cui partono quasi tutti i clienti: report mensile con SQL custom. Quando le metriche di GA4 nativo non bastano, scrivi una query SQL che produce esattamente i numeri che ti servono, e li carichi in Looker Studio o esporti in CSV. È il modo in cui costruisci dashboard che parlano al business e non solo al marketing. Sul lato dashboard vedi Looker Studio per PMI.
Secondo caso, il più strategico: integrazione con CRM. Una volta che gli eventi sono in BigQuery e i dati CRM sono in una tabella adiacente (anche solo via Sheets bridge), puoi fare JOIN. Per ogni lead generato online, sai se è diventato cliente offline, in quanto tempo, con che valore. È il cerchio chiuso che il marketing serio inseguiva da vent'anni e che oggi è alla portata di tutti.
Terzo caso, futuribile ma vicino: AI sui dati propri. I tuoi dati grezzi in BigQuery sono il dataset perfetto da dare in pasto a modelli AI per analisi avanzate: clustering di utenti, predizione di churn, segmentazione automatica. Vertex AI di Google è integrato nativamente con BigQuery, e per una PMI seriamente orientata al data-driven, è un orizzonte di 12-18 mesi, non di 5 anni.
Errori tipici nei primi 30 giorni
Il primo errore: scrivere query inefficienti che divorano la free tier. Il classico è il `SELECT *` su tabella mensile per "guardare i dati": processa subito 5-10 GB. La regola d'oro è sempre filtrare con `WHERE _TABLE_SUFFIX BETWEEN...` (limita le tabelle giornaliere da scansionare) e selezionare solo le colonne che servono, mai `*`.
Il secondo errore: dimenticare i cambi di schema. Google aggiorna periodicamente lo schema delle tabelle GA4 in BigQuery, aggiungendo campi nuovi. Le query che davano per scontato lo schema vecchio rompono. La buona pratica è: documentare le query, leggere i changelog del schema GA4 BigQuery (Google li pubblica), e quando una query fallisce, controllare prima lo schema della tabella più recente.
Il terzo errore, sottile e frequente: mescolare dataset di property diverse senza rendersene conto. Se hai più siti, ogni property GA4 esporta in un dataset BigQuery diverso. JOIN tra dataset diversi sono possibili ma vanno scritti esplicitamente. Capita di vedere query che danno numeri strani perché stanno mescolando event count di property che non c'entrano nulla.
Quando NON serve davvero a una PMI
BigQuery export è potente, ma non è sempre necessario. Sotto le 100.000 sessioni/mese, GA4 nativo non campiona quasi mai e i report standard bastano. Sotto i 10 lead/mese, qualunque analisi statistica avanzata sui dati grezzi sarebbe rumore. Se non hai un team tecnico (interno o esterno) in grado di scrivere SQL, l'export resta una funzionalità latente che non porti a valore.
Vale la pena attivarlo, in ogni caso, anche per una PMI piccola che non ha bisogno immediato di SQL custom. È gratuito, parte da zero, e a un certo punto avrai bisogno di dati storici grezzi. GA4 conserva i dati raw nei suoi report standard per finestre limitate (di solito 14-26 mesi), mentre i dati in BigQuery sono tuoi, restano per sempre, e se domani vuoi fare analisi su 5 anni di storico, li hai. Attivare ora costa zero, attivare tra due anni significa aver perso due anni di storico.
A questo punto stai facendo data analytics con la stessa infrastruttura tecnica di un grande retailer, gratis. La parità tecnica con le grandi catene, su questo fronte, è raggiunta. Se vuoi che a configurare il setup BigQuery e a scrivere le prime query sia un consulente che sviluppa il sito e gestisce le campagne nella stessa persona, o se vuoi capire come integrare BigQuery con il resto del tuo stack di marketing, la strada più corta resta una telefonata. Il quadro completo è in Tracciamento e Analytics, e per il lato campagne c'è Strumenti Advertising.
Hai bisogno di un chiarimento?
Contattaci per ricevere indicazioni precise sul servizio piu adatto.
