Una EC2 per i dati di Eurostat

Le istituzioni come Istat ed Eurostat fanno un gran lavoro nel rilevare e catalogare i dati delle nazioni. Spaziano su moltissimi argomenti e i dati raccolti sono molto utili: Oltre a raccogliere e a catalogare i dati, queste organizzazioni si occupano anche di divulgazione. All’interno dei loro portali possiamo trovare blog e newsletter che permettono … Leggi tutto

Risparmiamo spazio Apache Iceberg

In questo articolo andremo a vedere in che modo tabelle formattate con il metodo Apache Iceberg siano utili nella vita di ufficio. Dati: Vantaggi: Creazione della tabella Come prima cosa dobbiamo creare la tabella in formato Iceberg che ospiterà i nostri dati. Utilizziamo questa query in Athena. Preparazione dei dati Per comodità utilizzo gli stessi … Leggi tutto

Categorie AWS

Tutto in ordine con Step Function

Quando si vuole gestire i flussi di dati di un’azienda si devono fare molte cose: bisogna occuparsi dei dati in entrata, pulirli, catalogarli, elaborarli, magari incrociarli con dati provenienti da altre fonti, prepararli per lo strumento di visualizzazione e finalmente creare i grafici che tanto piacciono ai piani alti. La struttura per l’elaborazione deve essere … Leggi tutto

Categorie AWS

Un SerD molto preciso

Come forse qualcuno di voi sa, per diversi anni ho lavorato nel mondo del marketing. L’idea di analizzare enormi quantità di dati sul comportamento online delle persone mi affascinava. Mi faceva sentire un pò Elliot in Mr. Robot, anche se con skills decisamente diverse (e forse con un pò più di sanità mentale). Purtroppo però, … Leggi tutto

Categorie AWS

AWS Bike Sharing

Immaginiamo di lavorare per un’ azienda di bike sharing. Il nostro servizio si basa sulla possibilità di noleggiare una delle nostre biciclette sparse per la città in specifiche stazioni. Le persone potranno avere sempre una bicicletta in buono stato (in caso di guasti le andiamo a riparare sul posto) e non devono temere i furti … Leggi tutto

Analisi dei Nuovi Utenti con BigQuery per Campagne Marketing

Uno degli obiettivi che ci possiamo prefissare per una nuova campagna marketing, sia essa online od offline, può essere l’attrarre nuovi utenti nel nostro sito web o ottenere nuovi clienti per la nostra azienda. In questo articolo vi mostro come creare un grafico che tenga traccia dei nuovi utenti che visitano il nostro sito web. … Leggi tutto

EDA in Python – Parte 2

Analisi Univariata delle variabili In questa sezione, andremo ad esplorare, una ad una, ognuna delle variabili presenti nei nostri dataset. Può sembrare un lavoro lungo e noioso ( e forse lo è 🤓) ma è di cruciale importanza. Tramite quest’attività andremo più in intimità con i nostri dati, scoprendo cose che altrimenti avremmo ignorato. Dati_prezzi … Leggi tutto

EDA in Python – Parte 1

L’EDA (Exploratory Data Analysis) è l’ analisi iniziale di un dataset. Sono i primi passi fatti per prendere confidenza con i nuovi dati che abbiamo a disposizione. Tramite semplici grafici e qualche riga di codice, ci addentreremo in una terra al momento sconosciuta e da bravi esploratori ne delineeremo i confini e i principali punti … Leggi tutto

BigQuery: creazione di un’audience per remarketing specifica

Il senso del remarketing è quello di mostrare un messaggio ben preciso ad un pubblico ben targettizzato. In Google ADS le campagne smart display funzionano molto bene perché si ricordano quali prodotti ha visualizzato un utente e glieli ripropone quando naviga in altri siti.Ma se volessimo combinare più variabili per la creazione del nostro pubblico personalizzato? … Leggi tutto

BigQuery e Python: numero di utenti giornalieri

In questo articolo vedremo come utilizzare semplici comandi SQL e Python per ottenere un grafico con l’andamento del traffico giornaliero di un sito web. Vantaggi: Dati: Cali di Traffico in BigQuery Come prima cosa apriamo la nostra console SQL di BigQuery. Incolliamo quindi il codice SQL che ci serve: Iniziamo a capire il codice partendo … Leggi tutto