Capitolo 21: Importazione e pulizia dei dati
Microsoft Excel – Importazione dei Dati
- Importazione da un File: Excel consente di importare dati da una vasta gamma di fonti, sia file locali che servizi online. La funzione ‘Ottieni e trasforma’ (Power Query) facilita l’importazione e la trasformazione dei dati.
- Formati di File Supportati:
- Formati di file di fogli di calcolo: .xlsx, .xls, .ods
- Formati di file di database: .mdb, .accdb, .dbf, .sql
- Formati di file di testo: .csv, .txt, .prn
- File HTML: .html, .htm
- File XML: .xml
- Immagini: .jpg, .png, .bmp, .gif
- Differenza tra Importare e Aprire: Aprire un file significa caricarlo direttamente come foglio Excel. Importare consente invece di prelevare dati da un’altra fonte e combinarli, trasformarli o aggiornarli dinamicamente tramite Power Query.
- Importazione di un File di Testo: Percorso: ‘Dati’ > ‘Da file di testo/CSV’ > seleziona il file > scegli delimitatore > Carica o Trasforma. Opzioni avanzate: scelta della codifica, tipo di dati per ogni colonna, filtri preliminari.
- Copiare e Incollare Dati: È possibile copiare dati da fonti esterne (browser, PDF, Word, ecc.) e incollarli in Excel.
Microsoft Excel – Pulizia dei Dati
- Rimozione di Righe Duplicati: Percorso: ‘Dati’ > ‘Rimuovi duplicati’. Seleziona le colonne da analizzare per eliminare righe duplicate.
- Identificazione dei Duplicati: Usa la formattazione condizionale: ‘Home’ > ‘Formattazione condizionale’ > ‘Regole evidenziazione celle’ > ‘Valori duplicati’.
- Divisione del Testo: Utilizza ‘Testo in colonne’: ‘Dati’ > ‘Testo in colonne’ > scegli delimitatore (es. virgola, spazio).
- Utilizzo di Riempimento Automatico (Flash Fill): Scrivi un pattern nella colonna accanto, poi premi CTRL + E oppure ‘Dati’ > ‘Riempimento lampo’.
- Modifica del Maiuscolo/Minuscolo: Funzioni: =MAIUSC (UPPER), =MINUSC (LOWER), =MAIUSC.INIZ (PROPER).
- Rimozione di Spazi Extra: Funzione: =ANNULLA.SPAZI (TRIM).
- Rimozione di Caratteri Strani: Funzione: =PULISCI (CLEAN).
- Conversione e Classificazione Valori: Conversione: =VALORE (VALUE). Classificazione: usa =SE, =CERCA.VERT o Power Query.
- Unione e Riordino Colonne: Unione: =A2&B2 o =TESTO.UNISCI(” “; VERO; A2; B2). Riordino: seleziona colonna, usa ‘Taglia’ (CTRL+X) e ‘Inserisci’.
- Randomizzazione e Conversione Verticale/Orizzontale: Randomizza: inserisci =CASUALE() e ordina i dati. Trasposizione: copia > incolla speciale > ‘Trasponi’.
- Estrazione e Confronto di Testo: Estrai nome file da URL: =STRINGA.ESTRAI(A1; TROVA(“/”;A1;TROVA(“/”;A1)+1)+1; LUNGHEZZA(A1)). Verifica presenza in elenco: =CONTA.SE(Intervallo; Valore)>0.
- Compilazione dei Vuoti in un Report: Usa Power Query o riempi celle vuote con valore della cella sopra.
- Controllo Ortografico e Sostituzione Testo: Ortografia: ‘Revisione’ > ‘Controllo ortografia’. Trova/Sostituisci: CTRL+T per ‘Trova’, CTRL+S per ‘Sostituisci’.
- Aggiunta Testo e Correzione del Segno Negativo: Aggiunta testo: =”Fattura: “&A2. Correzione negativo a fine stringa: =-VALORE(SOSTITUISCI(A1;”-“;””)).
- Checklist per la Pulizia Dati: Rimuovere duplicati, controllare dati nulli, uniformare il formato del testo, correggere errori ortografici, standardizzare valori e codifiche, validare risultati con formule.
Microsoft Excel – Esportazione dei Dati
- Esportazione in un File di Testo: Excel consente l’esportazione dei dati in formati di testo semplici. Percorso: ‘File’ > ‘Salva con nome’ > scegli il formato dal menu a discesa ‘Tipo file’.
- File CSV: Valori separati da virgole. Estensione: .csv. Utilizzo: compatibile con molti database, strumenti di importazione e sistemi online.
- File TXT: File di testo con dati separati da tabulazioni o spazi. Estensione: .txt.
- File PRN: Larghezza fissa per colonna. Estensione: .prn.
- Esportazione in Altri Formati: PDF, HTML, XML, XLSX/XLS, ODS.