- analiticas
- Posts
- 3 modi per rinominare le colonne di un dataframe con pandas
3 modi per rinominare le colonne di un dataframe con pandas
Come cambiare i nomi delle colonne nel tuo set di dati? Python ci dà una mano.
Lavorare con i dati richiede a volte di modificare i nomi delle colonne per renderli più chiari o adatti alle nostre esigenze. In questa micro-lezione vediamo 3 modi diversi per farlo, usando Python e pandas.
Il programma della micro-lezione
Le librerie e il dataframe di partenza
Per questa micro-lezione è necessario importare la sola libreria pandas (anche se importare sia pandas che numpy è un’ottima abitudine).
import pandas as pdImmaginiamo di avere un dataframe come questo:
nome | età | ruolo |
|---|---|---|
Mario | 33 | commerciale |
Carlo | 27 | analista |
Anna | 42 | direttore |
Se vuoi ricrearlo per seguire la micro-lezione passo passo, puoi eseguire il codice seguente:
df = pd.DataFrame({
'nome': ['Mario', 'Carlo', 'Anna'],
'età': [33, 27, 42],
'ruolo': ['commerciale', 'analista', 'direttore']
})Metodo 1: cambiamo il nome di una colonna con rename()
Supponiamo di voler cambiare il nome della colonna “ruolo” in “professione”. Ecco come farlo:
df.rename(columns={'ruolo': 'professione'},
inplace=True)Nota bene:
Il parametro inplace=True fa sì che il metodo rename() venga applicato direttamente al dataframe sul quale stiamo lavorando.
Dopo questa operazione, il nostro dataframe apparirà così:
nome | età | professione |
|---|---|---|
Mario | 33 | commerciale |
Carlo | 27 | analista |
Anna | 42 | direttore |
Metodo 2: cambiamo il nome di più colonne con rename()
Se vogliamo cambiare il nome di due delle tre colonne del nostro dataframe, possiamo usare un dizionario all’interno del metodo rename(). Ecco come fare:
df.rename(columns = {'nome':'impiegato','età':'anni'},
inplace=True)Ed ecco il risultato:
impiegato | anni | professione |
|---|---|---|
Mario | 33 | commerciale |
Carlo | 27 | analista |
Anna | 42 | direttore |
Nota bene
La colonna non inclusa nel dizionario non ha subito alcuna modifica
Metodo 3: usiamo l’assegnazione diretta
Un altro modo per rinominare le colonne è l'assegnazione diretta. Questo metodo sostituisce tutti i nomi delle colonne in un colpo solo:
df.columns = ['nome', 'età', 'ruolo']Ecco qui come apparirà il nostro dataframe dopo aver usato l’assegnazione diretta:
nome | età | ruolo |
|---|---|---|
Mario | 33 | commerciale |
Carlo | 27 | analista |
Anna | 42 | direttore |
Considerazioni importanti
Il metodo
rename()è utile quando vuoi cambiare solo il nome di alcune colonne.L'assegnazione diretta è più veloce ma richiede di specificare tutti i nomi delle colonne. È l’ideale per dataframe con poche colonne.
Con questi metodi potrai facilmente personalizzare i nomi delle colonne del tuo dataframe al fine di renderli più comprensibili per te e per i tuoi colleghi.
Alla prossima micro-lezione 👋