Hoe kolomnamen en rij-indexen in panda’s wijzigen?
Een van de meest voorkomende bewerkingen die u kunt uitvoeren tijdens het opschonen van de gegevens of het uitvoeren van verkennende gegevensanalyse bij het doen van datawetenschap, is het manipuleren / corrigeren van de kolom- of rijnamen.
In dit bericht zullen we zien
- Hoe de kolommen van panda’s dataframe hernoemen?
- Hoe rijnamen of rij-indexen van een panda’s dataframe wijzigen?
Laten we eerst panda’s laden.
# import pandas>import pandas as pd
Laten we gapminder-gegevens van de software-timmerwerkwebsite gebruiken.
# link to gapminder datadata_url = "http://bit.ly/2cLzoxH"# read data from url as pandas dataframe>gapminder = pd.read_csv(data_url)
laten we de namen van de kolommen van het dataframe, de eerste drie rijen van de gegevens, controleren met de head-functie.
>print(gapminder.head(3)) country year pop continent lifeExp gdpPercap0 Afghanistan 1952 8425333 Asia 28.801 779.4453141 Afghanistan 1957 9240934 Asia 30.332 820.8530302 Afghanistan 1962 10267083 Asia 31.997 853.100710
We kunnen ook de kolommenfunctie gebruiken om de kolomnamen op te halen.
>gapminder.columnsIndex(, dtype="object")
Hoe hernoem ik kolommen in Panda’s?
Een kan de kolomnamen van een panda’s veranderen dataframe op minstens twee manieren. Een manier om kolommen in Panda’s te hernoemen, is door df.columns van Panda’s te gebruiken en direct nieuwe namen toe te wijzen.
Als u bijvoorbeeld de namen van kolommen in een lijst heeft, kunt u de lijst aan kolomnamen toewijzen direct.
Om de kolommen van gapminder dataframe te wijzigen, kunnen we de lijst met nieuwe kolomnamen toewijzen aan gapminder.columns als
>gapminder.columns =
Hiermee worden de namen in de lijst toegewezen als kolomnamen voor het dataframe “gapminder”. We kunnen het dataframe controleren om te zien of het nieuwe kolomnamen heeft met de functie head ().
>gapminder.head(3) country year population continent life_exp gdp_per_cap0 Afghanistan 1952 8425333 Asia 28.801 779.4453141 Afghanistan 1957 9240934 Asia 30.332 820.8530302 Afghanistan 1962 10267083 Asia 31.997 853.100710
Een probleem met deze benadering om kolomnamen te wijzigen is dat men de namen van alle kolommen in het dataframe moet veranderen. Deze benadering zou niet werken, als we willen veranderen, verander dan gewoon de naam van één kolom.
Panda’s hernoemen functie om Kolommen te hernoemen
Een andere manier om kolomnamen in panda’s te veranderen is om de hernoemen functie te gebruiken. Het gebruik van hernoemen om kolomnamen te veranderen is een veel betere manier dan voorheen. Men kan chan gemakkelijk namen van een specifieke kolom. En niet alle kolomnamen hoeven te worden gewijzigd.
Om kolomnamen te wijzigen met de functie hernoemen in Panda’s, moet men een mapper specificeren, een woordenboek met oude naam als sleutels en nieuwe naam als waarden. Hier is een voorbeeld om veel kolomnamen te wijzigen met behulp van een woordenboek. We zullen ook inplace = True gebruiken om kolomnamen op hun plaats te veranderen.
Een van de grootste voordelen van het gebruik van de hernoemingsfunctie is dat we hernoemen kunnen gebruiken om zoveel kolomnamen te wijzigen als we willen.
Laten we de naam van een enkele kolom wijzigen.
De functie voor het hernoemen van panda’s kan ook een functie als invoer aannemen in plaats van een woordenboek. We kunnen bijvoorbeeld een lambda-functie schrijven om de huidige kolomnamen te nemen en alleen de eerste drie tekens voor de nieuwe kolomnamen in aanmerking te nemen.
Hoe verander je rijnamen / indexen in Panda’s?
Een ander goed ding over de hernoemingsfunctie van panda’s is dat we het ook kunnen gebruiken om rij-indexen of rijnamen te wijzigen.
We hoeven alleen maar het index-argument te gebruiken en te specificeren, we willen wijzig index niet kolommen.
Om bijvoorbeeld de rijnamen 0 en 1 te veranderen in ‘nul’ en ‘één’ in ons gapminder-dataframe, zullen we een woordenboek samenstellen met oude rij-indexnamen als sleutels en een nieuwe rij index als waarden.
We kunnen zien dat slechts de eerste twee rijen nieuwe namen hebben zoals we hadden bedoeld.
Hoe kolomnamen en rij-indexen gelijktijdig in Panda’s te wijzigen?
Met de hernoemingsfunctie van panda’s kan men ook zowel kolomnamen als rijnamen tegelijkertijd wijzigen door zowel kolom- als indexargumenten te gebruiken om de functie te hernoemen met bijbehorende mapper-woordenboeken.
Laten we de kolomnaam “lifeExp” wijzigen naar “life_exp” en ook rij-indices “0 & 1” naar “nul en één”.
Bent u nieuw bij Panda’s? En onlangs begonnen met Panda’s? Bekijk onze nieuwe Byte Sized Panda’s 101 tutorials.