Kuinka muuttaa sarakkeiden nimiä ja riviindeksejä pandoissa?
Yksi yleisimmistä toiminnoista, jotka voidaan tehdä tietojen puhdistamisen tai tutkivan data-analyysin aikana tietojenkäsittelyssä, on sarakkeiden tai rivien nimien manipulointi / korjaaminen.
Tässä viestissä näemme
- Kuinka nimetä pandojen tietokehyksen sarakkeet uudelleen?
- Kuinka muuttaa pandojen tietokehyksen rivien nimiä tai riviindeksejä?
Ladatkaamme ensin pandat.
# import pandas>import pandas as pd
Käyttäkäämme gapminder-tietoja puusepän ohjelmistosivustolta.
# link to gapminder datadata_url = "http://bit.ly/2cLzoxH"# read data from url as pandas dataframe>gapminder = pd.read_csv(data_url)
Tarkistetaan datakehyksen sarakkeiden nimet, tietojen ensimmäiset kolme riviä päätoiminnon avulla. >
Voimme käyttää saraketoimintoa myös sarakkeiden nimien saamiseen.
>gapminder.columnsIndex(, dtype="object")
Kuinka nimetä sarakkeet uudelleen pandoissa?
Yksi voi muuttaa pandojen sarakkeiden nimiä datakehys vähintään kahdella tavalla. Yksi tapa nimetä Pandaksen sarakkeet on käyttää Pfas-sarakkeita df.columns ja määrittää uudet nimet suoraan.
Jos sinulla on esimerkiksi sarakkeiden nimiä luettelossa, voit määrittää luettelon sarakkeiden nimille. suoraan.
Tämä määrittää luettelossa olevat nimet sarakkeiden nimiksi datakehykselle ”gapminder”. Voimme tarkistaa datakehyksen ja nähdä, että jos sillä on uusia sarakkeiden nimiä, käytetään head () -funktiota.
>gapminder.head(3) country year population continent life_exp gdp_per_cap0 Afghanistan 1952 8425333 Asia 28.801 779.4453141 Afghanistan 1957 9240934 Asia 30.332 820.8530302 Afghanistan 1962 10267083 Asia 31.997 853.100710
Tämän sarakkeiden nimien muuttamisen ongelmana on, että jokaisen tietokehyksen sarakkeen nimi on muutettava. Tämä lähestymistapa ei toimi, jos haluamme muuttaa, vaihda vain yhden nimen nimi sarake.
Pandojen uudelleennimeämistoiminto nimeksi Sarakkeiden uudelleennimeäminen
Toinen tapa muuttaa sarakkeiden nimiä pandoissa on käyttää nimeä uudelleen -toimintoa. Nimeä uudelleen -sarakkeen nimen muuttaminen on paljon parempi tapa kuin ennen. Voi chan tietyn sarakkeen nimet helposti. Kaikkia sarakkeiden nimiä ei tarvitse muuttaa.
Jos haluat muuttaa sarakkeiden nimiä Panda-nimien uudelleennimeämistoiminnon avulla, sinun on määritettävä mapper, sanakirja, jonka avaimina on vanha nimi ja arvoina uusi nimi. Tässä on esimerkki monien sarakkeiden nimien muuttamisesta sanakirjan avulla. Käytämme myös inplace = True vaihtaaksesi sarakkeiden nimiä paikallaan.
Yksi suurimmista eduista nimetä uudelleen -toimintoa on, että voimme nimetä uudelleen muuttaaksemme niin monta sarakkeiden nimeä kuin haluamme.
Vaihdetaan yhden sarakkeen nimi.
Pandojen uudelleennimeämistoiminto voi myös käyttää funktiota syötteenä sanakirjan sijaan. Voimme esimerkiksi kirjoittaa lambda-funktion ottamaan nykyiset sarakkeiden nimet ja ottamaan huomioon vain kolme ensimmäistä merkkiä uusille sarakkeiden nimille.
Kuinka Pandojen nimiä / hakemistoja vaihdetaan ja rivimerkkejä?
Toinen hyvä asia pandojen uudelleennimeämistoiminnossa on, että voimme käyttää sitä myös rivien hakemistojen tai rivien nimien muuttamiseen.
Meidän on vain käytettävä hakemiston argumenttia ja määritettävä, haluamme muuta hakemistoa ei sarakkeita.
Esimerkiksi, jos haluat muuttaa rivien nimet 0 ja 1 arvoksi nolla ja yksi, aukkomittarin tietokehyksessä rakennamme sanakirjan, jossa vanhat rivihakemistojen nimet ovat avaimet ja uusi rivi. indeksoi arvoina.
Voimme nähdä, että vain kahdella ensimmäisellä rivillä on uudet nimet, kuten tarkoitimme.
Kuinka muuttaa sarakkeiden nimiä ja riviindeksejä samanaikaisesti pandoissa?
Pandaksen uudelleennimeystoiminnolla voidaan myös muuttaa sekä sarakkeiden nimiä että rivien nimiä samanaikaisesti käyttämällä sarakkeiden ja hakemistojen argumentteja nimetäksesi funktion vastaavilla mapper-sanakirjoilla.
Muutetaan sarakkeen nimi ”lifeExp” kohtaan ”life_exp” ja myös riviindeksit ”0 & 1” – ”nolla ja yksi”.
Oletko uusi Pandas-käyttäjä? Ja aloitatko Pandan kanssa äskettäin? Tutustu uusiin tavuinen Pandas 101 -opetusohjelmaamme.