domingo, 25 de abril de 2021

Alterar letras minusculas para maiúsculas numa coluna no dataframe do pandas

Analisar dados do mundo real é difícil porque precisamos levar várias coisas em consideração. Além de obter dados úteis de grandes conjuntos de dados, manter os dados no formato necessário também é muito importante.

Pode-se encontrar uma situação em que precisamos colocar cada letra em maiúscula em qualquer coluna específica em determinado dataframe. Vamos ver como podemos aplicar letras maiúsculas a uma coluna no dataframe do Pandas.

Vamos criar um dataframe usando o arquivo nba.csv.

# importando o pacote pandas
import pandas as pd

# criando um dataframe a partir de um arquivo csv
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") 

# criando um novo dataframe com as 10
# primeiras linhas do dataframe data
data_top = data.head(10)

print(data_top)

Saída:

            Name            Team  Number Position   Age Height  Weight            College      Salary
0  Avery Bradley  Boston Celtics     0.0       PG  25.0    6-2   180.0              Texas   7730337.0
1    Jae Crowder  Boston Celtics    99.0       SF  25.0    6-6   235.0          Marquette   6796117.0
2   John Holland  Boston Celtics    30.0       SG  27.0    6-5   205.0  Boston University         NaN
3    R.J. Hunter  Boston Celtics    28.0       SG  22.0    6-5   185.0      Georgia State   1148640.0
4  Jonas Jerebko  Boston Celtics     8.0       PF  29.0   6-10   231.0                NaN   5000000.0
5   Amir Johnson  Boston Celtics    90.0       PF  29.0    6-9   240.0                NaN  12000000.0
6  Jordan Mickey  Boston Celtics    55.0       PF  21.0    6-8   235.0                LSU   1170960.0
7   Kelly Olynyk  Boston Celtics    41.0        C  25.0    7-0   238.0            Gonzaga   2165160.0
8   Terry Rozier  Boston Celtics    12.0       PG  22.0    6-2   190.0         Louisville   1824360.0
9   Marcus Smart  Boston Celtics    36.0       PG  22.0    6-4   220.0     Oklahoma State   3431040.0

Existem certos métodos que podemos alterar/modificar a caixa das letras das colunas no dataframe do pandas. Vamos ver como podemos aplicar letras maiúsculas a uma coluna no dataframe do Pandas usando o método Series.upper().

import pandas as pd 

data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") 

data['Name'] = data['Name'].str.upper()

print(data.head())

Saída:

            Name            Team  Number Position   Age Height  Weight            College     Salary
0  AVERY BRADLEY  Boston Celtics     0.0       PG  25.0    6-2   180.0              Texas  7730337.0
1    JAE CROWDER  Boston Celtics    99.0       SF  25.0    6-6   235.0          Marquette  6796117.0
2   JOHN HOLLAND  Boston Celtics    30.0       SG  27.0    6-5   205.0  Boston University        NaN
3    R.J. HUNTER  Boston Celtics    28.0       SG  22.0    6-5   185.0      Georgia State  1148640.0
4  JONAS JEREBKO  Boston Celtics     8.0       PF  29.0   6-10   231.0                NaN  5000000.0

Artigo escrito por Shivam_k e traduzido por Acervolima de Apply uppercase to a column in Pandas dataframe.

Licença

0 comentários:

Postar um comentário