Analisar dados do mundo real é difícil porque precisamos levar várias coisas em consideração. Além de obter dados úteis de grandes conjuntos de dados, manter os dados no formato necessário também é muito importante.
Pode-se encontrar uma situação em que precisamos colocar cada letra em maiúscula em qualquer coluna específica em determinado dataframe. Vamos ver como podemos aplicar letras maiúsculas a uma coluna no dataframe do Pandas.
Vamos criar um dataframe usando o arquivo nba.csv.
# importando o pacote pandas import pandas as pd # criando um dataframe a partir de um arquivo csv data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # criando um novo dataframe com as 10 # primeiras linhas do dataframe data data_top = data.head(10) print(data_top)
Saída:
Name Team Number Position Age Height Weight College Salary 0 Avery Bradley Boston Celtics 0.0 PG 25.0 6-2 180.0 Texas 7730337.0 1 Jae Crowder Boston Celtics 99.0 SF 25.0 6-6 235.0 Marquette 6796117.0 2 John Holland Boston Celtics 30.0 SG 27.0 6-5 205.0 Boston University NaN 3 R.J. Hunter Boston Celtics 28.0 SG 22.0 6-5 185.0 Georgia State 1148640.0 4 Jonas Jerebko Boston Celtics 8.0 PF 29.0 6-10 231.0 NaN 5000000.0 5 Amir Johnson Boston Celtics 90.0 PF 29.0 6-9 240.0 NaN 12000000.0 6 Jordan Mickey Boston Celtics 55.0 PF 21.0 6-8 235.0 LSU 1170960.0 7 Kelly Olynyk Boston Celtics 41.0 C 25.0 7-0 238.0 Gonzaga 2165160.0 8 Terry Rozier Boston Celtics 12.0 PG 22.0 6-2 190.0 Louisville 1824360.0 9 Marcus Smart Boston Celtics 36.0 PG 22.0 6-4 220.0 Oklahoma State 3431040.0
Existem certos métodos que podemos alterar/modificar a caixa das letras das colunas no dataframe do pandas. Vamos ver como podemos aplicar letras maiúsculas a uma coluna no dataframe do Pandas usando o método Series.upper()
.
import pandas as pd data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") data['Name'] = data['Name'].str.upper() print(data.head())
Saída:
Name Team Number Position Age Height Weight College Salary 0 AVERY BRADLEY Boston Celtics 0.0 PG 25.0 6-2 180.0 Texas 7730337.0 1 JAE CROWDER Boston Celtics 99.0 SF 25.0 6-6 235.0 Marquette 6796117.0 2 JOHN HOLLAND Boston Celtics 30.0 SG 27.0 6-5 205.0 Boston University NaN 3 R.J. HUNTER Boston Celtics 28.0 SG 22.0 6-5 185.0 Georgia State 1148640.0 4 JONAS JEREBKO Boston Celtics 8.0 PF 29.0 6-10 231.0 NaN 5000000.0
Artigo escrito por Shivam_k e traduzido por Acervolima de Apply uppercase to a column in Pandas dataframe.
0 comentários:
Postar um comentário