Quando trabalhamos com dataframe é muito comum a renomeação das colunas. Renomear as coluna é importante, principalmente com idiomas que usam caracteres especiais, para que os nomes das colunas possam ser usados como nomes de atributos. Com isso em mente os nomes não podem começar com números e devem ser alfanuméricos com letras maiúsculas ou minúsculas, o underline também é um caractere válido. Uma boa escolha de nove descreve o conteúdo da coluna e não entra em conflito com os atributos, já existentes, dos dataframe e séries.
Nesse post vamos aprender a renomear os nomes das colunas dos dataframe e séries do Pandas. Com a renomeação dos nomes procuramos deixar o código mais organizado e de fácil compreensão. Uma escolha errada de nome para uma coluna pode dificultar o seu acesso.
Como fazer...
Nesse exemplo vamos renomear os nomes das colunas do dataframe com o método rename()
. O método rename()
aceita um dicionário com os nomes velhos e novos da coluna.
>>> import pandas as pd >>> filmes = pd.read_csv('filmes.csv', encoding='latin-1') >>> n_nomes = { ... 'Codigo da obra':'codigo_obra', ... 'Titulo Original':'titulo_original', ... 'Titulo no Brasil':'titulo_brasil', ... 'Ano de producão':'ano_producao', ... 'Diretor':'diretor', ... 'Razão Social do Requerente':'razao_social_requerente', ... 'CNPJ Requerente':'cnpj_requerente', ... 'Data de exibicão':'data_exibicao'} >>> filmes.rename(columns=n_nomes).head() codigo_obra titulo_original ... cnpj_requerente data_exibicao 0 15639 PREÇO DA PAZ O ... 00.568.159/0001-07 06/jul/12 1 7603 CARTOMANTEA ... 03.599.148/0001-82 13/jul/04 2 26453 BLACK & WHITE VOL. 9 ... 02.341.697/0001-90 26/09/2007 3 17284 THE GURU ... 27.654.722/0001-16 16/12/2002 4 4806 QUIET AMERICAN ... 00.979.601/0001-98 15/jan/03 [5 rows x 8 columns]
Como funciona...
Com o método rename()
podemos renomear os nomes das colunas. Os novos nomes das colunas são passados para o parâmetro colunms
como um dicionário com os nomes antigos e os novos.
0 comentários:
Postar um comentário