domingo, 25 de abril de 2021

Como obter nomes de colunas no dataframe do pandas

Ao analisar os conjuntos de dados reais, que geralmente são muito grandes, podemos precisar obter os nomes das colunas para realizar algumas operações.

Vamos discutir como obter nomes de colunas no dataframe do Pandas.

Primeiro, vamos criar um dataframe simples com o arquivo nba.csv.

import pandas as pd 

# criando um dataframe a partir
# de um arquivo csv
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") 

# criando um novo dataframe com
# as 5 (padrão do método head) primeiras
# linhas do dataframe data
data_top = data.head() 

print(data_top)

Saída:

            Name            Team  Number Position   Age Height  Weight            College     Salary
0  Avery Bradley  Boston Celtics     0.0       PG  25.0    6-2   180.0              Texas  7730337.0
1    Jae Crowder  Boston Celtics    99.0       SF  25.0    6-6   235.0          Marquette  6796117.0
2   John Holland  Boston Celtics    30.0       SG  27.0    6-5   205.0  Boston University        NaN
3    R.J. Hunter  Boston Celtics    28.0       SG  22.0    6-5   185.0      Georgia State  1148640.0
4  Jonas Jerebko  Boston Celtics     8.0       PF  29.0   6-10   231.0                NaN  5000000.0

Agora vamos tentar obter o nome das colunas do conjunto de dados acima.

Método #1: simplesmente iterar nas colunas

import pandas as pd 

# criando um dataframe a partir
# de um arquivo csv
data = pd.read_csv("nba.csv") 

# iterando nas colunas
for col in data.columns:
    print(col)

Saída:

Name
Team
Number
Position
Age
Height
Weight
College
Salary

Método #2: Usando colunas com objeto dataframe

import pandas as pd 

# criando um dataframe a partir
# de um arquivo csv
data = pd.read_csv("nba.csv") 

# cria uma lista com os nomes das colunas de um dataframe
print(list(data.columns))

Resultado:

['Name', 'Team', 'Number', 'Position', 'Age', 'Height', 'Weight', 'College', 'Salary']

Método #3: o atributo column.values retorna uma matriz de índice.

import pandas as pd 

# criando um dataframe a partir
# de um arquivo csv
data = pd.read_csv("nba.csv") 

# cria uma lista com os nomes das colunas de um dataframe
print(data.columns.values)

Saída:

['Name', 'Team', 'Number', 'Position', 'Age', 'Height', 'Weight', 'College', 'Salary']

Método #4: Usando o método tolist() com valores com a lista de colunas fornecida.

import pandas as pd 

# criando um dataframe a partir
# de um arquivo csv
data = pd.read_csv("nba.csv") 

# cria uma lista com os nomes das colunas de um dataframe
print(list(data.columns.values.tolist()))

Saída:

['Name', 'Team', 'Number', 'Position', 'Age', 'Height', 'Weight', 'College', 'Salary']

Artigo escrito por Shivam_k e traduzido por Acervolima de How to get column names in Pandas dataframe.

Licença

0 comentários:

Postar um comentário