Ao analisar os conjuntos de dados reais, que geralmente são muito grandes, podemos precisar obter os nomes das colunas para realizar algumas operações.
Vamos discutir como obter nomes de colunas no dataframe do Pandas.
Primeiro, vamos criar um dataframe simples com o arquivo nba.csv.
import pandas as pd # criando um dataframe a partir # de um arquivo csv data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # criando um novo dataframe com # as 5 (padrão do método head) primeiras # linhas do dataframe data data_top = data.head() print(data_top)
Saída:
Name Team Number Position Age Height Weight College Salary 0 Avery Bradley Boston Celtics 0.0 PG 25.0 6-2 180.0 Texas 7730337.0 1 Jae Crowder Boston Celtics 99.0 SF 25.0 6-6 235.0 Marquette 6796117.0 2 John Holland Boston Celtics 30.0 SG 27.0 6-5 205.0 Boston University NaN 3 R.J. Hunter Boston Celtics 28.0 SG 22.0 6-5 185.0 Georgia State 1148640.0 4 Jonas Jerebko Boston Celtics 8.0 PF 29.0 6-10 231.0 NaN 5000000.0
Agora vamos tentar obter o nome das colunas do conjunto de dados acima.
Método #1: simplesmente iterar nas colunas
import pandas as pd # criando um dataframe a partir # de um arquivo csv data = pd.read_csv("nba.csv") # iterando nas colunas for col in data.columns: print(col)
Saída:
Name Team Number Position Age Height Weight College Salary
Método #2: Usando colunas com objeto dataframe
import pandas as pd # criando um dataframe a partir # de um arquivo csv data = pd.read_csv("nba.csv") # cria uma lista com os nomes das colunas de um dataframe print(list(data.columns))
Resultado:
['Name', 'Team', 'Number', 'Position', 'Age', 'Height', 'Weight', 'College', 'Salary']
Método #3: o atributo column.values
retorna uma matriz de índice.
import pandas as pd # criando um dataframe a partir # de um arquivo csv data = pd.read_csv("nba.csv") # cria uma lista com os nomes das colunas de um dataframe print(data.columns.values)
Saída:
['Name', 'Team', 'Number', 'Position', 'Age', 'Height', 'Weight', 'College', 'Salary']
Método #4: Usando o método tolist()
com valores com a lista de colunas fornecida.
import pandas as pd # criando um dataframe a partir # de um arquivo csv data = pd.read_csv("nba.csv") # cria uma lista com os nomes das colunas de um dataframe print(list(data.columns.values.tolist()))
Saída:
['Name', 'Team', 'Number', 'Position', 'Age', 'Height', 'Weight', 'College', 'Salary']
Artigo escrito por Shivam_k e traduzido por Acervolima de How to get column names in Pandas dataframe.
0 comentários:
Postar um comentário