quarta-feira, 28 de abril de 2021

Como selecionar várias colunas em um dataframe do pandas

Vamos discutir todas as maneiras diferentes de selecionar várias colunas em um DataFrame do pandas.

Método #1: Método Básico

Dado um dicionário que contém a entidade Employee como chaves e uma lista dessas entidades como valores.

# importando a biblioteca pandas
import pandas as pd

# Define a dictionary containing employee data
data = {
	'Name': ['Jai', 'Princi', 'Gaurav', 'Anuj'],
    'Age': [27, 24, 22, 32],
    'Address': ['Delhi', 'Kanpur', 'Allahabad', 'Kannauj'],
    'Qualification': ['Msc', 'MA', 'MCA', 'Phd']
}

# Criando um dataframe a partir de um dicionário
df = pd.DataFrame(data)

# selecionando duas colunas
print(df[['Name', 'Qualification']])

Saída:

     Name Qualification
0     Jai           Msc
1  Princi            MA
2  Gaurav           MCA
3    Anuj           Phd

Selecione a segunda à quarta coluna.

# importando a biblioteca pandas
import pandas as pd

# Define a dictionary containing employee data
data = {
	'Name': ['Jai', 'Princi', 'Gaurav', 'Anuj'],
    'Age': [27, 24, 22, 32],
    'Address': ['Delhi', 'Kanpur', 'Allahabad', 'Kannauj'],
    'Qualification': ['Msc', 'MA', 'MCA', 'Phd']
}

# Criando um dataframe a partir de um dicionário
df = pd.DataFrame(data)

# selecionando da segunda a quarta coluna
print(df[df.columns[1:4]])

Saída:

   Age    Address Qualification
0   27      Delhi           Msc
1   24     Kanpur            MA
2   22  Allahabad           MCA
3   32    Kannauj           Phd

Método #2: Usando o método loc[]

Exemplo 1: Selecione duas colunas

# importando a biblioteca pandas
import pandas as pd

# Define a dictionary containing employee data
data = {
	'Name': ['Jai', 'Princi', 'Gaurav', 'Anuj'],
    'Age': [27, 24, 22, 32],
    'Address': ['Delhi', 'Kanpur', 'Allahabad', 'Kannauj'],
    'Qualification': ['Msc', 'MA', 'MCA', 'Phd']
}

# Criando um dataframe a partir de um dicionário
df = pd.DataFrame(data)

# selecionando três linhas e duas colunas
print(df.loc[1:3, ['Name', 'Qualification']])

Saída:

     Name Qualification
1  Princi            MA
2  Gaurav           MCA
3    Anuj           Phd

Exemplo 2: Selecione uma coluna para outra. No nosso caso, selecionamos o nome da coluna “Name” para “Address”.

# importando a biblioteca pandas
import pandas as pd

# Define a dictionary containing employee data
data = {
	'Name': ['Jai', 'Princi', 'Gaurav', 'Anuj'],
    'Age': [27, 24, 22, 32],
    'Address': ['Delhi', 'Kanpur', 'Allahabad', 'Kannauj'],
    'Qualification': ['Msc', 'MA', 'MCA', 'Phd']
}

# Criando um dataframe a partir de um dicionário
df = pd.DataFrame(data)

# selecionando duas linhas e três colunas
print(df.loc[0:1, 'Name':'Address'])

Saída:

     Name  Age Address
0     Jai   27   Delhi
1  Princi   24  Kanpur

Exemplo 3: primeiro filtrando linhas e selecionando colunas por formato de rótulo e, em seguida, selecione todas as colunas.

# importando a biblioteca pandas
import pandas as pd

# Define a dictionary containing employee data
data = {
	'Name': ['Jai', 'Princi', 'Gaurav', 'Anuj'],
    'Age': [27, 24, 22, 32],
    'Address': ['Delhi', 'Kanpur', 'Allahabad', 'Kannauj'],
    'Qualification': ['Msc', 'MA', 'MCA', 'Phd']
}

# Criando um dataframe a partir de um dicionário
df = pd.DataFrame(data)

# linha 1, todas as colunas
print(df.loc[0, :])

Saída:

Name               Jai
Age                 27
Address          Delhi
Qualification      Msc
Name: 0, dtype: object

Método #3: usando o método iloc[]

Exemplo 1: Selecione as duas primeiras colunas.

# seleciona todas as linhas
# e seleciona as duas primeiras colunas
print(df.iloc[:, 0:2])

Saída:

     Name  Age
0     Jai   27
1  Princi   24
2  Gaurav   22
3    Anuj   32

Artigo escrito por Rajput-Ji e traduzido por Acervolima de How to select multiple columns in a pandas dataframe.

Licença

0 comentários:

Postar um comentário