quarta-feira, 27 de janeiro de 2021

Como instalar o Python pandas no Windows e Linux?

pandas é um pacote escrito para análise e manipulação de dados. O pandas oferece várias operações e estruturas de dados para realizar manipulações de dados numéricos e séries temporais. pandas é uma biblioteca de código aberto construída sobre a biblioteca Numpy. A biblioteca pandas é conhecida por sua alta produtividade e alto desempenho. O pandas é popular porque torna a importação e análise de dados muito mais fácil.

Os programas do pandas podem ser escritos em qualquer editor de texto simples como notepad, notepad++ ou qualquer coisa desse tipo e salvos com uma extensão .py. Para começar, escrevendo códigos pandas e realizando várias operações interessantes e úteis, é necessário ter o Python instalado em seu sistema. Isso pode ser feito seguindo as instruções passo a passo fornecidas abaixo:

E se o Python já existir? Vamos checar

Para verificar se o seu dispositivo está pré-instalado com Python ou não, basta ir para a linha de comando (pesquise cmd na caixa de diálogo Executar ( + R ).
Agora execute o seguinte comando:

python --version

Se o Python já estiver instalado, ele irá gerar uma mensagem com a versão do Python disponível.
python-version-check-windows

Baixar e instalar o pandas

O pandas pode ser instalado de várias maneiras no Windows e no Linux. Várias maneiras diferentes estão listadas abaixo:

janelas

O pandas pode ser instalado no Windows de duas maneiras:

Usando pip
Usando Anaconda

Instale pandas usando pip

PIP é um sistema de gerenciamento de pacotes usado para instalar e gerenciar pacotes / bibliotecas de software escritos em Python. Esses arquivos são armazenados em um grande “repositório on-line” denominado Python Package Index (PyPI).
O pandas pode ser instalado usando o PIP, usando o seguinte comando:

pip install pandas

PIP-Instalação-pandas-02

Instale o pandas usando o Anaconda

Anaconda é um software de código aberto que contém Jupyter, spyder, etc, que são usados para grandes processamento de dados, análise de dados, computação científica pesada.

Etapas para instalar o pandas usando o Anaconda Navigator:

Etapa 1: Procure o Anaconda Navigator no menu Iniciar e abra-o.

Passo 2: Clique na guia ambiente e, em seguida, clique no criar botão para criar um novo pandas Ambiente.

Etapa 3:Dê um nome ao seu ambiente, por exemplo, pandas, e depois escolha uma versão do python para rodar no ambiente. Agora clique no botão Criar para criar o Ambiente pandas.

Passo 4: Agora clique no Ambiente pandas criado para ativá-lo.

Etapa 5: na lista acima de nomes de pacotes, selecione Todos para filtrar todos os pacotes.

Etapa 6: Agora na barra de pesquisa, procure por 'pandas'. Selecione o pacote pandas para instalação.

Passo 7: Agora clique com o botão direito na caixa de seleção fornecida antes do nome do pacote e vá para 'Marcar para instalação de versão específica'. Agora selecione a versão que deseja instalar.

Etapa 8: Clique no botão Aplicar para instalar o Pacote pandas.

Etapa 9: Conclua o processo de instalação clicando no botão Aplicar.

Passo 10: Agora para abrir o Ambiente pandas, clique na Seta Verde à direita do nome do pacote e selecione o Console com o qual deseja iniciar a programação do pandas.

Janela do terminal do pandas:

Linux

Para instalar o pandas no Linux, basta digitar o seguinte comando na janela do terminal e pressionar Enter. O Linux baixará e instalará automaticamente os pacotes e arquivos necessários para executar o ambiente pandas em Python:

pip3 install pandas

pandas-Installation-Linux

Artigo escrito por Abhinav96 e traduzido por Acervo Lima de How to Install Python pandas on Windows and Linux?.

Introdução ao pandas em Python

pandas é uma biblioteca de código aberto feita principalmente para trabalhar com dados relacionais ou rotulados de forma fácil e intuitiva. Ele fornece várias estruturas de dados e operações para manipular dados numéricos e séries temporais. Esta biblioteca é construída no topo da biblioteca NumPy. pandas é rápido e tem alto desempenho e produtividade para os usuários.

História

O pandas foi inicialmente desenvolvido por Wes McKinney em 2008, enquanto ele trabalhava na AQR Capital Management. Ele convenceu a AQR a permitir que ele abrisse o código-fonte dos pandas. Outro funcionário da AQR, Chang She, ingressou como o segundo maior colaborador da biblioteca em 2012. Com o passar do tempo, muitas versões de pandas foram lançadas. A última versão do pandas é 1.0.1.

Vantagens do pandas

Rápido e eficiente para manipular e analisar dados.
Dados de diferentes objetos de arquivo podem ser carregados.
Fácil manuseio de dados ausentes (representados como NaN) em ponto flutuante, bem como dados de ponto não flutuante.
Mutabilidade de tamanho: colunas podem ser inseridas e excluídas do DataFrame e objetos de dimensão superior.
Fusão e junção de conjuntos de dados.
Remodelagem flexível e dinamização de conjuntos de dados.
Fornece funcionalidade de série temporal.
Poderoso agrupamento por funcionalidade para realizar operações dividir-aplicar-combinar em conjuntos de dados.

Começando com a biblioteca pandas

Depois que a biblioteca pandas tiver sido instalada no sistema, você precisará importar a biblioteca. Este módulo é geralmente importado como o exemplo abaixo mostrar.

import pandas as pd

Aqui, o pd é conhecido como um alias para o pandas. No entanto, não é necessário importar a biblioteca usando alias, apenas ajuda a escrever menos quantidade de código toda vez que um método ou propriedade é chamado.

O pandas geralmente fornece duas estruturas de dados para manipulação de dados, são elas:

Series
DataFrame

Series

pandas Series é um array rotulado unidimensional capaz de conter dados de qualquer tipo (inteiro, string, float, objetos python, etc.). Os rótulos dos eixos são chamados coletivamente de índice. O pandas Series nada mais é do que uma coluna em uma planilha do Excel. Os rótulos não precisam ser exclusivos, mas devem ser do tipo hashable. O objeto é compatível com indexação inteira e baseada em rótulo e fornece uma série de métodos para executar operações envolvendo o índice.

Observação: para obter mais informações, consulte Python | pandas Series

Criando uma Series do pandas

No mundo real, uma série pandas será criada carregando os conjuntos de dados do armazenamento existente, o armazenamento pode ser banco de dados SQL, arquivo CSV e arquivo Excel. A série pandas pode ser criada a partir de listas, dicionário e de um valor escalar, etc.

Exemplo:

import pandas as pd  
import numpy as np 
  
  
# Cria uma series vázia  
ser = pd.Series()

print(ser)

# Uma matriz simples
data = np.array(['g', 'e', 'e', 'k', 's'])

ser = pd.Series(data)
print(ser)

Saída:

Series([], dtype: float64)
0    g
1    e
2    e
3    k
4    s
dtype: object

DataFrame

O DataFrame pandas é uma estrutura de dados tabular bidimensional mutável em tamanho, potencialmente heterogênea, com eixos rotulados (linhas e colunas). Um dataframe é uma estrutura de dados bidimensional, ou seja, os dados são alinhados de forma tabular em linhas e colunas. O DataFrame pandas consiste em três componentes principais: dados, linhas e colunas.

Observação: para obter mais informações, consulte Criando dataframes com pandas.

Criando um dataframe pandas

No mundo real, um DataFrame pandas será criado carregando os conjuntos de dados do armazenamento existente, o armazenamento pode ser banco de dados SQL, arquivo CSV e arquivo Excel. O DataFrame pandas pode ser criado a partir de listas, dicionário e de uma lista de dicionários, etc.

Exemplo:

import pandas as pd

# Chamando o construtor do dataframe
df = pd.DataFrame()
print(df)

# lista de strings
lst = ['Acervo', 'Lima', 'o', 'melhor', 'em', 'programação'] 
	
# Chamando o construtor do dataframe com uma lista
df = pd.DataFrame(lst)
print(df)

Saída:

             0
0       Acervo
1         Lima
2            o
3       melhor
4           em
5  programação

Observação: para obter mais informações, consulte Criando dataframes com pandas.

Por que o pandas é usado para ciência de dados

O pandas é geralmente usado para ciência de dados, mas você já se perguntou por quê? Isso ocorre porque o pandas é usado em conjunto com outras bibliotecas que são usadas para ciência de dados. É construído no topo da biblioteca NumPy, o que significa que muitas estruturas do NumPy são usadas ou replicadas no pandas. Os dados produzidos pelo pandas são frequentemente usados como entrada para funções de plotagem do Matplotlib, análise estatística no SciPy, algoritmo de aprendizado de máquina no Scikit-learn.

O programa pandas pode ser executado a partir de qualquer editor de texto, mas é recomendado usar o Jupyter Notebook para isso, pois o Jupyter tem a capacidade de executar o código em uma célula específica em vez de executar o arquivo inteiro. O Jupyter também oferece uma maneira fácil de visualizar dados e gráficos do pandas.

Observação: para obter mais informações sobre o Jupyter Notebook, consulte Como usar o Jupyter Notebook - um guia definitivo.

Artigo escripot por nikhilaggarwal3 e traduzido por Acervo Lima de Introduction to pandas in Python. Alguma alterações foram feitas.

Anterior Próximo

Como usar o Jupyter Notebook - Um guia definitivo

O Jupyter Notebook é um aplicativo da web de código aberto que permite criar e compartilhar documentos que contêm código ativo, equações, visualizações e texto narrativo. Os usos incluem limpeza e transformação de dados, simulação numérica, modelagem estatística, visualização de dados, aprendizado de máquina e muito mais. Jupyter tem suporte para mais de 40 linguagens de programação diferentes e Python é uma delas. Python é um requisito (Python 3.3 ou superior, ou Python 2.7) para instalar o Jupyter Notebook.

Tabela de conteúdo

Instalação
Iniciando o Jupyter Notebook
Criando um Notebook
Hello World no Jupyter Notebook
Células no Notebook Jupyter
Núcleo
Nomeando o caderno
Extensões de Notebook

Instalação

Instale Python e Jupyter usando a distribuição Anaconda, que inclui Python, o Jupyter Notebook e outros pacotes comumente usados para computação científica e ciência de dados. Você pode baixar a versão mais recente do Python3 do Anaconda aqui.

Agora, instale a versão baixada do Anaconda.

Instalando o Jupyter Notebook usando pip:

python3 -m pip install --upgrade pip
python3 -m pip install jupyter

Iniciando o Jupyter Notebook

Para iniciar o notebook jupyter, digite o comando abaixo no terminal.

jupyter notebook

Isso imprimirá algumas informações sobre o servidor do notebook em seu terminal, incluindo o URL do aplicativo da web (por padrão, http://localhost:8888) e, em seguida, abrirá seu navegador da web padrão para este URL.

jupyter-notebook-python

Depois que o notebook for aberto, você verá o Painel do notebook, que mostrará uma lista dos blocos de notas, arquivos e subdiretórios no diretório onde o servidor do notebook foi iniciado. Na maioria das vezes, você desejará iniciar um servidor de notebook no diretório de nível mais alto que contém notebooks. Frequentemente, esse será seu diretório inicial.

jupyter-notebook-dashboard

Criando um Notebook

Para criar um novo notebook, clique no novo botão no canto superior direito. Clique nele para abrir uma lista suspensa e, se você clicar em Python3, um novo bloco de notas será aberto.

jupyter-notebook-new-file

A página da web deve ser semelhante a esta:

caderno-jupyter

Hello World no Jupyter Notebook

Depois de instalar e criar com sucesso um notebook no Jupyter Notebook, vamos ver como escrever código nele. O bloco de notas Jupyter fornece uma célula para escrever código nele. O tipo de código depende do tipo de bloco de notas que você criou. Por exemplo, se você criou um bloco de notas Python3, pode escrever o código Python3 na célula.

Agora, vamos adicionar o seguinte código:

print("Hello World")

Para executar uma célula, clique no botão Executar ou pressione Shift ⇧ + enter ⏎ após selecionar a célula que deseja executar. Depois de escrever o código acima no bloco de notas jupyter, a saída foi:

jupyter-notebook-hello-world

Nota: Quando uma célula executa o rótulo à esquerda, isto é, ln[]muda para ln[1]. Se a célula ainda estiver em execução, o rótulo permanece ln[*].

Células no Notebook Jupyter

As células podem ser consideradas o corpo do Jupyter. Na captura de tela acima, a caixa com o contorno verde é uma célula. Existem 3 tipos de células:

Código
Markup
NBConverter bruto

Código

É aqui que o código é digitado e, quando executado, o código exibe a saída abaixo da célula. O tipo de código depende do tipo de bloco de notas que você criou. Por exemplo, se o bloco de notas do Python3 for criado, o código do Python3 pode ser adicionado. Considere o exemplo abaixo, onde um código simples da série Fibonacci é criado e esse código também recebe a entrada do usuário.

Exemplo:

jypter-code-cell

A barra tex no código acima é solicitada a receber a entrada do usuário. A saída do código acima é a seguinte:

Resultado:

jupyter-code-cell

Markdown

Markdown é uma linguagem de marcação popular que é o superconjunto do HTML. O Jupyter Notebook também suporta remarcação. O tipo de célula pode ser alterado para redução usando o menu de células.

Adicionando cabeçalhos:

O título pode ser adicionado prefixando qualquer linha com um ou vários '#'seguido de espaço.

Exemplo:

jupyter-notebook-headers-1

Resultado:

jupyter-notebook-headers-2-

Adicionando Lits:

Adicionar listas é realmente simples no Jupyter Notebook. A lista pode ser adicionada usando o sinal '*'. E a lista aninhada pode ser criada usando recuo.

Exemplo:

jupyter-notebook-lists-1

Resultado:

jupyter-notebook-lists-2

Adicionando Equações de Látex:

Expressões de látex podem ser adicionadas circundando o código de látex '$' e para escrever as expressões no meio, circundando o código de látex por '$$'.

Exemplo:

$jupyter-notebook-latex-1$

Resultado:

$jupyter-notebook-latex-2$

Adicionando Tabela:

Uma tabela pode ser adicionada escrevendo o conteúdo no seguinte formato.

jupyter-notebook-table-1

Resultado:

jupyter-notebook-table-2

Nota: O texto pode ser colocado em negrito ou itálico, colocando o texto entre '**' e '*' respectivamente.

NBConverter bruto

As células brutas são fornecidas para gravar a saída diretamente. Esta célula não é avaliada pelo notebook Jupyter. Depois de passar pelas nbconvert células brutas chega à pasta de destino sem nenhuma modificação. Por exemplo, pode-se escrever Python completo em uma célula bruta que só pode ser renderizada por Python após a conversão por nbconvert.

Kernel

Um kernel roda atrás de cada notebook. Sempre que uma célula é executada, o código dentro da célula é executado dentro do kernel e a saída retorna para a célula a ser exibida. O kernel continua existindo para o documento como um todo e não para células individuais.

Por exemplo, se um módulo for importado em uma célula, esse módulo estará disponível para todo o documento. Veja o exemplo abaixo para melhor compreensão.

Exemplo:

jupyter-notebook-for-kernel

Nota: a ordem de execução de cada célula é indicada à esquerda da célula. No exemplo acima, a célula com In[1] é executada primeiro e, em seguida, a célula com In[2] é executada.

Opções para kernels:

O Jupyter Notebook oferece várias opções de kernels. Isso pode ser útil se você quiser redefinir as coisas. As opções são:

Reiniciar: Isso irá reiniciar os kernels, ou seja, limpar todas as variáveis que foram definidas, limpar os módulos que foram importados, etc.
Reiniciar e limpar a saída: isso fará o mesmo que acima, mas também limpará todas as saídas que foram exibidas abaixo da célula.
Reiniciar e executar tudo: Este também é o mesmo que acima, mas também executará todas as células na ordem de cima para baixo.
Interromper: Esta opção interromperá a execução do kernel. Pode ser útil no caso em que os programas continuam em execução ou o kernel está preso em alguma computação.

Nomeando o caderno

Quando o bloco de notas é criado, o Jupyter Notebook nomeia o bloco de notas como Sem título como padrão. No entanto, o bloco de notas pode ser renomeado. Para renomear o caderno basta clicar na palavra Sem título. Isso abrirá uma caixa de diálogo intitulada Renomear Notebook. Digite o nome válido para o seu bloco de notas na barra de texto e clique em ok.

jupyter-notebook-rename

Extensões de Notebook

Novas funcionalidades podem ser adicionadas ao Jupyter por meio de extensões. As extensões são módulos javascript. Você pode até escrever sua própria extensão que pode acessar o DOM da página e a API Javascript do Jupyter. O Jupyter oferece suporte a quatro tipos de extensões.

Núcleo
Kernel IPyhton
Caderno
Servidor de notebook

Instalando extensões

A maioria das extensões pode ser instalada usando a ferramenta pip do Python. Se uma extensão não puder ser instalada usando pip, instale a extensão usando o comando abaixo.

jupyter nbextension install extension_name

O procedimento acima apenas instala a extensão, mas não a habilita. Para habilitá-lo, digite o comando abaixo no terminal.

jupyter nbextension enable extension_name

Artigo escrito por nikhilaggarwal3 e traduzido por Acervo Lima de How To Use Jupyter Notebook – An Ultimate Guide.

Python - Séries pandas

Série pandas é um array rotulado unidimensional capaz de conter dados de qualquer tipo (inteiro, string, float, objetos python, etc.). Os rótulos dos eixos são chamados coletivamente de índice. Uma série pandas nada mais é do que uma coluna em uma planilha do Excel.

Os rótulos não precisam ser exclusivos, mas devem ser do tipo hashable. O objeto é compatível com indexação inteira e baseada em rótulo e fornece uma série de métodos para executar operações envolvendo o índice.

Neste artigo, estamos usando o arquivo nba.csv.

Teremos uma breve visão sobre todas essas operações básicas que podem ser realizadas no Pandas série:

Criando uma série
Elemento de acesso da série
Indexação e seleção de dados em série
Operação binária na série
Operação de conversão em série

Criando uma série

No mundo real, uma série Pandas será criada carregando os conjuntos de dados do armazenamento existente, o armazenamento pode ser banco de dados SQL, arquivo CSV e arquivo Excel. As séries Pandas podem ser criadas a partir de listas, dicionário e de um valor escalar, etc. As séries podem ser criadas de diferentes maneiras, aqui estão algumas maneiras pelas quais criamos uma série:

Criando uma série de array: Para criar uma série de array, temos que importar o módulo numpy e usar a função array().

# importando pandas com o alias pd
import pandas as pd
 
# importando numpy com o alias np
import numpy as np
 
# uma matriz simples
data = np.array(['A', 'c', 'e', 'r','v', 'o'])

ser = pd.Series(data)
print(ser)

Saída:

0    A
1    c
2    e
3    r
4    v
5    o
dtype: object

Criação de uma série a partir de uma listas:

Para criar uma série a partir de uma lista, temos que primeiro criar uma lista e depois podemos criar uma série da lista.

import pandas as pd
 
# uma lista simples
lista = ['A', 'c', 'e', 'r','v', 'o']
  
# criando uma série a partir de uma lista
ser = pd.Series(lista)
print(ser)

Saída:

0    A
1    c
2    e
3    r
4    v
5    o
dtype: object

Acessando elementos de uma série

Existem duas maneiras pelas quais podemos acessar o elemento da série, são elas:

Acessando Elemento da Série com Posição.
Acessando elemento usando rótulo (índice)

Acessando elemento de uma série com a posição: Para acessar o elemento da série refere-se ao número do índice. Use o operador de índice [] para acessar um elemento em uma série. O índice deve ser um número inteiro. Para acessar vários elementos de uma série, usamos a operação Slice.

# Código para acessar os 5
# primeiros elementos de uma série do pandas 
import pandas as pd
import numpy as np
 
# criando uma matriz simples
data = np.array(['A', 'c', 'e', 'r', 'v', 'o', ' ', 'L', 'i', 'm', 'a'])
ser = pd.Series(data)

# Mostra os cinco primeiros elementos da série
print(ser[:5])

Saída:

0    A
1    c
2    e
3    r
4    v
dtype: object

Acessando elemento usando rótulo (índice): Para acessar um elemento da série, temos que definir valores por rótulo de índice. Uma série é como um dicionário de tamanho fixo em que você pode obter e definir valores por rótulo de índice.

import pandas as pd
import numpy as np
 
# Criando matrizes simples
data = np.array(['A', 'c', 'e', 'r', 'v', 'o', ' ', 'L', 'i', 'm', 'a'])
ser = pd.Series(data, index=[10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20])

# acessando elemento pelo índice
print(ser[17])

Saída:

Indexação e seleção de dados em série

Indexar em pandas significa simplesmente selecionar dados específicos de uma série. A indexação pode significar selecionar todos os dados, alguns dos dados de colunas específicas. A indexação também pode ser conhecida como Seleção de subconjunto.

Indexando uma série usando o operador de indexação []: O operador de indexação é usado para referir-se aos colchetes após um objeto. Os indexadores .loc e .iloc também usam o operador de indexação para fazer seleções. Neste operador de indexação para se referir a df[].

 
import pandas as pd

# Criando um dataframe
df = pd.read_csv("nba.csv")

ser = pd.Series(df['Name'])
data = ser.head(10)
data

Saída:

0    Avery Bradley
1      Jae Crowder
2     John Holland
3      R.J. Hunter
4    Jonas Jerebko
5     Amir Johnson
6    Jordan Mickey
7     Kelly Olynyk
8     Terry Rozier
9     Marcus Smart
Name: Name, dtype: object

Agora acessamos o elemento da série usando o operador de índice [].

# Usando o operador de índice
data[3:6]

Saída:

3      R.J. Hunter
4    Jonas Jerebko
5     Amir Johnson
Name: Name, dtype: object

Indexando uma série usando .loc[]: Esta função seleciona dados referindo-se ao índice explícito. O indexador df.loc seleciona dados de uma maneira diferente do que apenas o operador de indexação. Ele pode selecionar subconjuntos de dados.

import pandas as pd  
     
# Criando o dataframe
df = pd.read_csv("nba.csv")

ser = pd.Series(df['Name'])
data = ser.head(10)
data

Saída:

0    Avery Bradley
1      Jae Crowder
2     John Holland
3      R.J. Hunter
4    Jonas Jerebko
5     Amir Johnson
6    Jordan Mickey
7     Kelly Olynyk
8     Terry Rozier
9     Marcus Smart
Name: Name, dtype: object

Agora acessamos o elemento da série usando a função .loc[].

# usando a função .loc[]
data.loc[3:6]

Saída:

3      R.J. Hunter
4    Jonas Jerebko
5     Amir Johnson
6    Jordan Mickey
Name: Name, dtype: object

Indexando uma série usando .iloc[]: Esta função nos permite recuperar dados por posição. Para fazer isso, precisamos especificar as posições dos dados que queremos. O indexador df.iloc é muito semelhante ao df.loc, mas usa apenas localizações de inteiros para fazer suas seleções.

import pandas as pd  
     
# Criando um dataframe
df = pd.read_csv("nba.csv")

ser = pd.Series(df['Name'])
data = ser.head(10)
data

Saída:

0    Avery Bradley
1      Jae Crowder
2     John Holland
3      R.J. Hunter
4    Jonas Jerebko
5     Amir Johnson
6    Jordan Mickey
7     Kelly Olynyk
8     Terry Rozier
9     Marcus Smart
Name: Name, dtype: object

Agora acessamos o elemento de Series usando a função .iloc[].

# usando a função .iloc[]
data.iloc[3:6]

Saída:

3      R.J. Hunter
4    Jonas Jerebko
5     Amir Johnson
Name: Name, dtype: object

Operação binária na série

Podemos realizar operações binárias em séries como adição, subtração e muitas outras operações. Para realizar a operação binária em série, temos que usar algumas funções como .add(), .sub() etc.

Código #1:

 
import pandas as pd

# Criando uma série
data = pd.Series([5, 2, 3,7], index=['a', 'b', 'c', 'd'])

# Criando outra série
data1 = pd.Series([1, 6, 4, 9], index=['a', 'b', 'd', 'e'])

print(data, "\n\n", data1)

Saída:

a    5
b    2
c    3
d    7
dtype: int64

 a    1
b    6
d    4
e    9
dtype: int64

Agora adicionamos duas séries usando a função .add().

# Adicionando duas séries usando a função .add()
data.add(data1, fill_value=0)

Saída:

a     6.0
b     8.0
c     3.0
d    11.0
e     9.0
dtype: float64

Código #2:

import pandas as pd  
 
# Criando uma série
data = pd.Series([5, 2, 3,7], index=['a', 'b', 'c', 'd'])

# Criando outra série
data1 = pd.Series([1, 6, 4, 9], index=['a', 'b', 'd', 'e'])

print(data, "\n\n", data1)

Saída:

a    5
b    2
c    3
d    7
dtype: int64

 a    1
b    6
d    4
e    9
dtype: int64

Agora subtraímos duas séries usando a função .sub().

# Subtraindo duas séries usando a função .sub()
data.sub(data1, fill_value=0)

Saída:

a    4.0
b   -4.0
c    3.0
d    3.0
e   -9.0
dtype: float64

Operação de conversão em série

Na operação de conversão, realizamos várias operações, como alterar o tipo de dados de uma série, alterar uma série para listar etc. Para realizar a operação de conversão, temos várias funções que ajudam na conversão, como .astype(), .tolist() etc.

Código #1:

# Programa Python usando astype
# para converter um tipo de dados de série
 
import pandas as pd

# Cria o dataframe a partir de um arquivo css
data = pd.read_csv("nba.csv")

# descartando colunas de valor nulo para evitar erros
data.dropna(inplace = True)

# armazenar dtype antes de converter
before = data.dtypes

# convertendo dtypes usando astype
data["Salary"]= data["Salary"].astype(int)
data["Number"]= data["Number"].astype(str)

# armazenar dtype após a conversão
after = data.dtypes

# Imprime para comparação
print("Antes da conversão\n", before, "\n")
print("Depois da conversão\n", after, "\n")

Saída:

Antes da conversão
 Name         object
Team         object
Number      float64
Position     object
Age         float64
Height       object
Weight      float64
College      object
Salary      float64
dtype: object

Depois da conversão
 Name         object
Team         object
Number       object
Position     object
Age         float64
Height       object
Weight      float64
College      object
Salary        int32
dtype: object

Código #2:

# Programa python para converter uma série pasdas numa lista

import pandas as pd  
import re 
     
# Criando um dataframe a partir de uma arquivo csv
data = pd.read_csv("nba.csv")

# removendo valores nulos para evitar erros
data.dropna(inplace = True)

# guardando dtype antes da operação
dtype_before = type(data["Salary"])

# Convertendo para lista
salary_list = data["Salary"].tolist()

# guardando dtype depois da operação
dtype_after = type(salary_list)

# imprimindo dtypes
print("Tipo de dado antes da conversão = {}\nTipode dado depois da conversão = {}"
      .format(dtype_before, dtype_after))

# monstrando lista
salary_list

Saída:

[7730337.0, 6796117.0, 1148640.0, 1170960.0, 2165160.0, 1824360.0, 3431040.0, 2569260.0, 6912869.0, 3425510.0, 1749840.0, 2616975.0, 845059.0, 1500000.0, 1335480.0, 6300000.0, 134215.0, 1500000.0, 19689000.0, 1140240.0, 947276.0, 981348.0, 947276.0, 947276.0, 11235955.0, 8000000.0, 1635476.0, 22875000.0, 845059.0, 845059.0, 1572360.0, 12650000.0, 3750000.0, 1636842.0, 4000000.0, 167406.0, 947276.0, 1000000.0, 4626960.0, 845059.0, 1074169.0, 6500000.0, 2144772.0, 525093.0, 3457800.0, 4582680.0, 947276.0, 2869440.0, 947276.0, 525093.0, 13600000.0, 10050000.0, 2500000.0, 7000000.0, 12000000.0, 6268675.0, 650000.0, 3553917.0, 245177.0, 1509360.0, 3873398.0, 13800000.0, 947276.0, 11370786.0, 2008748.0, 14260870.0, 11710456.0, 1131960.0, 845059.0, 1270964.0, 3815000.0, 15501000.0, 1100602.0, 111444.0, 5675000.0, 525093.0, 9650000.0, 18907726.0, 1100602.0, 19689000.0, 947276.0, 21468695.0, 3376000.0, 7085000.0, 3110796.0, 1159680.0, 3000000.0, 845059.0, 700000.0, 845059.0, 15592217.0, 1724250.0, 1155600.0, 3132240.0, 5103120.0, 981348.0, 947276.0, 5219169.0, 13500000.0, 2127840.0, 206192.0, 1160160.0, 981348.0, 13500000.0, 3807120.0, 1035000.0, 55722.0, 947276.0, 5500000.0, 2041080.0, 83397.0, 981348.0, 1015421.0, 1449187.0, 3398280.0, 5013559.0, 15851950.0, 947276.0, 525093.0, 12403101.0, 7700000.0, 3156600.0, 845059.0, 9500000.0, 845059.0, 2250000.0, 16407500.0, 4500000.0, 8500000.0, 947276.0, 2380440.0, 1015421.0, 13400000.0, 1391160.0, 20093064.0, 1535880.0, 1147276.0, 8193029.0, 16407501.0, 947276.0, 947276.0, 1276000.0, 19689000.0, 111196.0, 8988765.0, 14260870.0, 2100000.0, 2500000.0, 6500000.0, 2170465.0, 111444.0, 1252440.0, 2891760.0, 845059.0, 3272091.0, 16000000.0, 600000.0, 13913044.0, 2841960.0, 6270000.0, 5000000.0, 3000000.0, 4050000.0, 1007026.0, 17120106.0, 8000000.0, 4000000.0, 1358880.0, 211744.0, 1100000.0, 7000000.0, 2357760.0, 845059.0, 1007026.0, 3000000.0, 2399040.0, 947276.0, 1662360.0, 2943221.0, 8000000.0, 14700000.0, 16407500.0, 295327.0, 845059.0, 5152440.0, 2109294.0, 6600000.0, 1733040.0, 1449000.0, 4290000.0, 1100602.0, 3950313.0, 4053446.0, 2085671.0, 16407500.0, 1270964.0, 15361500.0, 845059.0, 947276.0, 5378974.0, 8193030.0, 306527.0, 6486486.0, 8229375.0, 1646400.0, 200600.0, 15756438.0, 1000000.0, 2489530.0, 3189794.0, 947276.0, 1404600.0, 5158539.0, 5000000.0, 3542500.0, 4088019.0, 9588426.0, 700902.0, 845059.0, 1201440.0, 1230840.0, 9638555.0, 9000000.0, 5464000.0, 8500000.0, 1100602.0, 3036927.0, 2850000.0, 7070730.0, 169883.0, 1164858.0, 845059.0, 10734586.0, 845059.0, 1320000.0, 15514031.0, 1015421.0, 10595507.0, 55722.0, 3382023.0, 19689000.0, 1142880.0, 947276.0, 5250000.0, 10000000.0, 16407500.0, 200600.0, 250750.0, 3578947.0, 525093.0, 1499187.0, 2000000.0, 1304520.0, 2854940.0, 12000000.0, 1000000.0, 5746479.0, 18671659.0, 947276.0, 525093.0, 3333333.0, 8000000.0, 947276.0, 189455.0, 947276.0, 525093.0, 6110034.0, 2612520.0, 6331404.0, 3034356.0, 5675000.0, 2139000.0, 12000000.0, 7000000.0, 4204200.0, 22192730.0, 10151612.0, 2854940.0, 261894.0, 845059.0, 5543725.0, 525093.0, 20000000.0, 981348.0, 2481720.0, 947276.0, 4171680.0, 845059.0, 1294440.0, 2380593.0, 5192520.0, 2505720.0, 4300000.0, 11250000.0, 5000000.0, 4000000.0, 5694674.0, 4375000.0, 561716.0, 3300000.0, 273038.0, 8000000.0, 1920240.0, 4662960.0, 2170465.0, 1100602.0, 200600.0, 15851950.0, 2814000.0, 3000000.0, 3533333.0, 10449438.0, 11235955.0, 1584480.0, 947276.0, 4345000.0, 258489.0, 1474440.0, 1282080.0, 2148360.0, 2056920.0, 1938840.0, 947276.0, 5703600.0, 5758680.0, 2279040.0, 3750000.0, 20158622.0, 3135000.0, 1140240.0, 16407500.0, 1463040.0, 222888.0, 3344000.0, 2021520.0, 1210800.0, 4500000.0, 5138430.0, 16744218.0, 525093.0, 8042895.0, 625093.0, 947276.0, 6980802.0, 2894059.0, 6000000.0, 5016000.0, 3075880.0, 4236287.0, 2525160.0, 525093.0, 1415520.0, 2854940.0, 2637720.0, 4775000.0, 2658240.0, 9463484.0, 12000000.0, 15409570.0, 1348440.0, 981348.0, 2239800.0, 2433333.0, 947276.0]

Métodos de operação binária em série:

Função	Descrição
add()	O método é usado para adicionar séries ou listas de objetos com o mesmo comprimento à série do chamador.
sub()	O método é usado para subtrair séries ou listar objetos semelhantes com o mesmo comprimento da série do chamador.
mul()	O método é usado para multiplicar séries ou listar objetos semelhantes com o mesmo comprimento da série do chamador.
div()	O método é usado para dividir séries ou listar objetos semelhantes com o mesmo comprimento pela série do chamador.
sum()	Retorna a soma dos valores do eixo solicitado.
prod()	Retorna o produto dos valores para o eixo solicitado.
mean()	Retorna a média dos valores para o eixo solicitado.
pow()	O método é usado para colocar cada elemento da série passada como potência exponencial da série do chamador e retornar os resultados.
abs()	O método é usado para obter o valor numérico absoluto de cada elemento em Series / DataFrame
cov()	O método é usado para encontrar a covariância de duas séries.

Método da série Pandas:

Função	Descrição
Series()	Uma série pandas pode ser criada com o método do construtor `Series()`. Este método de construtor aceita uma variedade de entradas.
combine_first()	O método é usado para combinar duas séries em uma.
count()	Retorna o número de observações não NA / nulas na série.
size()	Retorna o número de elementos nos dados subjacentes.
name()	Método permite dar um nome a um objeto Série, ou seja, à coluna.
is_unique()	O método retorna booleano se os valores no objeto forem únicos.
idxmax()	Método para extrair as posições de índice dos valores mais altos em uma Série.
idxmin()	Método para extrair as posições de índice dos valores mais baixos em uma Série.
sort_values()	O método é chamado em uma série para classificar os valores em ordem crescente ou decrescente.
sort_index()	O método é chamado em uma série pandas para classificá-lo pelo índice em vez de seus valores.
head()	Método é usado para retornar um número especificado de linhas desde o início de uma série. O método retorna uma nova série.
tail()	O método é usado para retornar um número especificado de linhas do final de uma série. O método retorna uma nova série.
le()	Usado para comparar todos os elementos da série do chamador com as séries passadas. Ele retorna True para cada elemento que é Menor ou Igual ao elemento na série passada.
ne()	Usado para comparar cada elemento da série do autor da chamada com as séries aprovadas. Ele retorna True para cada elemento que não é igual ao elemento na série passada.
ge()	Usado para comparar cada elemento da série do autor da chamada com as séries aprovadas. Ele retorna True para cada elemento que é maior ou igual ao elemento na série passada.
eq()	Usado para comparar cada elemento da série do autor da chamada com as séries aprovadas. Ele retorna True para cada elemento que é igual ao elemento na série passada.
gt()	Usado para comparar duas séries e retornar o valor booleano para cada elemento respectivo.
lt()	Usado para comparar duas séries e retornar o valor booleano para cada elemento respectivo.
clip()	Usado para cortar o valor abaixo e acima para o valor mínimo e máximo passado.
clip_lower()	Usado para recortar valores abaixo de um valor mínimo aprovado.
clip_upper()	Usado para recortar valores acima de um valor máximo aprovado.
astype()	O método é usado para alterar o tipo de dados de uma série.
tolist()	O método é usado para converter uma série em lista.
get()	O método é chamado em uma série para extrair valores de uma série. Esta é uma sintaxe alternativa à sintaxe tradicional de colchetes.
unique()	Pandas `unique()` é usado para ver os valores únicos em uma coluna particular.
nunique()	Pandas `nunique()` é usado para obter uma contagem de valores únicos.
value_counts()	Método para contar o número de vezes que cada valor exclusivo ocorre em uma série.
factorize()	O método ajuda a obter a representação numérica de uma matriz identificando valores distintos.
map()	Método para unir os valores de um objeto a outro.
between()	O método Pandas between () é usado em séries para verificar quais valores estão entre o primeiro e o segundo argumento.
apply()	O método é chamado e alimentado com uma função Python como um argumento para usar a função em cada valor de série. Este método é útil para executar operações personalizadas que não estão incluídas no pandas ou numpy.

Artigo traduzido por Acervo Lima de Python | Pandas Series.

Métodos de entrada Python para programação competitiva

Python é uma linguagem incrivelmente amigável com a única falha de ser lenta. Em comparação com C, C ++ e Java, é bem mais lento. Normalmente, em Java, o tempo fornecido é 2X e em Python, é 5X.
Para melhorar a velocidade de execução do código para problemas intensivos de entrada / saída, as linguagens têm vários procedimentos de entrada e saída.

Um Exemplo de Problema:

Considere a questão de encontrar a soma de N números inseridos pelo usuário.
Entrada de um número com a quantidade de números.
Insira os números separados por um único espaço em uma linha.

Exemplos:

Entrada: 
5
1 2 3 4 5
Resultado:
15

Diferentes soluções para o problema acima em Python:

Método normal Python: (Python 2.7)

1. raw_input() recebe um argumento de prompt opcional. Ele também remove o caractere de nova linha final da string que retorna.
2. print é apenas um wrapper fino que formata as strings (espaço entre args e nova linha no final) e chama a função de gravação de um determinado objeto.

# método básico de entrada e saída
# N entradas
n = int(raw_input())

# entre com uma matriz
arr = [int(x) for x in raw_input().split()]

# inicializa variável
summation = 0

# calcula a soma
for x in arr:
    summation += x

# mostra a resposta
print(summation)

Um método um pouco mais rápido usando oa funções internas stdin, stdout: (Python 2.7)

1. sys.stdin por outro lado é um objeto de arquivo. É como criar qualquer outro objeto de arquivo que alguém possa criar para ler a entrada do arquivo. Nesse caso, o arquivo será o buffer de entrada padrão.
2. stdout.write('D\n') é mais rápido que print('D').
3. Ainda mais rápido é escrever tudo de uma vez por stdout.write("".Join(list-comprehension)), mas isso torna o uso da memória dependente do tamanho da entrada.

# importa stdin stdout
from sys import stdin, stdout 

# suponha que uma função chamada main()
# e todas as operações sejam realizadas
def main():

    # entrada via readline
    n = stdin.readline()
 
    # método similar de entrada de array
    arr = [int(x) for x in stdin.readline().split()]

    # inicializa a variável
    summation = 0

    # calcula a soma
    for x in arr:
        summation += x

    # imprimir resposta por escrito
    # método write escreve apenas
    # operações de string
    # então precisamos converter qualquer
    # dados em string para entrada
    stdout.write(str(summation))

# chama o método principal
if __name__ == "__main__":
    main()

Diferença no tempo:

Resumo do tempo (100k linhas cada)
——————————–
Imprimir: 6.040s
Gravar no arquivo: 0.122s
Imprimir com saída padrão: 0.121s

Como vimos até agora, obter dados do sistema padrão e dar saída ao sistema padrão é sempre uma boa ideia para melhorar a eficiência do código, o que é sempre uma necessidade na programação competitiva. Mas espere! gostaria de escrever essas longas linhas sempre que precisar delas? Então, qual é a vantagem de usar Python.
Vamos discutir a solução para este problema. O que podemos fazer é criar funções separadas para pegar entradas de vários tipos e apenas chamá-las sempre que precisar.

Quando você deseja obter a entrada de números inteiros específicos fornecidos em uma única linha

Suponha que a entrada tenha o seguinte formato:

5 7 19 20

e queremos variáveis separadas para referenciá-los. o que queremos é:

a = 5
b = 7
c = 19
d = 20

então, podemos criar uma função chamada get_ints() da seguinte maneira:

import sys
def get_ints():
    return map(int, sys.stdin.readline().strip().split())
 
a, b, c, d = get_ints()

Agora você não precisa escrever esta linha novamente e novamente. Você apenas tem que chamar a função get_ints() para receber a entrada neste formulário. Na função get_ints, estamos usando a função map().

Quando você deseja obter a entrada de uma lista de inteiros fornecida em uma única linha

Suponha que a entrada tenha o seguinte formato

1 2 3 4 5 6 7 8

e queremos que uma única variável mantenha toda a lista de inteiros. O que queremos é:

Arr = [1, 2, 3, 4, 5, 6, 7, 8]

Então, aqui vamos criar uma função chamada get_list() da seguinte maneira:

import sys
def get_ints():
    return list(map(int, sys.stdin.readline().strip().split()))
 
Arr = get_ints()

Agora você não precisa escrever esta linha novamente e novamente. Você apenas tem que chamar a função get_ints() para receber a entrada neste formulário.

Quando você deseja inserir uma string

Suponha que a entrada tenha o seguinte formato:

Acerov Lima é a melhor plataforma para praticar a codificação.

e queremos que uma única variável de referência mantenha esta string. O que queremos é:

string = "Acerov Lima é a melhor plataforma para praticar a codificação."

Então, aqui vamos criar uma função chamada get_string() da seguinte maneira:

import sys
def get_string():
    return sys.stdin.readline().strip()
 
string = get_string()

Agora você não precisa escrever esta linha novamente e novamente. Você apenas tem que chamar a função get_string() para receber a entrada neste formulário
Adicionando um pipe em buffer io: (Python 2.7)
1. Simplesmente, Adicionando o código IO em buffer antes de seu código de envio para tornar a saída mais rápida.
2. O benefício dos objetos io.BytesIO é que eles implementam uma interface comum (comumente conhecida como um objeto 'semelhante a um arquivo'). Os objetos BytesIO têm um ponteiro interno e para cada chamada para read(n) o ponteiro avança.
3. O módulo atexit fornece uma interface simples para registrar funções a serem chamadas quando um programa fecha normalmente. O módulosys também fornece um gancho, sys.exitfunc, mas apenas uma função pode ser registrada lá. O registro atexit pode ser usado por vários módulos e bibliotecas simultaneamente.

# importar bibliotecas para manipulação de entrada / saída em nível genérico
import atexit, io, sys
 
# Uma implementação de fluxo usando um buffer de bytes na memória.
# Ele herda BufferedIOBase.
buffer = io.BytesIO()
sys.stdout = buffer
 
# print
@atexit.register
def write():
    sys.__stdout__.write(buffer.getvalue())
 
# método normal seguido de entrada N
n = int(raw_input())
 
# insira o array
arr = [int(x) for x in raw_input().split()]
 
summation = 0

for x in arr:
    summation += x

print(summation)

Ao lidar com uma grande quantidade de dados normalmente, o método normal falha ao executar dentro do limite de tempo. O Método 2 ajuda a manter uma grande quantidade de dados de E / S. O Método 3 é o mais rápido. Normalmente, o manuseio de arquivos de dados de entrada maiores que 2 ou 3 MBs é auxiliado pelos métodos 2 e 3.
Nota: Os códigos de menção acima estão em Python 2.7, para uso em versões Python 3.X. Simplesmente substitua raw_input() pela sintaxe input() do Python 3.X. O descanso deve funcionar bem.
Referências:
1. Mais sobre a entrada em Python 2.7
2. Saída via biblioteca sys e outros comandos.
3. Entrada via biblioteca sys e outros comandos.
4. Documentos do Módulo Python atexit.
Este artigo é uma contribuição de Shubham Saxena.

Artigo escrito por GeeksforGeeks e traduzido por Acervo Lima de Python Input Methods for Competitive Programming.

Função Python map()

A função map() retorna um objeto de map (que é um iterador) dos resultados depois de aplicar a função dada a cada item de um determinado iterável (lista, tupla etc.)

Sintaxe:

map(fun, iter)

Parâmetros:

fun: é uma função para a qual a função map passa cada elemento de determinado iterável.
iter: é um iterável que deve ser mapeado.

NOTA: Você pode passar um ou mais iteráveis para a função map().

Retorna:

Retorna uma lista dos resultados após aplicar a função fornecida  
para cada item de um determinado iterável (lista, tupla etc.)

NOTA: O valor retornado de map() (objeto de mapa) pode ser passado para funções como list () (para criar uma lista), set () (para criar um conjunto).

CÓDIGO 1

# Programa python para demostrar o funcionamento da função map() 
  
# Retorna o dobro de n 
def addition(n): 
    return n + n 

# Dobramos todos os números usando map() 
numbers = (1, 2, 3, 4) 
result = map(addition, numbers) 
print(list(result))

Resultado:

[2, 4, 6, 8]

CÓDIGO 2

Também podemos usar expressões lambda com mapa para obter o resultado acima.

# Dobramos todos os números usando map e lambda 
  
numbers = (1, 2, 3, 4) 
result = map(lambda x: x + x, numbers) 
print(list(result))

Resultado:

[2, 4, 6, 8]

CÓDIGO 3

# Adiciona duas listas usando map e lambda 
  
numbers1 = [1, 2, 3] 
numbers2 = [4, 5, 6] 
  
result = map(lambda x, y: x + y, numbers1, numbers2) 
print(list(result))

Resultado:

[5, 7, 9]

CÓDIGO 4

# List of strings 
l = ['sat', 'bat', 'cat', 'mat'] 
  
# map() pode listar a lista de strings individualmente
test = list(map(list, l)) 
print(test)

Resultado:

[['s', 'a', 't'], ['b', 'a', 't'], ['c', 'a', 't'], ['m', 'a ',' t ']]

Artigo escrito por pawan_asipu e traduzido por Acervo Lima de Python map() function.

Funções Lambda em Python

Em Python, uma função anônima significa que uma função não tem nome. Como já sabemos, a palavra-chave def é usada para definir uma função normal em Python. Da mesma forma, a palavra-chave lambda é usada para definir uma função anônima em Python. Possui a seguinte sintaxe:

Sintaxe: argumentos lambda: expressão

Essa função pode ter qualquer número de argumentos, mas apenas uma expressão, que é avaliada e retornada.
Um é livre para usar funções lambda sempre que os objetos de função são necessários.
Você precisa estar ciente de que as funções lambda são sintaticamente restritas a uma única expressão.
Ele tem vários usos em campos específicos de programação, além de outros tipos de expressões em funções.

Vamos examinar este exemplo e tentar entender a diferença entre uma função definida por def normal e uma função lambda. Este é um programa que retorna o cubo de um determinado valor:

# Código Python para ilustrar o cubo de um número
# mostrando a diferença entre def () e lambda (). 
def cube(y): 
    return y*y*y 
  
lambda_cube = lambda y: y*y*y 
  
# usando a definição normal de uma função
print(cube(5)) 
  
# usando uma função lambda
print(lambda_cube(5))

Resultado:

125
125

Como podemos ver no exemplo acima, a função cube() e lambda_cube() se comportam da mesma forma e conforme pretendido. Vamos analisar o exemplo acima um pouco mais:

Sem usar Lambda: aqui, ambos retornam o cubo de um determinado número. Mas, ao usar def, precisamos definir uma função com um cubo de nome e passar um valor para ele. Após a execução, também precisamos retornar o resultado de onde a função foi chamada usando a palavra-chave return .
Usando Lambda: a definição de Lambda não inclui uma declaração de “retorno”, ela sempre contém uma expressão que é retornada. Também podemos colocar uma definição lambda em qualquer lugar em que uma função seja esperada e não precisamos atribuí-la a nenhuma variável. Essa é a simplicidade das funções lambda.

As funções lambda podem ser usadas junto com funções integradas como filter(), map() e reduce().

Usando a função `lambda()` com `filter()`

A função filter() em Python recebe uma função e uma lista como argumentos. Isso oferece uma maneira elegante de filtrar todos os elementos de uma sequência “sequência”, para a qual a função retorna True. Aqui está um pequeno programa que retorna os números ímpares de uma lista de entrada:

Exemplo 1:

# Código python para ilustrar o uso de
# filter() com lambda() 
li = [5, 7, 22, 97, 54, 62, 77, 23, 73, 61] 
  
final_list = list(filter(lambda x: (x%2 != 0) , li)) 
print(final_list)

Resultado:

[5, 7, 97, 77, 23, 73, 61]

Exemplo 2:

# Pessoas acima de 18 anos
ages = [13, 90, 17, 59, 21, 60, 5] 
  
adults = list(filter(lambda age: age>18, ages)) 
  
print(adults)

Resultado:

[90, 59, 21, 60]

Usando a função `lambda()` com `map()`

A função map() em Python recebe uma função e uma lista como argumento. A função é chamada com uma função lambda e uma lista e uma nova lista é retornada que contém todos os itens modificados por lambda retornados por aquela função para cada item. Exemplo:

Exemplo 1:

# Código python para ilustrar o funcionamento da função
# map() com lambda() 
# para obter o dobro de uma lista
li = [5, 7, 22, 97, 54, 62, 77, 23, 73, 61] 
  
final_list = list(map(lambda x: x*2, li)) 
print(final_list)

Resultado:

[10, 14, 44, 194, 108, 124, 154, 46, 146, 122]

Exemplo 2:

# Python program to demonstrate 
# use of lambda() function 
# with map() function 
animals = ['cão', 'gato', 'papagaio', 'coelho'] 
  
# aqui pretendemos mudar todos os nomes de animais
# para maiúsculas e retorna o mesmo
uppered_animals = list(map(lambda animal: str.upper(animal), animals)) 
  
print(uppered_animals)

Resultado:

['CÃO', 'GATO', 'PAPAGAIO', 'COELHO']

Usando a função `lambda()` com `reduce()`

A função reduce() em Python leva em uma função e uma lista como um argumento. A função é chamada com uma função lambda e um iterável e um novo resultado reduzido é retornado. Isso executa uma operação repetitiva sobre os pares do iterável. A função reduce() pertence ao módulo functools .

Exemplo 1:

# Código Python para ilustrar a reduce()
# com lambda() para obter a soma de uma lista
  
from functools import reduce
li = [5, 8, 10, 20, 50, 100] 
sum = reduce((lambda x, y: x + y), li) 
print (sum)

Resultado:

Aqui, os resultados dos dois elementos anteriores são adicionados ao próximo elemento e isso continua até o final da lista como (((((5+8)+10)+20)+50)+100).

Exemplo 2:

# código python para demonstrar o funcionamento de reduce()
# com uma função lambda

import functools  
  
# initializing list  
lis = [ 1 , 3, 5, 6, 2, ]  
  
# usando reduce para calcular o elemento máximo da lista
print("O elemento máximo da lista é: ",end="")  
print(functools.reduce(lambda a,b : a if a > b else b,lis))

Resultado:

O elemento máximo da lista é: 6

Este artigo é uma contribuição de Chinmoy Lenka.

Artigo escrito por GeeksforGeeks e traduzido por Acervo Lima de Python Lambda Functions.

Recebendo várias entradas do usuário em Python

O desenvolvedor geralmente deseja que um usuário insira vários valores ou entradas em uma linha. Em C ++ / C, o usuário pode receber várias entradas em uma linha usando scanf, mas no usuário Python pode receber vários valores ou entradas em uma linha por dois métodos.

Usando o método split():
esta função ajuda a obter várias entradas do usuário. Ele quebra a entrada fornecida pelo separador especificado. Se um separador não for fornecido, qualquer espaço em branco será um separador. Geralmente, o usuário usa um método split() para dividir uma string Python, mas pode-se usá-lo para obter várias entradas.

Sintaxe:

input().split(separador, maxsplit)

Exemplo:

# Python program showing how to
# multiple input using split
 
# taking two inputs at a time
x, y = input("Enter a two value: ").split()
print("Number of boys: ", x)
print("Number of girls: ", y)
print()
 
# taking three inputs at a time
x, y, z = input("Enter a three value: ").split()
print("Total number of students: ", x)
print("Number of boys is : ", y)
print("Number of girls is : ", z)
print()
 
# taking two inputs at a time
a, b = input("Enter a two value: ").split()
print("First number is {} and second number is {}".format(a, b))
print()
 
# taking multiple inputs at a time 
# and type casting using list() function
x = list(map(int, input("Enter a multiple value: ").split()))
print("List of students: ", x)

Resultado:

Usando a compreensão de listas: A compreensão de
listas é uma maneira elegante de definir e criar listas em Python. Podemos criar listas como afirmações matemáticas em apenas uma linha. Ele também é usado para obter várias entradas de um usuário.

Exemplo:

# Python program showing
# how to take multiple input
# using List comprehension
 
# taking two input at a time
x, y = [int(x) for x in input("Enter two value: ").split()]
print("First Number is: ", x)
print("Second Number is: ", y)
print()
 
# taking three input at a time
x, y, z = [int(x) for x in input("Enter three value: ").split()]
print("First Number is: ", x)
print("Second Number is: ", y)
print("Third Number is: ", z)
print()
 
# taking two inputs at a time
x, y = [int(x) for x in input("Enter two value: ").split()]
print("First number is {} and second number is {}".format(x, y))
print()
 
# taking multiple inputs at a time 
x = [int(x) for x in input("Enter multiple value: ").split()]
print("Number of list is: ", x)

Resultado :

Observação: os exemplos acima aceitam entradas separadas por espaços. No caso de desejarmos ter a entrada separada por vírgula (,), podemos usar o seguinte:

# taking multiple inputs at a time separated by comma
x = [int(x) for x in input("Enter multiple value: ").split(",")]
print("Number of list is: ", x)

Artigo escrito por ABHISHEK TIWARI 13 e traduzido por Acervo Lima de Taking multiple inputs from user in Python.

Python String - split()

O método split() retorna uma lista de strings após quebrar a string dada pelo separador especificado.

Sintaxe: str.split (separador, maxsplit)
Parâmetros:
separador: este é um delimitador. A string se divide neste separador especificado. Se não for fornecido, qualquer espaço em branco será um separador.
maxsplit: é um número, que nos diz para dividir a string no máximo do número de vezes fornecido. Se não for fornecido, não há limite.
Retorna: Retorna uma lista de strings depois de quebrar a string fornecida pelo separador especificado.

CÓDIGO 1


text = 'geeks for geeks'
  
# quebra a string nos epaços em branco
print(text.split()) 

word = 'geeks, for, geeks'
  
# quebra a string quando encontra ',' 
print(word.split(',')) 
  
word = 'geeks:for:geeks'
  
# quebra a string quando encontra ':' 
print(word.split(':')) 
  
word = 'CatBatSatFatOr'
  
# quebra em 3 
print([word[i:i+3] for i in range(0, len(word), 3)])

Resultado :

['geeks', 'para', 'geeks']
['geeks', 'para', 'geeks']
['geeks', 'para', 'geeks']
['Gato', 'Morcego', 'Sáb', 'Gordo', 'Ou']

CÓDIGO 2

word = 'geeks, for, geeks, pawan'
  
# maxsplit: 0 
print(word.split(', ', 0)) 
  
# maxsplit: 4 
print(word.split(', ', 4)) 
  
# maxsplit: 1 
print(word.split(', ', 1))

Resultado :

['geeks, for, geeks, pawan']
['geeks', 'para', 'geeks', 'pawan']
['geeks', 'para, geeks, pawan']

Artigo escrito por pawan_asipu e traduzido por Acervo Lima de Python String | split().

Compreensão e segmentação da lista Python

A compreensão de listas é uma maneira elegante de definir e criar uma lista em python. Podemos criar listas apenas como declarações matemáticas e em apenas uma linha. A sintaxe de compreensão de lista é mais fácil de entender.

A compreensão de uma lista geralmente consiste nestas partes:

Por exemplo :

lst = [x ** 2 para x no intervalo (1, 11) se x% 2 == 1] 

aqui, x ** 2 é a expressão de saída, 
      intervalo (1, 11) é a sequência de entrada, 
      x é variável e   
      se x % 2 == 1 é parte do predicado.

Exemplo 1:

# Programa Python para demonstrar compreensão de listas em Python

# A lista abaixo contém o quadrado de todos os números ímpares do
# intervalo 1 a 10  
odd_square = [x ** 2 for x in range(1, 11) if x % 2 == 1]  
print (odd_square)  
  
# para compreensão, a geração acima é igual a,  
odd_square = []  
for x in range(1, 11):  
    if x % 2 == 1:  
        odd_square.append(x**2)  
print(odd_square)  
  
# a lista abaixo contém potência de 2 de 1 a 8
power_of_2 = [2 ** x for x in range(1, 9)]  
print(power_of_2)  
  
# a lista abaixo contém primos e não primos no intervalo de 1 a 50
noprimes = [j for i in range(2, 8) for j in range(i*2, 50, i)]  
primes = [x for x in range(2, 50) if x not in noprimes]  
print(primes)  
  
# lista para diminuir os personagens
print([x.lower() for x in ["A","B","C"]]) 
  
# lista que extrai o número
string = "my phone number is : 11122 !!"
  
print("\nExtracted digits")  
numbers = [x for x in string if x.isdigit()]  
print (numbers)  
  
# Uma lista de lista para tabuada
a = 5
table = [[a, b, a * b] for b in range(1, 11)]  
  
print("\nMultiplication Table")  
for i in table:  
    print (i)

Resultado:

[1, 9, 25, 49, 81]
[1, 9, 25, 49, 81]
[2, 4, 8, 16, 32, 64, 128, 256]
[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47]
['a', 'b', 'c']

Dígitos extraídos
['1', '1', '1', '2', '2']

Tabela de multiplicação
[5, 1, 5]
[5, 2, 10]
[5, 3, 15]
[5, 4, 20]
[5, 5, 25]
[5, 6, 30]
[5, 7, 35]
[5, 8, 40]
[5, 9, 45]
[5, 10, 50]

Depois de obter a lista, podemos obter uma parte dela usando o operador de fatiamento do python, que tem a seguinte sintaxe:


[start : stop : steps]

o que significa que o corte começará do início do índice
 subirá até stop no paso steps.
 O valor padrão de start é 0, a stop é o último índice da lista
 e para step é 1

Assim, [:stop] dividirá a lista do início ao fim do índice e [start:] dividirá a lista do índice inicial até o final O valor negativo das etapas mostra o percurso da direita para a esquerda em vez de o percurso da esquerda para a direita. É por isso que [::-1] imprime a lista na ordem inversa.

Exemplo 2:

# Vamos primeiro criar uma lista para demonstrar o fatiamento
# lst contém todos os números de 1 a 10
lst =list(range(1, 11)) 
print (lst) 
   
# a lista abaixo tem números de 2 a 5
lst1_5 = lst[1 : 5] 
print (lst1_5) 
   
# a lista abaixo tem números de 6 a 8
lst5_8 = lst[5 : 8] 
print (lst5_8) 
   
# a lista abaixo tem números de 2 a 10
lst1_ = lst[1 : ] 
print (lst1_) 
   
# a lista abaixo tem números de 1 a 5
lst_5 = lst[: 5] 
print (lst_5) 
   
# a lista abaixo tem números de 2 a 8 na etapa 2
lst1_8_2 = lst[1 : 8 : 2] 
print (lst1_8_2) 
   
# a lista abaixo tem números de 10 a 1
lst_rev = lst[ : : -1] 
print (lst_rev) 
   
# a lista abaixo tem números de 10 a 6 na etapa 2
lst_rev_9_5_2 = lst[9 : 4 : -2] 
print (lst_rev_9_5_2)

Resultado:

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
[2, 3, 4, 5]
[6, 7, 8]
[2, 3, 4, 5, 6, 7, 8, 9, 10]
[1, 2, 3, 4, 5]
[2, 4, 6, 8]
[10, 9, 8, 7, 6, 5, 4, 3, 2, 1]
[10, 8, 6]

Podemos usar a função filter para filtrar uma lista com base em alguma condição fornecida como uma expressão lambda como primeiro argumento e lista como o segundo argumento, exemplo dos quais é mostrado a seguir:

Exemplo 3:

import functools 
  
#  filtering odd numbers 
lst = filter(lambda x : x % 2 == 1, range(1, 20)) 
print (list(lst)) 
   
#  filtering odd square which are divisible by 5 
lst = filter(lambda x : x % 5 == 0,  
      [x ** 2 for x in range(1, 11) if x % 2 == 1]) 
print (list(lst)) 
   
#   filtering negative numbers 
lst = filter((lambda x: x < 0), range(-5,5)) 
print (list(lst)) 
   
#  implementing max() function, using 
print (functools.reduce(lambda a,b: a if (a > b) else b, [7, 12, 45, 100, 15]))

Resultado:

[1, 3, 5, 7, 9, 11, 13, 15, 17, 19]
[25]
[-5, -4, -3, -2, -1]
100

Este artigo é uma contribuição de Utkarsh Trivedi. Escreva comentários se encontrar algo incorreto ou se quiser compartilhar mais informações sobre o tópico discutido acima.

Artigo escrito por GeeksforGeeks e traduzido por Acervo Lima de Python List Comprehension and Slicing.

Recebendo entrada em Python

Os desenvolvedores geralmente precisam interagir com os usuários, seja para obter dados ou fornecer algum tipo de resultado. A maioria dos programas hoje usa uma caixa de diálogo como uma forma de solicitar ao usuário algum tipo de entrada. Já o Python nos fornece duas funções embutidas para ler a entrada do teclado.

input(): esta função primeiro obtém a entrada do usuário e, em seguida, avalia a expressão, o que significa que o Python identifica automaticamente se o usuário inseriu uma string ou um número ou lista. Se a entrada fornecida não estiver correta, o erro de sintaxe ou a exceção é gerado pelo python. Por exemplo -

# Python program showing
# a use of input()

val = input("Enter your value: ")
print(val)

Saída:

como a função input funciona em Python:

Código:

# Program to check input
# type in Python

num = input("Enter number :")
print(num)
name1 = input("Enter name : ")
print(name1)

# Printing type of input value
print ("type of number", type(num))
print ("type of name", type(name1))

Resultado :

raw_input(): Esta função funciona em versões anteriores (como Python 2.x). Esta função pega exatamente o que foi digitado no teclado, converte em string e depois retorna para a variável na qual queremos armazenar. Por exemplo -

# Python program showing
# a use of raw_input()

g = raw_input("Enter your name : ")
print g

Resultado :

Aqui, g é uma variável que obterá o valor da string, digitada pelo usuário durante a execução do programa. A digitação de dados para a raw_input()função é encerrada com a tecla Enter. Podemos usar raw_input()para inserir dados numéricos também. Nesse caso, usamos typecasting. Para obter mais detalhes sobre typecasting, consulte isto.

Consulte o artigo Obtendo a lista como entrada do usuário para obter mais informações.

Artigo escrito por ABHISHEK TIWARI 13 e traduzido por Acervo Lima de Taking input in Python.

Obtendo entrada do console em Python

O que é console em Python?Console (também chamado de Shell) é basicamente um interpretador de linha de comando que recebe a entrada do usuário, ou seja, um comando por vez e a interpreta. Se estiver livre de erros, ele executa o comando e fornece a saída necessária, caso contrário mostra a mensagem de erro. Um console Python se parece com isso.

Aqui nós escrevemos o comando e para executá-lo basta pressionar a tecla Enter e seu comando será interpretado.
Para programar em Python, você deve conhecer os fundamentos do console usado em Python.

O prompt principal do console python são os três símbolos maiores que

>>>

Você está livre para escrever o próximo comando no shell somente quando, após a execução do primeiro comando, esses prompts aparecerem. O console Python aceita comandos em Python que você escreve após o prompt.

Aceitar entrada do console
usuário insere os valores no console e esse valor é então usado no programa conforme necessário.
Para obter a entrada do usuário, usamos a função interna input().

# input 
input1 = input() 
  
# output 
print(input1)

Também podemos converter esta entrada para inteiro, float ou string especificando a função input() dentro do tipo.

Artigo escrito por DikshaTewari e traduzido por Acervo Lima de Taking input from console in Python.

Python - Obtenha uma lista como entrada do usuário

Frequentemente encontramos uma situação em que precisamos pegar um número / string como entrada do usuário. Neste artigo, veremos como obter como entrada uma lista do usuário.

Exemplos:

Entrada: n = 4, ele = 1 2 3 4
Saída:   [1, 2, 3, 4]

Entrada: n = 6, ele = 3 4 1 7 9 6
Saída: [3, 4, 1, 7, 9, 6]

Código # 1: exemplo básico

# creating an empty list
lst = []

# number of elemetns as input
n = int(input("Enter number of elements : "))

# iterating till the range
for i in range(0, n):
    ele = int(input())

    lst.append(ele) # adding the element

print(lst)

Resultado:

Código # 2: com manipulação de exceção

# try block to handle the exception
try:
    my_list = []

    while True:
        my_list.append(int(input()))

# if the input is not-integer, just print the list
except:
    print(my_list)

Resultado:

Código # 3: Usando map()

# number of elements
n = int(input("Enter number of elements : "))

# Below line read inputs from user using map() function
a = list(map(int,input("\nEnter the numbers : ").strip().split()))[:n]

print("\nList is - ", a)

Resultado:

Código # 4: Lista de listas como entrada

lst = []
n = int(input("Enter number of elements : "))

for i in range(0, n):
    ele = [input(), int(input())]
    lst.append(ele)

print(lst)

Resultado:

Código # 5: usando compreensão de lista e definição de tipos

# For list of integers
lst1 = []

# For list of strings/chars
lst2 = []

lst1 = [int(item) for item in input("Enter the list items : ").split()]

lst2 = [item for item in input("Enter the list items : ").split()]

print(lst1)
print(lst2)

Resultado:

Artigo escrito por dileep1998 e traduzido por Acervo Lima de Python | Get a list as input from user.

quarta-feira, 27 de janeiro de 2021

E se o Python já existir? Vamos checar

Baixar e instalar o pandas

janelas

Instale pandas usando pip

Instale o pandas usando o Anaconda

Linux

História

Vantagens do pandas

Começando com a biblioteca pandas

Series

Criando uma Series do pandas

DataFrame

Criando um dataframe pandas

Por que o pandas é usado para ciência de dados

Instalação

Iniciando o Jupyter Notebook

Criando um Notebook

Hello World no Jupyter Notebook

Células no Notebook Jupyter

Código

Markdown

NBConverter bruto

Kernel

Nomeando o caderno

Extensões de Notebook

Instalando extensões

Criando uma série

Criação de uma série a partir de uma listas:

Acessando elementos de uma série

Indexação e seleção de dados em série

Operação binária na série

Operação de conversão em série

Métodos de operação binária em série:

Método da série Pandas:

Quando você deseja obter a entrada de números inteiros específicos fornecidos em uma única linha

Quando você deseja obter a entrada de uma lista de inteiros fornecida em uma única linha

Quando você deseja inserir uma string

Usando a função lambda() com filter()

Usando a função lambda() com map()

Usando a função lambda() com reduce()

terça-feira, 26 de janeiro de 2021

Último post

Popular Posts

Categories

Blog Archive

Usando a função `lambda()` com `filter()`

Usando a função `lambda()` com `map()`

Usando a função `lambda()` com `reduce()`