domingo, 26 de abril de 2020

Gráfico em pizza com Matplotlib

Gráfico em pizza com Matplotlib

Os gráficos em formato de pizza, ou circular. É um gráfico fácil de compreender. Geralmente os dados, de um gráfico circular, é usado para representar uma porção de um todo. Como por exemplo, quantos por cento da população brasileira sabe inglês? Ou quantas pessoas gostam de café?
Expressar esses dados em forma de barra tornaria mais difícil a compreensão dos dados. Já com o gráfico em formato de pizza os seus dados são compreendidos quase que instantaneamente (pelo menos com dados muito discrepantes). Isso acontece porque os dados de um gráfico em pizza são representações de partes de um todo, e não um valor absoluto. Por isso o gráfico em pizza é usado para apresentar valores que fazem parte de um conjunto.

Como fazer um gráfico em formato de pizza

Para poder criar um gráfico em forma de pizza, a biblioteca matplotlib fornece a função pie.
Veja um exemplo abaixo do uso da função pie:
Exemplo
import matplotlib.pyplot as plt

dados = [32, 25, 18, 25]

plt.pie(dados)
plt.show()
A execução do código acima deve resultar num gráfico parecido com esse:

Como funciona a função pie da biblioteca matplotlib

A função pie recebe uma lista com os dados dos gráfico e calcula a área de cada dado. A lista poderia ser substituída por uma tupla ou um array da biblioteca numpy. O que você precisa prestar atenção é nos valores passados. A soma de todos os elementos da lista deve ser igual a cem. Se o valor da soma de todos os elementos da lista for menor que cem, uma fatia do gráfico ficará maior do que deveria.

Mais barras com Matplotlib

Mais barras com Matplotlib

Quando comparamos dados que podem ser representados por barras, e essas barras estão uma do lado da outra, é interessante que essas barras sejam de cores diferentes. Para facilitar o entendimento e localizar os dados que se procura.
Todo esse trabalho, de criar múltiplas barras com corres diferentes, pode ser feito com a função bar. Só precisamos adicionar alguns parâmetros e chamar a função algumas vezes (uma para cada nova barra que se deseja desenhar no gráfico).
Exemplo
import numpy as np
import matplotlib.pyplot as plt

dados = [[5., 25., 50., 20.],
         [4., 23., 51., 17.],
         [6., 22., 52., 19.]]

X = np.arange(4)

plt.bar(X + 0.00, dados[0], color = 'r', width = 0.25)
plt.bar(X + 0.25, dados[1], color = 'g', width = 0.25)
plt.bar(X + 0.50, dados[2], color = 'b', width = 0.25)
plt.show()
A execução do código acima deve resultar no seguinte resultado:

Empilhando barras

Com a função bar também podemos criar gráficos com barras sobre barras. Para definir qual barra estará embaixo da outra utilizamos o parâmetro bottom.
Exemplo
import numpy as np
import matplotlib.pyplot as plt

a = np.array([5., 30., 45., 22.])
b = np.array([5., 25., 50., 20.])
c = np.array([1., 2., 1., 1.])
x = np.arange(4)

plt.bar(x, a, color = 'b')
plt.bar(x, b, color = 'g', bottom = a)
plt.bar(x, c, color = 'r', bottom = a + b)
plt.show()
O resultado desse exemplo é um gráfico com com quatro barras, cada uma com três barras empilhadas:

Fica fácil compreender o exemplo se você notar que começamos desenhando as barras de baixo. E conforme vamos adicionando barras indicamos quais barras estão abaixo.

Barras verticais

Utilizar barras verticais, uma do lado da outra, pode ser útil para demostrar o mesmo dado com grupos diferentes de indivíduos. Por exemplo, o numero de nascimentos de meninos e meninas. E é possível fazer esse tipo de gráfico com a biblioteca matplotlib.
Exemplo
import numpy as np
import matplotlib.pyplot as plt

meninas = np.array([5., 30., 45., 22.])
meninos = np.array([5., 25., 50., 20.])

X = np.arange(4)

plt.barh(X, meninas, color = 'r')
plt.barh(X, -meninos, color = 'b')
plt.show()
Veja como é simples criar barras verticais uma “sobre” a outra: nesse exemplo mudamos apenas o sinal de um dos valores. E o resultado é esse:

Assim usamos o conhecimento das matrizes da biblioteca numpy ao nosso favor. Em vez de mudar todos os valores da matriz, um por um, podemos fazer isso de uma vez só.

sábado, 25 de abril de 2020

Gráfico com pontos e barras com Matplotlib

Gráfico com pontos e barras com Matplotlib

Pontos

Quando traçamos uma linha ou uma curva num gráfico o que realmente fazemos é interligar dois ou mais pontos. Esse tipo de coisa é interessante quando queremos ver a relação entre duas coisas relacionada. Como a variação de temperatura com o passar do tempo. Mas existem situações onde esse tipo de relação não existe, um dado é simplesmente um dado. Sem relação com outro. Por exemplo, uma coordenada no plano cartesiano.
Para o nosso exemplo vamos usar a função scatter da biblioteca matplotlib e a função rand da biblioteca numpy. A função scatter é utilizada para desenhar pontos no gráfico. E para isso a função recebe dois argumentos: as posições x e y de cada ponto. Já a função rand cria uma matriz com números aleatórios no intervalo de 0 até 1.
Exemplo
import numpy as np
import matplotlib.pyplot as plt

coordenadas = np.random.rand(100, 2)

plt.scatter(coordenadas[:,0], coordenadas[:,1])
plt.show()
Executando o código acima o resultado deve ser parecido com esse:


Barras

Gráficos com barras são muito comuns e a biblioteca matplotlib não podia deixar de trazer funções para a criação de gráficos com barras. Uma dessas funções é a bar. Veja um exemplo de utilização da função bar:
Exemplo
import matplotlib.pyplot as plt

dados = [5., 25., 50., 20.]

plt.bar(range(len(dados)), dados)
plt.show()
O gráfico com barras, desenhado pelo código acima, deve ser parecido com esse:


A função bar recebe dois argumentos. O primeiro pode ser uma lista, tupla ou range. E o segundo é o valor da barra, ou sua altura. O primeiro argumento fornece as coordenadas x das barras no gráfico.
Entre as barras existe um espaço. E se por algum motivo você quiser alterar ou diminuir esse espaço podemos usar o parâmetro width da função bar. O valor padrão da largura das barras é 0,8.
Exemplo
import matplotlib.pyplot as plt

dados = [5., 25., 50., 20.]

plt.bar((1, 2, 3, 4), dados, width=0.5)
plt.show()
Com o valor do parâmetro width de 0.5 podemos notar que a largura da barra ficou menor.

Barras verticais

Para criar barras verticais a biblioteca matplotlib fornece a função barh. A função barh funciona da mesma forma que a bar. A única diferença é que a função barh desenha as barras na vertical.
Exemplo
import matplotlib.pyplot as plt

dados = [5., 25., 50., 20.]

plt.barh(range(len(dados)), dados)
plt.show()
Com esse exemplo o resultado é um gráfico com barras na vertical.

Gráfico com dados de arquivo com Matplotlib

Gráfico com dados de arquivo com Matplotlib


Se você leu os outros tutoriais, já deve saber que a biblioteca matplotlib não tem funções para leitura de dados em arquivos. A biblioteca matplotlib só renderiza o gráfico. Para ler dados de um arquivo vamos precisar usar funções fora do módulo matplotlib. Mas felizmente a linguagem python já vem com funções build-in para leitura e escrita de dados.
A primeira coisa que precisamos para ler dados de um arquivo é o arquivo com os dados que pretendemos ler. Nesse exemplo vamos usar um arquivo de texto com os seguintes dados:
0 0
1 1
2 4
3 9
4 16
5 25
6 36

Para fazer a leitura do arquivo vamos usar a função build-in open do python. E para desenhar o gráfico vamos usar o módulo matplotlib. Veja o código abaixo:
Exemplo
import matplotlib.pyplot as plt

x, y = [], []

for linha in open('dados.txt', 'r'):
  dados = [float(s) for s in linha.split()]
  x.append(dados[0])
  y.append(dados[1])

plt.plot(x, y)
plt.show()
O desenho do gráfico, com os dados do arquivo dados.txt, deve ficar parecido com esse:

Como podemos notar os dados no nosso arquivo são uma matriz. E qual biblioteca podemos usar para trabalhar com matrizes? Isso mesmo. A biblioteca numpy. Além de trabalhar com matrizes a biblioteca fornece a função loadtxt. A função loadtxt é usada para leitura de dados em arquivos txt.
Veja o mesmo exemplo acima, agora fazendo uso do módulo numpy:
Exemplo
import matplotlib.pyplot as plt
import numpy as np

dados = np.loadtxt('dados.txt')

plt.plot(dados[:,0], dados[:,1])
plt.show()
A função loadtxt retorna uma matriz de duas dimensões. Assim fica mais fácil para nos trabalharmos com esses dados. Utilizando um laço for o código pode ficar mais complexo.
Utilizando a biblioteca numpy, além de tornar o código menor, o código ficou mais fácil de entender. E a biblioteca numpy ainda trás funções para podermos ler dados de arquivos de text, CVS e Matlab.
A biblioteca numpy ainda trás vantagens quanto a velocidade e consumo de memória. Já que as partes de cálculos de matrizes da biblioteca foram escritas em C. E os dados são guardados na memoria como uma matriz numpy.

sexta-feira, 24 de abril de 2020

Múltiplas curvas com Matplotlib

Múltiplas curvas com Matplotlib


Uma das utilidades dos gráficos é analisar dados. Mas para analisar alguma coisa é sempre bom ter algum parâmetro. E nada melhor que um gráfico exibindo os dados que estão sendo analisados.
Nos exemplos passados criamos gráficos com apenas uma linha. Para analisar dois dados diferentes precisamos que esse gráfico tenha mais de uma linha. Uma linha pra cada dado.
Com a biblioteca matplotlib podemos criar um gráfico com múltiplas linhas. E nesse caso vamos criar um gráfico que mostra o seno de x e o cosseno de x no intervalo entre 0 e 2 * pi.
Exemplo
import numpy as np
import matplotlib.pyplot as plt

X = np.linspace(0, 2 * np.pi, 100)
Ya = np.sin(X) # seno de x
Yb = np.cos(X) # cosseno de x

plt.plot(X, Ya)
plt.plot(X, Yb)
plt.show()
Executando o código acima o resultado deve ser um gráfico com duas linhas:

Nesse exemplo podemos notar que nosso gráfico tem duas linhas com cores diferentes. Essas cores são escolhidas automaticamente pela biblioteca matplotlib (nos próximos tutoriais vamos aprender a escolher as cores).
É importante notar que chamamos a função plot duas vezes, uma para cada linha. E chamamos a função show apenas uma. Isso acontece porque a função plot é apenas um “aviso” do que pretendemos desenhar no gráfico. Enquanto a função show faz o desenho. Por isso chamamos a função plot duas vezes e a função show apenas uma.
A função show monstra que a renderização do matplotlib é central. Assim você pode renderizar o gráfico quando e como quiser. Apenas chamando a função show. Antes disso você estará definindo a forma do objeto, mas não o criando. Esse comportamento da biblioteca é muito útil quando se esta criando um gráfico complexo com múltiplas linhas. Isso permite que você possa utilizar todos os recursos da linguagem para criar as formas do gráfico. E só depois, de tudo pronto, mostra-lo.

Matplotlib e NumPy em Python

Matplotlib e NumPy em Python


Você não precisar saber usar a biblioteca numpy para usar a biblioteca matplotli. Mas a biblioteca NumPy fornecem muitas funções e métodos que podem nos ajudar a criar o nosso gráfico. Ter conhecimento da biblioteca numpy será muito útil na utilização da biblioteca matplotlib.
Para entendermos melhor como um conhecimento da biblioteca numpy pode ser útil vamos desenhar uma linha no gráfico fazendo uso da função seno de x (sin(x)). O primeiro gráfico será feito sem utilizar a biblioteca numpy e o outro fará uso da biblioteca.
Exemplo
import math
import matplotlib.pyplot as plt

T = range(100)
x = [(2 * math.pi * t) / len(T) for t in T]
y = [math.sin(i) for i in x]

plt.plot(x, y)
plt.show()
Nesse exemplo faremos uso do módulo numpy.
Exemplo
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(0, 2 * np.pi, 100)
y = np.sin(x)

plt.plot(x, y)
plt.show()
Executando os dois exemplos você terá esse gráfico como resultado:


A única alteração no código foi feita na parte onde são geradas as coordenadas do gráfico. E mesmo assim o resultado foi o mesmo. Com uma diferença: utilizando a biblioteca numpy o código ficou mais simples.
No primeiro exemplos usamos as bibliotecas padrão do python para gerar as coordenadas de uma onda senoidal. Já no segundo utilizamos as funções da biblioteca numpy para fazer o mesmo trabalho.
A função linspace cria uma matriz com cem elementos uniformemente espaçados. Todos com os valores entre 0 e 2 * pi. Já a função sin retorna o seno de cada elemento da matriz x, que foi criada com a função linspace.
Com as funções da biblioteca numpy não precisamos calcular os valores, um por um, como fizemos no primeiro exemplo utilizando o módulo math. A biblioteca numpy trabalha com matrizes por isso podemos passar todos os valores de uma vez.
Por trabalhar com matrizes podemos utilizar a biblioteca numpy para gerar curvas de forma mais rápidas e economizar tempo. Outra vantagem de se utilizar as matrizes da numpy é a sua velocidade de execução. Já que a biblioteca foi otimizada para trabalhar com matrizes.
No próximo exemplo vamos traçar a linha do binômio x^2 -2x +1, no intervalo entre -3 e 2 usando 200 pontos.
Exemplo
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(-3, 2, 200)
y = x ** 2 - 2 * x + 1

plt.plot(x, y)
plt.show()
Executando o código acima o resultado deve ser um gráfico como esse:


Como no primeiro exemplo poderíamos criar as coordenadas usando apenas as bibliotecas padrão do python. Mas utilizando a biblioteca numpy o código fica mais legível e simples.
Considere aprender a utilizar a biblioteca numpy. É possível utilizar o módulo matplotlib sem saber nada de numpy. Mas saber numpy vai facilitar muito o trabalho na criação de coordenadas.

quinta-feira, 23 de abril de 2020

Introdução ao Matplotlib e primeiro exemplo

Introdução ao Matplotlib e primeiro exemplo


Matplot é uma biblioteca que facilita a visualização de dados em gráficos. O objetivo da biblioteca é facilitar a criação de gráficos. Permitindo que o programador gaste o seu tempo na busca e analise de dados. Ao invés de desperdiçar horas criando um gráfico.
Com a biblioteca matplotlib é possível criar gráfico com poucas linhas de código.
Nesse tutorial vamos instalar o módulo matplotlib e criar o nosso primeiro gráfico com a biblioteca matplotlib.

Instalando o módulo Matplotlib

A instalação do módulo matplotlib pode ser feita através do gerenciador de pacotes pip.
A instalação pode ser feita, usando o pip, tanto no Windows como numa distribuição Linux.
No terminal ou promtp de comando digite: pip install matplotlib. Pronto! Você já pode começar a criar gráficos com a biblioteca matplotlib.
Obs: Se houver algum erro na instalação do módulo matplotlib, tente pip install matplotlib --user

A primeira curva

Para o nosso primeiro exemplo vamos traçar uma curva. Com esse exemplo você terá uma pequena noção de como a biblioteca matplotlib funciona.
Exemplo
import matplotlib.pyplot as plt

x = range(100)
y = [i ** 2 for i in x]

plt.plot(x, y)
plt.show()
Com esse código o nosso resultado deve ser um gráfico com uma linha curva. Como essa:


Na primeira linha importamos o módulo matplotlib.pyplot e criamos um apelido: plt. Se você procurar por códigos que utilizam o módulo matplotlib vai perceber que esse apelido é uma convenção entre os programadores.
E vamos adotar esse padrão aqui nos próximos tutoriais.
Na terceira linha criamos um objeto do tipo range com um range de 0 a 99.
Na quarta linha criamos uma lista com valores crescendo exponencialmente.
A função plot cria uma linha usando as coordenadas das variáveis x e y.
E por fim a função show monstra o gráfico.
O módulo matplotlib é desenvolvido, exclusivamente para plotagem (desenho de gráficos) e só. Se você quiser acessar os valores de um banco de dados e criar um gráfico, você vai precisar de outros módulos. Mais por sorte a linguagem python é muito popular e tem muitos módulos para acessar bancos de dados e fazer muito mais.