Imagem de Esa Riutta por Pixabay |
O arquivo CSV é muito comum e utilizado, mas se compararmos esse arquivo com o gigante da Microsoft, o arquivo do Excel, não parece ser grande coisa. Em muitas pesquisas de consultoria, os resultados apontam que o Excel é uma das ferramentas mais críticas em muitas empresas. O Excel é muito utilizado nas empresas para a tomada de muitas decisões importantes.
E por isso a biblioteca pandas fornece métodos para poder manipular esses arquivos. Nesse tutorial vamos aprender como criar e ler arquivos do Excel com a biblioteca pandas.
Antes de continuarmos vamos precisar instalar os pacotes xlwt e openpyxl. Esses pacotes são necessários para podermos exportar o nosso dataframe para um arquivo xls e xlsx. Utilize o pip para instalar os dois pacotes: pip install openpyxl xlwt
.
Como ler e criar arquivos do Excel com pandas
O método que vamos utilizar, para criar um arquivo do excel, é o to_excel()
. O que precisamos fazer é criar um dataframe e chamar esse método. Veja um exemplo:
>>> import pandas as pd >>> nome = {'nome':['Fabiana', 'Diana', 'Amanda'], ... 'u_nome':['Ferreira', 'Lima', 'Saturno']} >>> dataframe = pd.DataFrame(nome) >>> dataframe.to_excel('dataframe.xls') >>> dataframe.to_excel('dataframe.xlsx')
Abrindo o arquivo, que acabamos de criar, o resultado deve ser igual a este:
Para ler o arquivo que criamos, e qualquer outro feito no Excel, utilizamos o método read_excel()
. Esse método precisa do complemento xlrd. Para baixo use o pip: pip install xlrd
.
>>> import pandas as pd >>> dataframe = pd.read_excel('dataframe.xls') >>> dataframe Unnamed: 0 nome u_nome 0 0 Fabiana Ferreira 1 1 Diana Lima 2 2 Amanda Saturno
Como o arquivo já tem uma coluna de índice, podemos especificar isso para o método read_excel()
, para evitar dados duplicados. Assim não teremos duas colunas de índice.
>>> dataframe = pd.read_excel('dataframe.xlsx', index_col=0) >>> dataframe nome u_nome 0 Fabiana Ferreira 1 Diana Lima 2 Amanda Saturno
Com esses exemplos aprendemos que podemos ler e criar arquivos do Excel com a biblioteca pandas. Com a instalação de poucos pacotes já podemos manipular o tipo de arquivo mais utilizados pelas empresas.
Referência:
Método DataFrame()
Método to_excel()
Método read_excel()
e como selecionar qual aba/pasta/sheet queremos ler ou nomear ao criar?
ResponderExcluir