Transformar Lista em DataFrame Python: Um Guia Prático

transformar lista em dataframe python

Antes de tudo, se você é um entusiasta de Python ou trabalha com análise de dados, provavelmente já se deparou com a necessidade de transformar lista em dataframe python. Além disso, o pandas, uma das bibliotecas mais populares para manipulação e análise de dados em Python, oferece uma solução simples e eficiente para realizar essa tarefa. Neste artigo, vamos explorar passo a passo como transformar lista em dataframe python, facilitando a análise e a manipulação de dados em suas atividades de programação.

1. O que é um DataFrame?

Antes de mergulharmos no processo de conversão de listas, é importante entender o que é um DataFrame. Além disso, em essência, um DataFrame é uma estrutura de dados tabular semelhante a uma planilha do Excel, composta por colunas e linhas. Ele permite organizar e armazenar dados de forma organizada e eficiente, facilitando a análise e manipulação dos mesmos.

2. Introdução à Biblioteca Pandas

Antes de mais nada, para realizar a conversão de lista em DataFrame, vamos utilizar a biblioteca pandas. Além disso, caso ainda não a tenha instalada, você pode fazê-lo através do comando:Copy codepip install pandas
Agora, vamos importar o pandas para começar a trabalhar com a conversão.pythonCopy codeimport pandas as pd

3. Convertendo uma Lista Simples em DataFrame

Em primeiro lugar, vamos iniciar convertendo uma lista simples em DataFrame. Além disso, suponha que temos uma lista de nomes de frutas e queremos transformá-la em um DataFrame.

# Lista de frutas
frutas = ['maçã', 'banana', 'laranja', 'uva', 'manga']

Convertendo para DataFrame

df_frutas = pd.DataFrame(frutas, columns=['frutas'])

print(df_frutas)

4. Convertendo uma Lista de Listas em DataFrame

Principalmente, além de listas simples, é comum lidarmos com listas de listas em análise de dados. Além disso, nesse cenário, cada lista interna representa uma linha no DataFrame. Vamos ver como fazer essa conversão.

# Lista de listas
dados = [
['João', 25, 'Desenvolvedor'],
['Maria', 30, 'Analista'],
['Pedro', 22, 'Engenheiro']
]

Convertendo para DataFrame

colunas = ['Nome', 'Idade', 'Cargo']
df_dados = pd.DataFrame(dados, columns=colunas)

print(df_dados)

5. Convertendo um Dicionário em DataFrame

Outra maneira comum de representar dados é através de dicionários. Com pandas, é possível converter um dicionário diretamente em um DataFrame.

# Dicionário de dados
dados = {
'Nome': ['João', 'Maria', 'Pedro'],
'Idade': [25, 30, 22],
'Cargo': ['Desenvolvedor', 'Analista', 'Engenheiro']
}

Convertendo para DataFrame

df_dados = pd.DataFrame(dados)

print(df_dados)

6. Trabalhando com Dados Faltantes (NaN)

# Dicionário de dados com valores faltantes
dados = {
'Nome': ['João', 'Maria', None],
'Idade': [25, None, 22],
'Cargo': ['Desenvolvedor', 'Analista', 'Engenheiro']
}

É comum que os dados que você esteja trabalhando tenham valores faltantes. Além disso, o pandas trata esses valores como NaN (Not a Number). Vamos ver como lidar com eles.

Convertendo para DataFrame

df_dados = pd.DataFrame(dados)

Preenchendo valores faltantes com 0

df_dados = df_dados.fillna(0)

print(df_dados)

7. Criando um DataFrame a partir de uma Lista de Objetos

class Pessoa:
def init(self, nome, idade, cargo):
self.nome = nome
self.idade = idade
self.cargo = cargo

Em muitos casos, você pode ter uma lista de objetos customizados e deseja criar um DataFrame com base nesses objetos. Vamos ver como fazer isso.

Lista de objetos Pessoa

pessoas = Pessoa('João', 25, 'Desenvolvedor'), Pessoa('Maria', 30, 'Analista'), Pessoa('Pedro', 22, 'Engenheiro')

Convertendo para DataFrame

dados = {
'Nome': [pessoa.nome for pessoa in pessoas],
'Idade': [pessoa.idade for pessoa in pessoas],
'Cargo': [pessoa.cargo for pessoa in pessoas]
}

df_pessoas = pd.DataFrame(dados)

print(df_pessoas)

8. Indexando um DataFrame

# Dados de exemplo
dados = {
'Nome': ['João', 'Maria', 'Pedro'],
'Idade': [25, 30, 22],
'Cargo': ['Desenvolvedor', 'Analista', 'Engenheiro']
}

Ao criar um DataFrame, é possível especificar uma coluna para ser o índice das linhas. Isso facilita o acesso aos dados de maneira mais eficiente.

Convertendo para DataFrame com ‘Nome’ como índice

df_dados = pd.DataFrame(dados, index=dados['Nome'])

print(df_dados)

Monitor Gamer AOC LEGEND 27 240Hz 0,5ms, Preta/Vermelho, MEDIO, C27G2ZE

Amazon.com.br

Monitor Gamer Curvo Samsung Odyssey 27" WQHD, 240Hz, 1ms,Plataforma Tizen™, HDMI, Display Port, USB,com alto falante, Bluetooth, Freesync Premium Pro, com ajuste de altura, preto, série G6

Amazon.com.br

Monitor LG UltraGear 27GN750-27" IPS Full HD, 240Hz, 1ms (GtG), NVIDIA G-Sync, HDMI, USB 3.0 e Ajustes de Inclinação, Preto

Amazon.com.br

9. Exportando o DataFrame para CSV

Antes de tudo, após manipular e analisar os dados no DataFrame, é comum querer salvar o resultado em um arquivo para uso posterior. Além disso, o pandas permite exportar o DataFrame para um arquivo CSV facilmente.

# DataFrame de exemplo
dados = {
'Nome': ['João', 'Maria', 'Pedro'],
'Idade': [25, 30, 22],
'Cargo': ['Desenvolvedor', 'Analista', 'Engenheiro']
}

df_dados = pd.DataFrame(dados)

Exportando para um arquivo CSV

df_dados.to_csv('dados.csv', index=False)

10. Importando Dados de um Arquivo CSV para um DataFrame

Antes de mais nada, agora que você já sabe como exportar, é importante saber como importar dados de um arquivo CSV para um DataFrame.pythonCopy code# Importando dados de um arquivo CSV para um DataFrame

df_dados = pd.read_csv('dados.csv')
print(df_dados)

lista em dataframe python

11. Conclusão

Portanto, transformar lista em dataframe python usando a biblioteca pandas é uma tarefa fundamental para qualquer profissional que lida com análise de dados. Em suma, neste artigo, exploramos diversas formas de realizar essa conversão, incluindo listas simples, listas de listas, dicionários e até mesmo objetos personalizados. Além disso, aprendemos a lidar com dados faltantes e a exportar/importar DataFrames para arquivos CSV.Se você deseja aprimorar suas habilidades em análise de dados e manipulação de DataFrames, continue praticando e explorando a documentação oficial do pandas, que é uma excelente fonte de informações.

FAQs (Perguntas Frequentes)

1. O que é um DataFrame em Python?

Um DataFrame é uma estrutura de dados tabular bidimensional da biblioteca pandas em Python, que se assemelha a uma planilha do Excel, composta por colunas e linhas.

2. Como instalar a biblioteca pandas?

Você pode instalar a biblioteca pandas usando o gerenciador de pacotes pip, com o seguinte comando:Copy codepip install pandas

3. Como lidar com valores faltantes em um DataFrame?

Você pode usar o método fillna() para preencher valores faltantes (NaN) com um valor específico ou usar o método dropna() para remover linhas com valores faltantes.

4. Como exportar um DataFrame para um arquivo CSV?

Você pode usar o método to_csv() do pandas para exportar um DataFrame para um arquivo CSV. Por exemplo:perlCopy codedf.to_csv(‘dados.csv’, index=False)

5. Como importar dados de um arquivo CSV para um DataFrame?

Você pode usar o método read_csv() do pandas para importar dados de um arquivo CSV para um DataFrame. Por exemplo:bashCopy codedf = pd.read_csv(‘dados.csv’)

Prof. Eduardo H Gomes
Prof. Eduardo H Gomes

Mestre em Engenharia da Informação, Especialista em Engenharia da Computação, Cientista da Computação, Professor de Inteligência Artificial, 18 anos de docência no Ensino Superior. Apaixonado por Surf, Paraglider, Mergulho livre, Tecnologia, SEO, Banco de Dados e Desenvolvimento Web.