Meus Projetos

Vitrine das soluções de dados, análises estatísticas e automações que desenvolvi.

Plataforma de Dados com IA (DADOSFERA)
# PoC Escalável - Ingestão e Enriquecimento de Catálogo com GenAI
                    
import dadosfera
from openai import OpenAI

def process_ecommerce_catalog(dataframe):
    # Processando 1.4M de registros através das camadas RAW -> Trusted -> Curated
    catalog_curated = dataframe.filter(["product_id", "raw_description"])

    # Enriquecimento Semântico via LLM
    client = OpenAI(api_key="sk-...")

    return enrich_metadata_with_llm(client, catalog_curated)
                  
Fevereiro de 2026

Case Técnico: Plataforma de Dados com IA (DADOSFERA)

Situação

Necessidade de estruturar uma Prova de Conceito (PoC) para um e-commerce contendo volumetria expressiva de 1,4M de registros, sem taxonomia definida no catálogo.

Ação

Implementação de arquitetura moderna de dados em camadas (RAW à Curated) dentro do ecossistema Dadosfera SaaS, utilizando pipelines Python integrados à API da OpenAI para categorização semântica automática.

Resultado

Criação de um catálogo enriquecido e um Data App interativo em Streamlit/Metabase, provando a viabilidade de tagueamento inteligente em escala.

Análise de Promoções (JAAR CONSULT)
Março de 2026

Case Técnico: Análise de Promoções (JAAR CONSULT)

Situação

A diretoria comercial não conseguia rastrear quais campanhas promocionais de varejo de fato geravam margem ou quais canibalizavam o lucro operacional.

Ação

Modelagem dimensional completa baseada em Star Schema, construção de cálculos complexos e contextuais em DAX para isolar o efeito preço e implementação de Row-Level Security dinâmico.

Resultado

Entrega de um ecossistema analítico de ponta a ponta que revelou gargalos crônicos na margem, viabilizando ajustes preventivos nas campanhas subsequentes.

Otimização ETL e Análise Financeira (VENA)
-- Modelagem e Fechamento de DRE no SQLite via SQL Avançado

WITH RECURSIVE dre_tree AS (
    SELECT id, conta, pai_id, 0 as nivel
    FROM plano_contas
    UNION ALL
    SELECT c.id, c.conta, c.pai_id, t.nivel + 1
    FROM plano_contas c
    JOIN dre_tree t ON c.pai_id = t.id
)
SELECT 
    t.conta,
    SUM(f.valor) as valor_total,
    (SUM(f.valor) / (SELECT SUM(valor) FROM fatos WHERE conta_id = 'RECEITA_BRUTA')) * 100 as analise_vertical
FROM dre_tree t
LEFT JOIN lancamentos_fatos f ON t.id = f.conta_id
GROUP BY t.conta;
Dezembro de 2024

Case Técnico: Otimização ETL e Análise Financeira (VENA)

Situação

Existência de gargalos críticos, dados truncados e quebras constantes em pipelines legados construídos originalmente no Pentaho PDI.

Ação

Realização de auditoria técnica minuciosa nos fluxos, seguida por uma refatoração integral utilizando scripts Python estruturados com Pandas e SQL para consolidação de relatórios de DRE corporativos.

Resultado

Garantia de estabilidade total na carga de dados e viabilização das análises horizontal e vertical financeiras via SQLite, prontas para consumo executivo.

ETL com Acidentes de Trabalho (CATWEB)
Agosto de 2025

Projeto: ETL com Acidentes de Trabalho (CATWEB)

Situação

Bases governamentais de Comunicação de Acidentes de Trabalho (CAT) altamente corrompidas, contendo strings desalinhadas e falta de padronização estrutural.

Ação

Desenvolvimento de um robusto ecossistema de Data Quality utilizando expressões regulares (Regex) in Python para higienização, mapeamento e modelagem dimensional alinhada aos layouts oficiais do eSocial.

Resultado

Saneamento completo do histórico bruto e publicação de um painel estratégico no Power BI focado em engenharia de segurança e compliance.

Análise de Profissionais STEAM (FIESC)
Março de 2023

Case Técnico: Análise de Profissionais STEAM (FIESC)

Situação

Necessidade do Observatório do Trabalho de mapear os vetores de atração, comportamento salarial e rotatividade na indústria para as áreas de Engenharia e Tecnologia.

Ação

Extração e mineração avançada de microdados públicos do Novo CAGED utilizando Python para testar hipóteses estruturais sobre retenção de capital humano e evasão de mão de obra em Santa Catarina.

Resultado

Geração de insumos preditivos e descritivos profundos consolidados em relatórios visuais dinâmicos para subsidiar tomadas de decisões governamentais e empresariais no estado.

Coleta e Análise de Dados Públicos (COMEX)
# Data Scraping Automatizado de Indicadores Econômicos Governamentais

import requests
from bs4 import BeautifulSoup
import pandas as pd

def scrape_comex_stat_portal():
    url = "https://www.gov.br/produtividade-e-comercio-exterior/dados-abertos"
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'html.parser')
    
    # Localização dinâmica dos arquivos zip de importação/exportação
    download_links = [a['href'] for a in soup.find_all('a', href=True) if '.csv' in a['href']]
    return download_links
Maio de 2025

Workshop: Coleta e Análise de Dados Públicos (COMEX)

Situação

Falta de barramento ou APIs públicas consolidadas para extração automatizada de métricas e volumes nacionais agregados de Importações e Exportações.

Ação

Construção de uma automação ponta a ponta (Web Scraping) em Python utilizando as bibliotecas Requests e BeautifulSoup para minerar os portais federais e mapear os arquivos base.

Resultado

Desenvolvimento de um pipeline de ingestão programática estável rodando em Google Colab, reduzindo o tempo de coleta manual de dados econômicos a zero.