matheus portfolio

Postagens

[ML] Regressão Linear Consumo de Cerveja

junho 17, 2025

Prevendo o Consumo de Cerveja com Regressão Linear: Uma Aplicação Prática em São Paulo Link do projeto: github Código documentado: link Neste projeto, exploramos uma aplicação real de Machine Learning utilizando a técnica de Regressão Linear para prever o consumo de cerveja com base em variáveis climáticas e temporais. O objetivo é construir um modelo preditivo capaz de estimar o volume médio de cerveja consumido em determinado dia, considerando fatores como temperatura, precipitação e se é final de semana. Os dados utilizados foram coletados em São Paulo, mais especificamente em uma área universitária, onde o público jovem tende a apresentar hábitos de consumo bastante influenciados por clima e calendário. A base de dados inclui as seguintes variáveis: Temperatura média, mínima e máxima (°C) Chuva (mm) Indicador de final de semana (1 para sim, 0 para não) Consumo de cerveja (em litros), que é a variável-alvo Juntamente a análise exploratória, seguimos com grá...

Leia mais

[ML] Modelo de Classificação Binária SP500

junho 17, 2025

Prevendo direção do mercado financeiro Link do projeto: pasta Arquivo ipynb: código documentado Neste projeto, desenvolvemos um modelo de aprendizado de máquina usando o algoritmo KNN (k-vizinhos mais próximos) para prever a direção do mercado financeiro — se ele irá subir ("Up") ou cair ("Down") — com base no comportamento dos retornos dos últimos dias e o volume negociado. Etapas realizadas : Preparação dos dados: Carregamos um conjunto de dados históricos do mercado, contendo retornos de até 5 dias anteriores, o volume de ações negociadas e a direção diária do mercado. Divisão em treino e teste: Separamos os dados em 80% para treino e 20% para teste, garantindo que pudéssemos avaliar o modelo com dados nunca vistos por ele. Normalização: Aplicamos a padronização (centralização e escalonamento) apenas às variáveis numéricas, para que todas tivessem a mesma importância no modelo. Criação e validação do modelo: Usamos validação cruzada repetida com várias combinaç...

Leia mais

[ML] Podelo preditivo: Previsão de preço de uma pizza

junho 09, 2025

Link do projeto: Previsão Preços Pizza Este é um projeto simples, mas que possui fundamentos básicos para a regressão linear (envolvendo eixos x e y, com fortes implicações para previsão). Utilizamos uma base de dados simples, com duas colunas, diametro e preço. E para verificar se há correlação entre os dois elementos, criamos um gráfico para que isso fique claro: O que também pode ser verificado pela formula: preço = a + diametro * b Por fim, executamos o modelo, e obtemos o valor do preço de acordo com o diâmetro escolhido:

Leia mais

[ML] Redução de Dimensionalidade usando PCA

junho 09, 2025

Importância do PCA A r edução de dimensionalidade utilizando o algoritmo PCA (Principal Component Analysis) é uma técnica usada para simplificar conjuntos de dados com muitas variáveis (dimensões), mantendo o máximo de informação possível. Em termos simples : O PCA transforma os dados originais em um novo conjunto de variáveis chamadas componentes principais , que são combinações lineares das variáveis originais. Esses componentes são ordenados de forma que: - o primeiro componente explique a maior parte da variabilidade nos dados; - o segundo componente explique a maior parte da variabilidade restante , e assim por diante. Assim é possível manter apenas os primeiros N componentes , reduzindo a dimensionalidade com perda mínima de informação. Vantagens da utilização do PCA Reduz o ruído e a complexidade dos dados. Facilita visualizações de dados originalmente com muitas variáveis. Melhora desempenho de modelos de machine learning , especialmente...

Leia mais

TRABALHO DE CONCLUSÃO DE CURSO - INOVAÇÃO E O MERCADO DE TRABALHO: UMA ANÁLISE PARA O BRASIL

junho 05, 2025

No início de 2021, durante o curso de Economia, na Universidade Estadual de Montes Claros, ocupava boa parte do meu tempo em leituras que pudessem dar suporte ao meu trabalho de conclusão de curso, que era algo como "O impacto dos times de futebol na economia regional". A apresentação do projeto era dividido em três partes, um a cada semestre, sendo a última a responsável pela atribuição da nota final (e consequentemente a aprovação como bacharel do curso). Enfrentei diversas dificuldades nessa pesquisa, uma vez que as equipes de futebol são bastante rigorosas no que diz respeito a compartilhar informação com o público. Com os escassos dados ao meu dispor, utilizei a ferramenta RStudio para tentar tirar conclusões a partir da regressão linear, ou econometria (como é chamada na área da Economia, em poucas palavras), tentando verificar a hipótese de que um time de futebol em uma região e uma economia regional saudável possuem correlação positiva, porém os resultados eram insati...

Leia mais

[SQL] BANCO DE DADOS DE INSTITUIÇAO FINANCEIRA

maio 20, 2025

Este projeto se trata da criação de um banco de dados de uma instituição financeira fictícia, com um escopo simplificado que, mais adiante, servirá de material para a criação de uma análise a respeito dos dados (fictícios) que alimentam nosso banco. O primeiro passo, antes mesmo de tocar em códigos, para a criação de um BD é a visualização relacional, ou seja, como as entidades (tabelas) se relacionam entre si. A partir dela, saberemos exatamente qual caminho nosso futuro código tomará. (clique na imagem para ampliar) A TB_PESSOA é a tabela central do esquema, uma vez que todas se ligam a ela, direta ou indiretamente. No nosso caso, a tabela tem somente e-mail e telefone, pois essas são características comuns às pessoas física e jurídicas. A TB_PESSOA_FISICA tem as informações que, junto com a TB_PESSOA, formam uma pessoa física (nome, cpf e data de nascimento); Ao mesmo tempo, a TB_PESSOA_JURIDICA , junto com a TB_PESSOA, forma o que chamamos de pessoa jurídica, que possui cnpj, ent...

Leia mais

Pesquisar este blog

matheus portfolio

Postagens

Comportamento do consumidor - habito de compras

[ML] Regressão Linear Consumo de Cerveja

[ML] Modelo de Classificação Binária SP500

[ML] Podelo preditivo: Previsão de preço de uma pizza

[ML] Redução de Dimensionalidade usando PCA

TRABALHO DE CONCLUSÃO DE CURSO - INOVAÇÃO E O MERCADO DE TRABALHO: UMA ANÁLISE PARA O BRASIL

[SQL] BANCO DE DADOS DE INSTITUIÇAO FINANCEIRA