Postagens

Comportamento do consumidor - habito de compras

O Conjunto de Dados sobre Comportamento do Consumidor e Hábitos de Compras oferece a possibilidade de insights abrangentes sobre as preferências, tendências e padrões dos consumidores em locais dos Estados Unidos durante suas experiências de compras. Este conjunto de dados abrange uma variedade de variáveis, incluindo informações demográficas, histórico de compras, preferências de produtos, frequência de compras e comportamento em geral.Dessa forma, objetiva-se explorar as complexidades dos processos de tomada de decisão do consumidor, afim de gerar insights a respeitos dos dados, podendo auxiliar as empresas na criação de estratégias de marketing direcionadas, na otimização de ofertas de produtos e no aprimoramento geral da satisfação do cliente. Link documentação:  Github

[ML] Regressão Linear Consumo de Cerveja

Imagem
Prevendo o Consumo de Cerveja com Regressão Linear: Uma Aplicação Prática em São Paulo Link do projeto:  github Código documentado:  link Neste projeto, exploramos uma aplicação real de Machine Learning utilizando a técnica de Regressão Linear para prever o consumo de cerveja com base em variáveis climáticas e temporais. O objetivo é construir um modelo preditivo capaz de estimar o volume médio de cerveja consumido em determinado dia, considerando fatores como temperatura, precipitação e se é final de semana. Os dados utilizados foram coletados em São Paulo, mais especificamente em uma área universitária, onde o público jovem tende a apresentar hábitos de consumo bastante influenciados por clima e calendário. A base de dados inclui as seguintes variáveis: Temperatura média, mínima e máxima (°C) Chuva (mm) Indicador de final de semana (1 para sim, 0 para não) Consumo de cerveja (em litros), que é a variável-alvo Juntamente a análise exploratória, seguimos com grá...

[ML] Modelo de Classificação Binária SP500

Imagem
Prevendo direção do mercado financeiro Link do projeto:  pasta Arquivo ipynb:  código documentado Neste projeto, desenvolvemos um modelo de aprendizado de máquina usando o algoritmo KNN (k-vizinhos mais próximos) para prever a direção do mercado financeiro — se ele irá subir ("Up") ou cair ("Down") — com base no comportamento dos retornos dos últimos dias e o volume negociado. Etapas realizadas : Preparação dos dados: Carregamos um conjunto de dados históricos do mercado, contendo retornos de até 5 dias anteriores, o volume de ações negociadas e a direção diária do mercado. Divisão em treino e teste: Separamos os dados em 80% para treino e 20% para teste, garantindo que pudéssemos avaliar o modelo com dados nunca vistos por ele. Normalização: Aplicamos a padronização (centralização e escalonamento) apenas às variáveis numéricas, para que todas tivessem a mesma importância no modelo. Criação e validação do modelo: Usamos validação cruzada repetida com várias combinaç...

[ML] Podelo preditivo: Previsão de preço de uma pizza

Imagem
 Link do projeto:  Previsão Preços Pizza Este é um projeto simples, mas que possui fundamentos básicos para a regressão linear (envolvendo eixos x e y, com fortes implicações para previsão). Utilizamos uma base de dados simples, com duas colunas, diametro e preço. E para verificar se há correlação entre os dois elementos, criamos um gráfico para que isso fique claro: O que também pode ser verificado pela formula: preço = a + diametro * b Por fim, executamos o modelo, e obtemos o valor do preço de acordo com o diâmetro escolhido:

[ML] Redução de Dimensionalidade usando PCA

Imagem
Importância do PCA A r edução de dimensionalidade utilizando o algoritmo PCA (Principal Component Analysis) é uma técnica usada para simplificar conjuntos de dados com muitas variáveis (dimensões), mantendo o máximo de informação possível. Em termos simples : O PCA transforma os dados originais em um novo conjunto de variáveis chamadas componentes principais , que são combinações lineares das variáveis originais. Esses componentes são ordenados de forma que: - o   primeiro componente explique a maior parte da variabilidade nos dados;  - o  segundo componente explique a maior parte da variabilidade restante , e assim por diante. Assim é possível  manter apenas os primeiros N componentes , reduzindo a dimensionalidade com perda mínima de informação. Vantagens da utilização do PCA Reduz o ruído e a complexidade dos dados. Facilita visualizações  de dados originalmente com muitas variáveis. Melhora desempenho de modelos de machine learning , especialmente...

TRABALHO DE CONCLUSÃO DE CURSO - INOVAÇÃO E O MERCADO DE TRABALHO: UMA ANÁLISE PARA O BRASIL

No início de 2021, durante o curso de Economia, na Universidade Estadual de Montes Claros, ocupava boa parte do meu tempo em leituras que pudessem dar suporte ao meu trabalho de conclusão de curso, que era algo como "O impacto dos times de futebol na economia regional". A apresentação do projeto era dividido em três partes, um a cada semestre, sendo a última a responsável pela atribuição da nota final (e consequentemente a aprovação como bacharel do curso). Enfrentei diversas dificuldades nessa pesquisa, uma vez que as equipes de futebol são bastante rigorosas no que diz respeito a compartilhar informação com o público. Com os escassos dados ao meu dispor, utilizei a ferramenta RStudio para tentar tirar conclusões a partir da regressão linear, ou econometria (como é chamada na área da Economia, em poucas palavras), tentando verificar a hipótese de que um time de futebol em uma região e uma economia regional saudável possuem correlação positiva, porém os resultados eram insati...

[SQL] BANCO DE DADOS DE INSTITUIÇAO FINANCEIRA

Imagem
Este projeto se trata da criação de um banco de dados de uma instituição financeira fictícia, com um escopo simplificado que, mais adiante, servirá de material para a criação de uma análise a respeito dos dados (fictícios) que alimentam nosso banco. O primeiro passo, antes mesmo de tocar em códigos, para a criação de um BD é a visualização relacional, ou seja, como as entidades (tabelas) se relacionam entre si. A partir dela, saberemos exatamente qual caminho nosso futuro código tomará. (clique na imagem para ampliar) A TB_PESSOA é a tabela central do esquema, uma vez que todas se ligam a ela, direta ou indiretamente. No nosso caso, a tabela tem somente e-mail e telefone, pois essas são características comuns às pessoas física e jurídicas. A TB_PESSOA_FISICA tem as informações que, junto com a TB_PESSOA, formam uma pessoa física (nome, cpf e data de nascimento); Ao mesmo tempo, a TB_PESSOA_JURIDICA , junto com a TB_PESSOA, forma o que chamamos de pessoa jurídica, que possui cnpj, ent...