Data Viking

Data Viking

Compartilhar

Escola de Programação e Tecnologia

27/03/2026

🚀 Que aula foi essa ontem?!

Começamos o curso Análise de Dados na Prática com Databricks com um desafio real: trabalhar com microdados do ENAMED — e sim, já começamos lidando com dezenas de arquivos de dados na prática 👀🔥

Foi mão na massa desde o início:

📊 explorando dados reais

⚙️ entendendo o ambiente do Databricks

🧠 pensando como quem resolve problema de negócio

E isso foi só a primeira aula…

Ainda vem muita coisa:

👉 Pandas na prática

👉 PySpark para escala

👉 mais cases reais

💡 Se você ainda não se inscreveu, aproveita que ainda dá tempo de acompanhar as próximas aulas e acessar o conteúdo

Todas as aulas do curso ficam gravadas 🎥

E o melhor: o acesso é vitalício ✅

🔗 Garanta sua vaga:

https://www.sympla.com.br/evento-online/analise-de-dados-na-pratica-numpy-pandas-e-pyspark-no-databricks/3322581

Photos from Data Viking's post 24/03/2026

Pessoal, recebemos muitas perguntas sobre migrar para a cloud.

Então pensamos em uma arquitetura simples usando o caso real que compartilhamos: o RH da Ana, 200 colaboradores, saindo do Excel.

Antes de mais nada, esse é um caso de estudo com uma hipótese real - fizemos algo mais simples para demostrar: Sem rodeios.

Fluxo completo na AWS ficou assim:

Excel → S3 → Glue Job → Glue Catalog → Athena → Power BI

E o custo disso rodando todo dia?

Em torno de US$ 2 por dia.

A cloud não é cara. O que custa é a desorganização que você carrega para dentro dela.

Gostou de exemplo? Comenta ai 💬

Photos from Data Viking's post 23/03/2026

A Ana do RH vive apagando incêndio no Excel.🔥

Já pararam para pensar, que há empresas/áreas que ainda rodam 100% da sua operação em Excel?!

Explica como colocar uma IA nesse processo?
Vai subir 10 arquivos de Excel com 200MB cada um todos os dias no ChatGPT?
>

Antes de pensarmos em IA, precisamos criar uma base de dados estruturada.

Pensamos mais o menos assim nessa situação:
- Centralizar as planilhas em um Data Warehouse
- Criar um pipeline integrando RH e Financeiro
- Construir dashboards que qualquer gestor acessa
- Só então criamos um Agente de IA para responder sobre contratações, custos e desligamentos

Assim temos:
✓ Turnover por área em tempo real
✓ Forecast de contratações integrado ao budget
✓ Relatório que levava dias: agora 5 minutos
✓ Base pronta para os primeiros modelos de ML

IA não é o começo da jornada.
É a consequência de quem fez o dever de casa com dados.

Concorda ou Discorda?

Photos from Data Viking's post 03/03/2026

Vejam o novo curso que preparamos para vocês 🤩

📌 Análise de Dados na Prática: Numpy, Pandas e PySpark no Databricks

Quer aprender análise de dados do jeito que o mercado exige?
Vamos trabalhar com dados reais e públicos , construindo projetos práticos do zero 🚀

🧠 Numpy
🐼 Pandas
⚡ PySpark no Databricks
📊 Projetos aplicados
📅 Início: 26/03
🎥 Serão 3 encontros ao vivo
👨🏻‍💻 Ministrado pelo prof. Lucas Calmon .dados
• PhD candidate em Economia
• Founder DataV
• Cientista de Dados

🚀 1º lote promocional: R$ 74,90
Válido apenas para os 30 primeiros inscritos.

🎟️ Garanta sua vaga:
https://www.sympla.com.br/evento-online/analise-de-dados-na-pratica-numpy-pandas-e-pyspark-no-databricks/3322581

⚠️ Assinantes da plataforma VikingClass não precisam comprar ingresso!
O acesso será enviado diretamente por e-mail.

Quem quer sair da teoria e partir pra prática? 👊

24/02/2026

Ciência de Dados em Mineração ⛏️🪙
Projeto novo 🎉

Utilizamos dados da Chilean Copper Commission e a cotação do cobre para investigar uma pergunta interessante:

O maior produtor de cobre do mundo realmente consegue influenciar o preço do metal?

Spoiler: considerando todo o período analisado, não identificamos relação estatística relevante. Mas em momentos específicos — como greves e crises — o cenário muda.

Montamos um grid com 5 visões analíticas:

1️⃣ Série temporal: produção (ton) vs preço do metal

2️⃣ Dispersão: a produção explica o preço?

3️⃣ Correlação com lags: efeito defasado até 6 meses

4️⃣ Mapa: concentração geográfica do cobre chileno

5️⃣ Ranking: maiores minas em produção

Conclusão: o Chile opera majoritariamente como price taker. Apenas em eventos extremos a produção demonstra impacto no preço.

🔗 Dados: Cochilco + Yahoo Finance

🛠️ Python + Plotly

Comenta aqui o que acharam👊




23/02/2026

Top 100: os cargos com os maiores salários no estado de SP em 2025

Lendo a TIMES BRASIL – Licenciado Exclusivo CNBC nos deparamos com uma matéria bem interessante sobre os maiores salários de admissão em São Paulo em 2025, com base nos dados do CAGED.

Como já era esperado, cargos de diretoria concentram as maiores remunerações. Diretorias ligadas a crédito, riscos, produtos bancários, tecnologia da informação e P&D aparecem no topo do ranking, com salários que superam os R$ 40 mil mensais.

Porém…

O cargo de Cientista de Dados aparece na 94ª posição, com salário médio de admissão em torno de R$ 12,4 mil. 😄

Agora, quando olhamos pela ótica das habilidades, o cenário muda.

Grande parte dos cargos que compõem esse ranking utiliza, direta ou indiretamente, fundamentos de ciência de dados:

- uso intensivo de dados;

- construção de indicadores;

- análise estatística;

- modelos preditivos;

- entre outros.

Ou seja, a ciência de dados está amplamente presente ao longo da lista — ainda que não necessariamente no nome do cargo.

Nesse contexto, os dados deixam de ser apenas um diferencial e passam a atuar como infraestrutura estratégica para as organizações, sustentando decisões de crédito, risco, investimentos, operações, tecnologia e estratégia.

Então… vamos estudar Data Science? 🧠

O que vocês acham? 🤔



>

Este ranking é baseado nos dados do CAGED e tem caráter informativo. Reflete salários médios de admissão em um recorte específico de tempo e não deve ser interpretado como referência única ou definitiva sobre remuneração, carreira ou valorização profissional.

Photos from Data Viking's post 10/02/2026

📊 Correlação não é causalidade

Na última sexta (06/02), o prof. .dados apresentou o webinar “Inferência Causal: uma breve introdução”, mostrando como identificar relações de causa e efeito usando dados.

Nos slides deste post você vê alguns destaques — e a aula completa já está disponível para assinantes na plataforma.

🚀 Quer acesso a esse e a outros conteúdos avançados de dados e IA?

Assine a DataV e comece agora.

04/02/2026

🔍 Inferência Causal: uma breve introdução
Você já se perguntou como ir além da correlação e realmente entender melhor os dados?

No dia 06/02, às 20h , participe do nosso webinar gratuito sobre Inferência Causal e descubra como transformar análises em decisões mais confiáveis e estratégicas.

🚀 O que você vai ver:

O que é inferência causal (sem dor de cabeça 😄)

Por que ela é tão importante em negócios e ciência de dados

Exemplos práticos

👨‍💻 Com quem?
Ronisson Lucas, Data Scientist no setor financeiro, compartilhando experiência prática e insights do mundo real.

📅 Save the date:
🗓 06/02
⏰ 20h
📍 Online

Se você trabalha com dados, analytics ou toma de decisões baseadas em números, esse webinar é pra você.
👉 Garanta sua presença entrando no grupo da nossa comunidade: https://chat.whatsapp.com/GIVq2fsVAhUKCpoZtSk0AI

03/02/2026

🚀 Quando o aprendizado vira projeto real, o resultado aparece.

O Marcus compartilhou que, a partir de um dos projetos da DataV conseguiu desenvolver a própria solução — aplicando na prática os conceitos ensinados.

Esse é o nosso foco: ir além da teoria e capacitar você para construir projetos aplicáveis ao mundo real, com impacto direto na sua carreira.

Parabéns pelo projeto, Marcus! 👏
Seguimos juntos na jornada de aprendizado em dados e IA. 💡📊

Photos from Data Viking's post 27/01/2026

Novo projeto 🤩

Na última semana apresentamos a PRÉVIA da nova Escola de Pesquisa Econômica e Financeira da DataV.

Essa nova modalidade dentro da DataV foi criada para que os alunos desenvolvam projetos reais, com desafios de mercado, em um ambiente que simula a dinâmica corporativa de verdade.

O fluxo do projeto é estruturado em etapas:

- Definição e validação de hipóteses

- Modelagem de dados

- Construção de um produto de dados

- Deploy/Apresentação final

Estrutura do programa:

⏳ 12 semanas de duração (inspirado em ciclos de release)

📍 Checkpoints semanais

🧱 Estruturas e frameworks fixos de trabalho

Áreas dos cases:

* Seguros

* Varejo

* Mercado financeiro

* Energia

Com isso, os participantes poderão:

- Aplicar técnicas de ciência de dados de forma integrada

- Construir um portfólio estruturado e competitivo

- Aprender por meio de projetos reais, simulando a realidade corporativa

E aí, o que achou? 👀

Essa semana apresentaremos a versão final.





20/01/2026

Estamos tentando criar um modelo preditivo para a B3 📈 — parte 7

Na análise do mapa, está a Relação da Petrobras com petroleiras globais.

Testamos a hipótese de quais ações têm maior relação com a Petrobras. A ideia é descobrir quando um ativo sobe, se o outro tende a subir também, em diferentes horários mundiais.

Calculamos diversas métricas: Correlações, R², Concordância, Beta, Estabilidade e outros.

No mapa deixamos apenas 3 métricas por enquanto porque estamos testando a melhor visualização (correlação, beta (sensibilidade), concordância de direção)

Insights:

ExxonMobil (EUA): 61% de correlação, 74% de concordância → maior influência

bp (Reino Unido): Beta mais estável (confiança 61%)

Ásia: Sinais fracos e instáveis → descartadas para modelo

Timing natural: Ásia (abertura) → Europa → EUA → Brasil (fechamento)

Agora estamos chegando num MVP bem legal, que pode auxiliar em questões estratégicas de:

1. Timing de entrada/saída

2. Hedge internacional com petroleiras globais

3. Antecipação de movimentos baseado em mercados que abrem antes

4. Diversificação inteligente (evitar exposição redundante)

Vamos expandir para outros setores (mineração, bancos, varejo) e criar um dashboard de monitoramento em tempo real.

O que acham? 🤔





Quer que seu escola/colégio seja a primeira Escola/colégio em Salvador?

Clique aqui para requerer seu anúncio patrocinado.

Localização

Categoria

Telefone

Endereço


Rua Professor Severo Pessoa
Salvador, BA
40210700