IA nos Projetos

Como usamos dados oficiais, LSTM e regras de qualidade para gerar carteiras de apostas — sem promessas de acerto.

Objetivo (com transparência)

Loterias são eventos aleatórios: não existe “garantia” e não prometemos acertos. Nosso foco é outro: aplicar engenharia de dados e um modelo de apoio (LSTM) para organizar escolhas, reduzir redundância entre jogos e aumentar a qualidade do conjunto final com regras, validações e rastreabilidade.

Em um bolão, a diferença prática não é “adivinhar o sorteio”, e sim montar um portfólio de apostas com diversidade, governança e menor risco de repetir padrões fracos — algo que “surpresinhas” e aleatoriedade pura não controlam.

Metodologia (fases do script)

O pipeline é dividido em fases, com artefatos e logs a cada etapa — para que tudo seja auditável.

  1. Coleta e versionamento do histórico: download do XLS oficial e preservação de versões (evita “dados tortos” e facilita auditoria).
  2. Fase 1 — Engenharia de dados (LSTM-ready): validações, ordenação temporal, criação de features e janelas (LOOK_BACK) para prever o próximo concurso.
  3. Fase 2/3 — Treino e seleção do modelo: LSTM com atenção, tuning de hiperparâmetros, perdas/ponderações para desbalanceamento e seleção do melhor checkpoint (com logs e métricas).
  4. Fase 4 — Geração das apostas: previsão → ranking Top‑N → montagem de subgrupos e aplicação de regras (fixas, blocos, vizinhos, bloqueios, sobreposição) → exportação em CSV e, opcionalmente, Google Sheets.

Fase 1 — Preparação dos dados (o que o modelo “enxerga”)

Para cada concurso, geramos um vetor de entrada com sinais que combinam histórico e tempo:

Saídas da fase: X_train/X_val/y_train/y_val (NPY) + fase1_output.json com schema, parâmetros e logs.

Fase 2/3 — Construção do modelo (LSTM + Atenção)

O modelo é multi‑rótulo: ele produz uma probabilidade para cada dezena (1..60), com saída sigmoid (não “escolhe” um único número).

Saída da fase: um checkpoint .keras que a Fase 4 consome diretamente.

Fase 4 — Estratégias de geração de sequências (com regras)

Em vez de “uma aposta”, geramos um conjunto grande com diversidade controlada. As principais estratégias são:

Ao final, exportamos CSV unificado e logs detalhados; opcionalmente, sincronizamos com Google Sheets para conferência e autopreenchimento.

Regras de qualidade (o “filtro”)

Exemplo prático (Mega‑Sena)

Suponha que o bolão precise de 120 jogos de 6 dezenas. A Fase 4 faz, em alto nível:

  1. Carrega o modelo .keras e gera a previsão para o próximo concurso (probabilidade por dezena).
  2. Define um pool Top‑N (por exemplo Top‑35) e cria subgrupos com políticas de fixas (ex.: uma fixa Top‑N exclusiva por lote).
  3. Gera jogos por amostragem ponderada e/ou por blocos, aplica “vizinhos” (grade 6×10) quando configurado.
  4. Rejeita candidatos que violam regras (histórico, sobreposição, exclusões) até fechar a quantidade.
  5. Exporta um CSV unificado e registra tudo em log (incluindo fixas, vizinhos aplicados e motivos de rejeição).

Resultados e qualidade dos dados

Por que isso importa

Não é “mágica” nem promessa de acerto. É engenharia aplicada: modelo + regras + validações que buscam consistência na alocação das apostas, com transparência e reprodutibilidade.

Em resumo: não prometemos resultados, mas entregamos um processo mais profissional do que “surpresinhas” — com dados oficiais, modelo de apoio, filtros de qualidade e rastreabilidade.

Entrar na Comunidade
Perguntas Frequentes
⬅️ Voltar