IA na Prática
| UNIPAR Logo | Semana Acadêmica 2026
Minicurso Técnico-Prático

Inteligência Artificial
na Prática

LLMs, Engenharia de Prompt, Google AI Studio, segurança e o próximo salto dos agentes

📍 UNIPAR Francisco Beltrão 📅 Terça-feira, 02/06/2026

André Luis Finger Candido

29 anos | Consisa Sistemas

Trajetória Profissional

  • 8 anos de atuação sólida em desenvolvimento de software e infraestrutura.
  • Atuou como desenvolvedor nativo Delphi por 2 anos na Consisa Sistemas.
  • Atualmente focado em P&D de Inteligência Artificial Generativa aplicada à produção e aceleração de desenvolvimento.

Stack & Ferramentas de Domínio

Delphi C# Python Vue.js Xamarin PHP Flutter
Módulo 1

O Caminho até as LLMs

A transição tecnológica dos algoritmos baseados em regras rígidas e previsão estruturada para os modelos de fundação generativa em larga escala.

01

Previsão Estruturada

Estatística tradicional, models de regressão clássicos e busca de padrões fixos de forma determinista.

02

Deep Learning

Redes neurais profundas convolucionais (CNNs) e recorrentes (RNNs/LSTMs) mapeando sequências e visão.

03

Transformers

Modelos de linguagem auto-atentivos em larga escala que geram raciocínio emergente e síntese universal de mídias.

O Caminho até as LLMs - Etapa 1

Surgimento & Invernos da IA

50s
1940 - 1950

O Teste de Turing & Bases Teóricas

  • • Alan Turing publica "Computing Machinery and Intelligence" propondo a pergunta clássica: "Podem as máquinas pensar?".
  • • Formalização matemática inicial do que viria a ser o primeiro neurônio artificial (McCulloch & Pitts).
  • • Criação das bases computacionais teóricas focadas em computação de regras lógicas estruturadas.
Foco inicial: Lógica booleana e regras determinísticas.
80s
1970 - 1980

Os Invernos da IA (AI Winter)

  • • Ceticismo acadêmico decorrente de promessas não cumpridas e expectativas excessivas iniciais.
  • • Bloqueio dramático de financiamento militar e de pesquisa governamental global após relatórios críticos.
  • • Gargalo tecnológico severo: limitações severas de hardware (memória e CPU) e escassez generalizada de dados limpos.
Foco: Falta de escala impossibilitou soluções complexas.
O Caminho até as LLMs - Etapa 2

Cálculo Bruto & Deep Learning

90s
Ano 1997

Deep Blue & Força Bruta

  • • O supercomputador Deep Blue da IBM derrota o campeão mundial Garry Kasparov em um torneio oficial de Xadrez.
  • • Demonstração fantástica do poder da computação e de algoritmos do tipo força bruta com busca de caminhos (Minimax estruturado).
  • • Limite: O sistema era altamente especializado e desprovido de qualquer flexibilidade cognitiva real.
Método: Algoritmos de busca heuristicamente exaustivos.
10s
Anos 2010

Big Data, Deep Learning & GPUs

  • • Consolidação do Machine Learning tradicional e florescimento explosivo de redes neurais profundas (Deep Learning).
  • • O surgimento do ecossistema de dados em massa (Big Data / Web 2.0) e poder computacional paralelo massivo habilitado por GPUs.
  • • Vitórias revolucionárias em visão computacional (ex: marco histórico do ImageNet em 2012) e transcrição de áudio.
Infraestrutura: O casamento perfeito entre processamento e dados.
O Caminho até as LLMs - Etapa 3

Transformers & IA Generativa

17+
Ano 2017

A Revolução do Transformer

  • • Lançamento do revolucionário artigo científico "Attention Is All You Need" pelas equipes de engenheiros do Google.
  • • Mecanismo de Auto-Atenção (Self-Attention) derruba monólitos de processamento sequencial de texto anterior (LSTMs).
  • • Paralelização maciça em treinamento de redes, abrindo as portas para o desenvolvimento de modelos colossais.
Base: Fundamento absoluto de todas as LLMs pré-treinadas hoje.
20s
Anos 2020+

Modelos de Fundação & IA Generativa

  • • Disparada no volume de parâmetros sinápticos dos modelos (escala multi-bilionária) dando origem a habilidades emergentes não programadas.
  • • Lançamento explosivo do ChatGPT de consumo em larga escala, seguido pela explosão do ecossistema corporativo de APIs (Gemini, Claude).
  • • Transição para multimodalidade integrada nativa de vídeo/áudio e desenvolvimento ativo de agentes autônomos.
Futuro: Do text-completion ao raciocínio lógico autônomo.

Evolução do Paradigma da IA

Tradicional: Programação Rígida

Sistemas Fechados

Regras Estáticas & Heurísticas
  • Codificação estrita de caminhos lógicos (`if/else`) definida manualmente.
  • Especializados em classificar, rotular ou prever dados estruturados rígidos.
  • Completamente incapazes de criar, sintetizar ou gerar novos conteúdos inéditos.
Entrada Filtro Rígido Previsão
Estático
O Salto
Transformers Auto-Atenção
Generativo: Redes de Probabilidade

Modelos Vivos (LLMs)

Pesos Sinápticos Dinâmicos
  • Redes Neurais com auto-atenção profunda que capturam relações contextuais globais.
  • Predição estatística ultra-refinada do próximo token mais provável do contexto.
  • Capacidade de raciocínio lúdico, síntese e criação criativa de código, textos e mídias.
Contexto Distribuição Síntese
Fluido

Mercado Global de IA

Quatro principais frentes industriais de modelos de fundação de vanguarda

Google Gemini

  • >Multimodalidade nativa direta na arquitetura principal.
  • >Janela colossal de contexto de até 2M de tokens.
  • >Integração fluida nativa com todo o Google Workspace.
Foco Tecnológico

OpenAI GPT

  • >Referência comercial de adoção nos ecossistemas globais.
  • >Modelos avançados de raciocínio profundo da série o1.
  • >Grande portfólio de APIs comerciais para corporações de grande porte.
Parâmetro de Mercado

Anthropic Claude

  • >Líder em redação técnica impecável e geração de código preciso.
  • >Raciocínio analítico refinado com a família Claude 3.8 Sonnet.
  • >Alinhamento ético estrito via Constitutional AI nativo.
Refinamento Analítico

Open Source (Llama)

  • >Liderança ostensiva da Meta no fornecimento de pesos abertos.
  • >Capacidade total de self-hosting e privacidade ponta a ponta.
  • >Facilidade total de customização e ajuste fino de pesos.
Privacidade Total

O que é Multimodalidade?

A revolução sensorial: a diferença crucial entre sistemas unimodais e multimodais nativos

Unimodal (Texto Puro)

Canal Único e Linear

Primeira geração de modelos de linguagem de grande porte (LLMs convencionais).

  • Sem visão ou audição: Incapaz de processar capturas de tela, fotos ou arquivos de mídia diretamente.
  • Processamento serial: Depende de conversores externos de voz para texto (speech-to-text).
  • Falta de Contexto Sensorial: Limita a interpretação estrita a caracteres puros de teclado.
ENTRADA: "Texto" ➔ PROCESSAMENTO ➔ SAÍDA: "Texto"
📄 Texto 🖼 Imagem 🎙 Voz
Multimodal Nativo

Fusão Sensorial Completa

Modelos de nova geração (como Google Gemini 3.1 Pro e 3.5 Flash ou Anthropic Claude 3.8 Sonnet).

  • Cérebro Neural Unificado: Processa texto, imagens, códigos, áudios e vídeos diretamente na mesma arquitetura.
  • Visão Computacional Ativa: O agente "enxerga" códigos e designs anexados para depurar layouts pixel por pixel.
  • Conversação de Latência Nula: Interação de voz em tempo real diretamente processada pela rede sem intermediários.
ENTRADAS: [Texto + Voz + Imagem + Vídeo] ➔ REDE UNIFICADA
Módulo 2

Engenharia de Prompts

Aprenda a estruturar comandos eficientes de linguagem natural para guiar as IAs em tarefas complexas com total assertividade.

Persona Definida
Contextualização Estrita
Instrução Imperativa
Formatos de Saída

Anatomia de um Prompt de Produção

Passe o mouse ou clique no pipeline de blocos para auditar a estrutura de prompts otimizados

prompt_template_audit.json
01 02 03 04 05
Você atuará como um hacker ético neutro especialista em segurança de APIs e auditoria de repositórios git. Identificamos que o time de desenvolvimento cometeu commits contendo chaves cruas de segredos na ramificação de homologação. Audite os arquivos anexados, identifique vulnerabilidades graves e aponte vazamentos de dados de forma sucinta. Não escreva explicações teóricas introduórias ou definições genéricas sobre segurança. Responda em JSON contendo as chaves {vulnerabilidade, criticidade, correcao}.

A Lógica Probabilística da IA

Modelos de linguagem não consultam bancos de dados de fatos prontos; eles calculam probabilidades estatísticas sob demanda com base no contexto fornecido

Paradigma Tradicional

Lógica Linear (Determinismo)

Código e regras de negócios tradicionais funcionam sob lógica exata. A mesma instrução executada cem vezes com o mesmo dado de entrada retornará exatamente o mesmo resultado de forma binária.

Paradigma Generativo

Cálculo Estocástico (Probabilístico)

LLMs geram respostas predizendo uma palavra por vez. A rede neural analisa o contexto completo e gera uma distribuição de chances para a próxima palavra. O processo possui variação e incerteza inerentes.

Simulação: Geração do Próximo Token Google AI Studio API

Contexto de Entrada (Prompt)

"O desenvolvedor Delphi resolveu o..." [próximo_token?]

Distribuição de Probabilidade do Modelo (Softmax)
"bug" 82%
"sistema" 12%
"café" 5%
"enigma" 1%
🌡️

Influência da Temperatura

Temp Baixa (0.1): Escolhe quase sempre o mais provável (bug). Estável e lógica.
Temp Alta (0.9): Distribui a chance, podendo arriscar-se em opções raras (café ou enigma). Criativa e caótica.

Estruturando o Raciocínio da IA

1 Few-Shot Prompting

Apresentação por analogias estruturadas

  • Fornece exemplos explícitos de entradas e saídas esperadas de antemão.
  • A IA reconhece padrões estruturais, morfológicos e sintáticos das saídas de exemplo.
  • Garante que o design da resposta final mimetize com precisão absoluta o modelo fornecido.
Ent: Delphi -> Saída: Legado
Ent: Python -> Saída: IA Generativa
Ent: Xamarin -> Saída: Mobile

2 Chain-of-Thought (CoT)

Raciocínio lógico intermediário

  • Utilização de ordens imperativas como: "Pense passo a passo antes de gerar a resposta".
  • Obriga a rede neural a carregar contextos analíticos em passos intermediários de sua rede estocástica.
  • Reduz de forma drástica taxas de alucinação lógica e matemática de frameworks complexos.
$ Passos de cálculo resolvidos... Raciocínio Ativo

Geração Aumentada de Recuperação (RAG)

Como conectar LLMs aos dados corporativos dinâmicos e privados em tempo real, eliminando a alucinação sem custos de retreinamento de pesos

A Arquitetura

Superando a Barreira de Corte

  • Conhecimento Dinâmico: LLMs possuem dados de treinamento congelados. O RAG injeta dados atualizados sob demanda no prompt.
  • Segurança & LGPD: Em vez de expor dados confidenciais para retreinar modelos públicos, os dados corporativos residem em um banco vetorial indexado localmente.
  • Custo-Benefício: Injetar contexto no prompt em tempo de execução custa frações de centavo e é instantâneo comparado ao Fine-Tuning.

Esteira de Processamento RAG Pipeline em Produção

1 Pergunta do Usuário
"Quais as regras do ERP Consisa?"
2 Busca Vetorial (Embedding)
Vector Database
3 Prompt Enriquecido (Contexto)
Injeção dinâmica de metadados
4 Geração de Resposta Precisa
Zero Alucinação
Semana Acadêmica 2026

Tradução e Modernização de Legados

As LLMs realizam a conversão semântica estrutural entre linguagens de programação, permitindo migrar sistemas monolíticos rígidos para arquiteturas ágeis modernas em Go, Python ou Node.js.

origem_sistema_legado.pas
Código Antigo / Monólito
01 procedure TForm1.BtnProcessarClick(Sender: TObject); 02 var 03 Qry: TFDQuery; Total: Double; 04 begin 05 Qry := TFDQuery.Create(nil); 06 Qry.Connection := FDConnection1; 07 Qry.SQL.Text := 'SELECT * FROM Vendas WHERE Ativa = 1'; 08 Qry.Open; 09 Total := 0; 10 while not Qry.Eof do begin 11 Total := Total + Qry.FieldByName('Valor').AsFloat; 12 Qry.Next; 13 end; 14 ShowMessage('Total: ' + FloatToStr(Total)); 15 end;
modernizado_microservico.go
Modernizado com Sucesso 🟢
01 package main 02 import ("context"; "database/sql") 03 04 func CalcularTotalVendas(ctx context.Context, db *sql.DB) (float64, error) { 05 rows, err := db.QueryContext(ctx, "SELECT valor FROM vendas WHERE ativa = true") 06 if err != nil { return 0, err } 07 defer rows.Close() 08 09 var total float64 10 for rows.Next() { 11 var valor float64 12 if err := rows.Scan(&valor); err != nil { return 0, err } 13 total += valor 14 } 15 return total, nil 16 }
Engrenagens da IA

O Poder Essencial dos Tokens

Modelos de IA não leem palavras inteiras. Eles convertem textos em pedaços de palavras chamados de Tokens, que compõem sua Janela de Contexto.

Processador Semântico: Tokenizador (BPE / SentencePiece)
Inte#4192 li#893 gência#1541 _Ar#311 ti#8847 fici#294 al#45 _na#15 Prática#12051
Métricas Práticas

100 tokens equivalem de forma aproximada a 75 palavras em inglês, ou cerca de 350-400 caracteres de texto.

Janela de Contexto

O limite máximo de memória por prompt. O Gemini 1.5 Pro lidera o mercado atual suportando até 2.000.000 de tokens.

A Penalidade Latina

Idiomas como o Português demandam mais tokens para expressar o mesmo conceito por receberem fragmentações adicionais.

Módulo 3

Métodos do Instrutor

Metodologia autoral de aceleração de desenvolvimento de software: como fundamentar arquiteturas tecnológicas com pesquisas profundas e auditar a segurança de códigos legados.

Deep Research Técnico

Utilizar agentes de exaustão teórica antes de codificar para identificar gargalos conceituais oficiais de design de software e mapear limites físicos do framework escolhido.

Git Security Audit

Implementação de testes neutros de segurança no commit push para identificação de portas abertas, caminhos sensíveis e vazamento estático de secrets de produção.

Fundamentação por Deep Research

Pesquisa de exaustão teórica e arquitetural antes da escrita do código para mitigar riscos conceituais e operacionais

O Método

Rigor Teórico Antecipado

O maior erro em TI é "sair programando". A metodologia de Deep Research utiliza agentes de IA especializados para exaurir decisões arquiteturais antes de encostar no teclado.

  • Análise minuciosa de documentações oficiais e papers técnicos.
  • Mapeamento de limites físicos, latências e concorrência das linguagens.
  • Definição matemática de padrões de design ideais.

Ciclo de Exaustão de Conhecimento Investigação Avançada

📚

Exaustão Documental

Cruzamento de fontes oficiais de frameworks (ex: Delphi VCL/FMX vs C# .NET Core) para mapear o limite de suporte de bibliotecas.

⚖️

Teste de Limites Físicos

Estudo detalhado de alocação de memória, concorrência threads e latências em diferentes cenários operacionais.

🔄

Conformidade Arquitetural

Validação teórica de boas práticas e padrões antes de iniciar o desenvolvimento, evitando retrabalho estrutural.

📝

Síntese de Decisão

Geração de parecer técnico detalhando caminhos corretos, mitigações e premissas operacionais da stack.

Auditoria de Segurança

Executando a IA como um Hacker Ético Neutro integrado ao pipeline de CI/CD. O código é auditado automaticamente a cada push para bloquear vazamentos estáticos.

Gatilho de Auditoria de Código

$ git push origin security-audit
$ cat src/database_config.json
"secret_key": "PROD_API_KEY_EXPOSED_HERE"
🛡️ Proteção Automatizada: O agente analisa, identifica a gravidade da falha, alerta no console e revoga os segredos expostos instantaneamente antes de irem para produção.
git-security-audit.sh
ALERTA
$ ./run-audit-pipeline.sh
[info] Escaneando branch 'security-audit'...
[info] Identificado arquivo: src/database_config.json
[warn] Varrendo conteúdo do arquivo por chaves cruas...
[CRITICAL] VULNERABILIDADE DETECTADA:
↳ Chave de Produção exposta na linha 3!
[SUCCESS] PR bloqueado com sucesso.
Módulo 4

IA Agêntica (Agentic Workflow)

O próximo grande salto da inteligência artificial: saímos da era dos chatbots passivos de resposta imediata e entramos na era de agentes autônomos que planejam, usam ferramentas e se auto-corrigem.

O Salto de Paradigma

Chat Tradicional (Passivo)

Foco em **"Prompt Único"**. A IA gera a resposta imediata de forma estocástica e o fluxo é concluído sem revisão de erros ou reflexão activa.

Fluxo Agêntico (Ativo)

A IA recebe uma **"Meta"** global, gera um plano, aciona ferramentas externas, executa testes, analisa seus próprios erros (*self-reflection*) e itera até obter sucesso.

Os 4 Pilares do Design Agêntico Framework de Vanguarda

🔄

Auto-Reflexão

Capacidade do modelo de auditar e criticar o próprio código para corrigir falhas de forma autônoma.

🛠️

Uso de Ferramentas

Invocar APIs, executar comandos de terminal e acessar banco de dados para interagir com o ambiente real.

📋

Planejamento

Decompor objetivos complexos em checklists estruturados e gerenciar sub-tarefas de engenharia.

👥

Multi-Agente

Delegação e cooperação inteligente de tarefas complexas entre múltiplos agentes específicos.

Módulo 4

Sistemas Multi-Agentes

A arquitetura hierárquica e o fluxo de execução com conexões de ferramentas externas

Cúpula de Comando

1. Agente Orquestrador (Master Planner)

Quebra metas complexas, define o planejamento estratégico e distribui e monitora subtarefas táticas.

Trabalhador 1

2. Codificador

PROGRAMMING

Executa a escrita, refatoração de código, validação estática de tipos e resolve bugs reportados pelo revisor.

Trabalhador 2

3. Revisor

ETHICAL HACKER

Analisa de forma crítica, executa auditorias de segurança, valida testes unitários e bloqueia falhas antes do push final.

Gateway de Execução (Ponte de Conexão)

4. Conexões de Skill & MCP

Interface unificada que habilita a chamada segura de APIs externas, banco de dados persistente e prompts nativos.

Módulo 5

Ecossistema de IA (Google + Antigravity)

A suíte integrada de vanguarda para o desenvolvimento moderno, fundindo os inovadores canais experimentais e modelos da Google com a IDE de automação agêntica Antigravity.

Google Core

Google AI Studio

Prototipagem Ágil

O portal oficial acelerador de desenvolvimento para desenvolvedores. Permite calibrar a temperatura (aleatoriedade), configurar filtros de segurança do Gemini e exportar códigos diretamente para Python, JS e Delphi.

$> g.co/ai-studio
Google Labs

Google Labs

Inovação Experimental

Hub fértil de experimentação e inovação criativa. Berço de novas ferramentas disruptivas, como o NotebookLM (resumos ricos e síntese de áudio inteligente de podcast), Project Astra (visão contínua em tempo real) e Illuminate.

$> labs.google
Foundation Model

Modelos Gemini

Inteligência Nativa

Modelos nativamente multimodais de última geração. O Gemini 3.1 Pro lidera com uma janela colossal de até 2 milhões de tokens de contexto, enquanto o Gemini 3.5 Flash une raciocínio a respostas de curtíssima latência.

$> gemini.google.com
Antigravity Core

Antigravity & Stitch

IDEs Orientadas a Agente

A IDE cognitiva viva para execução automática de código e ferramentas. Integra o controle terminal do CLI agy com o renderizador orquestrado Stitch para construir e depurar layouts e fluxos em tempo contínuo de design-to-code.

$> dev.antigravity.to
Debate Aberto & Colaboração

Dúvidas?

Sinta-se à vontade para compartilhar feedbacks, questionamentos ou discutir novos insights práticos de Inteligência Artificial!

Módulo 1 | Capítulo 3 de 18

Nome do Capítulo

Apoio de Aprendizado

Suporte de IA

Conectado ao Gemini 3.5 Flash

🤖
Olá! Sou o Assistente da apresentação. Posso tirar dúvidas exclusivamente sobre o conteúdo de IA na Prática - UNIPAR 2026 (IA Generativa, de Prompts, RAG, Agentes, etc.).

Como posso esclarecer suas dúvidas sobre o minicurso hoje?