Minicurso Técnico-Prático

Inteligência Artificial
na Prática

LLMs, Engenharia de Prompt, Google AI Studio, segurança e o próximo salto dos agentes

📍 UNIPAR Francisco Beltrão 📅 Terça-feira, 02/06/2026

André Luis Finger Candido

29 anos | Consisa Sistemas

Trajetória Profissional

✔ 8 anos de atuação sólida em desenvolvimento de software e infraestrutura.
✔ Atuou como desenvolvedor nativo Delphi por 2 anos na Consisa Sistemas.
✔ Atualmente focado em P&D de Inteligência Artificial Generativa aplicada à produção e aceleração de desenvolvimento.

Stack & Ferramentas de Domínio

Delphi C# Python Vue.js Xamarin PHP Flutter

Módulo 1

O Caminho até as LLMs

A transição tecnológica dos algoritmos baseados em regras rígidas e previsão estruturada para os modelos de fundação generativa em larga escala.

01

Previsão Estruturada

Estatística tradicional, models de regressão clássicos e busca de padrões fixos de forma determinista.

02

Deep Learning

Redes neurais profundas convolucionais (CNNs) e recorrentes (RNNs/LSTMs) mapeando sequências e visão.

03

Transformers

Modelos de linguagem auto-atentivos em larga escala que geram raciocínio emergente e síntese universal de mídias.

O Caminho até as LLMs - Etapa 1

Surgimento & Invernos da IA

50s

1940 - 1950

O Teste de Turing & Bases Teóricas

• Alan Turing publica "Computing Machinery and Intelligence" propondo a pergunta clássica: "Podem as máquinas pensar?".
• Formalização matemática inicial do que viria a ser o primeiro neurônio artificial (McCulloch & Pitts).
• Criação das bases computacionais teóricas focadas em computação de regras lógicas estruturadas.

Foco inicial: Lógica booleana e regras determinísticas.

80s

1970 - 1980

Os Invernos da IA (AI Winter)

• Ceticismo acadêmico decorrente de promessas não cumpridas e expectativas excessivas iniciais.
• Bloqueio dramático de financiamento militar e de pesquisa governamental global após relatórios críticos.
• Gargalo tecnológico severo: limitações severas de hardware (memória e CPU) e escassez generalizada de dados limpos.

Foco: Falta de escala impossibilitou soluções complexas.

O Caminho até as LLMs - Etapa 2

Cálculo Bruto & Deep Learning

90s

Ano 1997

Deep Blue & Força Bruta

• O supercomputador Deep Blue da IBM derrota o campeão mundial Garry Kasparov em um torneio oficial de Xadrez.
• Demonstração fantástica do poder da computação e de algoritmos do tipo força bruta com busca de caminhos (Minimax estruturado).
• Limite: O sistema era altamente especializado e desprovido de qualquer flexibilidade cognitiva real.

Método: Algoritmos de busca heuristicamente exaustivos.

10s

Anos 2010

Big Data, Deep Learning & GPUs

• Consolidação do Machine Learning tradicional e florescimento explosivo de redes neurais profundas (Deep Learning).
• O surgimento do ecossistema de dados em massa (Big Data / Web 2.0) e poder computacional paralelo massivo habilitado por GPUs.
• Vitórias revolucionárias em visão computacional (ex: marco histórico do ImageNet em 2012) e transcrição de áudio.

Infraestrutura: O casamento perfeito entre processamento e dados.

O Caminho até as LLMs - Etapa 3

Transformers & IA Generativa

17+

Ano 2017

A Revolução do Transformer

• Lançamento do revolucionário artigo científico "Attention Is All You Need" pelas equipes de engenheiros do Google.
• Mecanismo de Auto-Atenção (Self-Attention) derruba monólitos de processamento sequencial de texto anterior (LSTMs).
• Paralelização maciça em treinamento de redes, abrindo as portas para o desenvolvimento de modelos colossais.

Base: Fundamento absoluto de todas as LLMs pré-treinadas hoje.

20s

Anos 2020+

Modelos de Fundação & IA Generativa

• Disparada no volume de parâmetros sinápticos dos modelos (escala multi-bilionária) dando origem a habilidades emergentes não programadas.
• Lançamento explosivo do ChatGPT de consumo em larga escala, seguido pela explosão do ecossistema corporativo de APIs (Gemini, Claude).
• Transição para multimodalidade integrada nativa de vídeo/áudio e desenvolvimento ativo de agentes autônomos.

Futuro: Do text-completion ao raciocínio lógico autônomo.

Evolução do Paradigma da IA

Tradicional: Programação Rígida

Sistemas Fechados

Regras Estáticas & Heurísticas

▪ Codificação estrita de caminhos lógicos (`if/else`) definida manualmente.
▪ Especializados em classificar, rotular ou prever dados estruturados rígidos.
▪ Completamente incapazes de criar, sintetizar ou gerar novos conteúdos inéditos.

Entrada → Filtro Rígido → Previsão

Estático

O Salto

Transformers Auto-Atenção

Generativo: Redes de Probabilidade

Modelos Vivos (LLMs)

Pesos Sinápticos Dinâmicos

✦ Redes Neurais com auto-atenção profunda que capturam relações contextuais globais.
✦ Predição estatística ultra-refinada do próximo token mais provável do contexto.
✦ Capacidade de raciocínio lúdico, síntese e criação criativa de código, textos e mídias.

Contexto → Distribuição → Síntese

Fluido

Mercado Global de IA

Quatro principais frentes industriais de modelos de fundação de vanguarda

Google Gemini

>Multimodalidade nativa direta na arquitetura principal.
>Janela colossal de contexto de até 2M de tokens.
>Integração fluida nativa com todo o Google Workspace.

Foco Tecnológico

OpenAI GPT

>Referência comercial de adoção nos ecossistemas globais.
>Modelos avançados de raciocínio profundo da série o1.
>Grande portfólio de APIs comerciais para corporações de grande porte.

Parâmetro de Mercado

Anthropic Claude

>Líder em redação técnica impecável e geração de código preciso.
>Raciocínio analítico refinado com a família Claude 3.8 Sonnet.
>Alinhamento ético estrito via Constitutional AI nativo.

Refinamento Analítico

Open Source (Llama)

>Liderança ostensiva da Meta no fornecimento de pesos abertos.
>Capacidade total de self-hosting e privacidade ponta a ponta.
>Facilidade total de customização e ajuste fino de pesos.

Privacidade Total

O que é Multimodalidade?

A revolução sensorial: a diferença crucial entre sistemas unimodais e multimodais nativos

Unimodal (Texto Puro)

Canal Único e Linear

Primeira geração de modelos de linguagem de grande porte (LLMs convencionais).

✖ Sem visão ou audição: Incapaz de processar capturas de tela, fotos ou arquivos de mídia diretamente.
✖ Processamento serial: Depende de conversores externos de voz para texto (speech-to-text).
✖ Falta de Contexto Sensorial: Limita a interpretação estrita a caracteres puros de teclado.

ENTRADA: "Texto" ➔ PROCESSAMENTO ➔ SAÍDA: "Texto"

📄 Texto ➔ 🖼 Imagem ➔ 🎙 Voz

Multimodal Nativo

Fusão Sensorial Completa

Modelos de nova geração (como Google Gemini 3.1 Pro e 3.5 Flash ou Anthropic Claude 3.8 Sonnet).

✔ Cérebro Neural Unificado: Processa texto, imagens, códigos, áudios e vídeos diretamente na mesma arquitetura.
✔ Visão Computacional Ativa: O agente "enxerga" códigos e designs anexados para depurar layouts pixel por pixel.
✔ Conversação de Latência Nula: Interação de voz em tempo real diretamente processada pela rede sem intermediários.

ENTRADAS: [Texto + Voz + Imagem + Vídeo] ➔ REDE UNIFICADA

Módulo 2

Engenharia de Prompts

Aprenda a estruturar comandos eficientes de linguagem natural para guiar as IAs em tarefas complexas com total assertividade.

Persona Definida

✦

Contextualização Estrita

✦

Instrução Imperativa

✦

Formatos de Saída

Anatomia de um Prompt de Produção

Passe o mouse ou clique no pipeline de blocos para auditar a estrutura de prompts otimizados

prompt_template_audit.json

01 02 03 04 05

Você atuará como um hacker ético neutro especialista em segurança de APIs e auditoria de repositórios git. Identificamos que o time de desenvolvimento cometeu commits contendo chaves cruas de segredos na ramificação de homologação. Audite os arquivos anexados, identifique vulnerabilidades graves e aponte vazamentos de dados de forma sucinta. Não escreva explicações teóricas introduórias ou definições genéricas sobre segurança. Responda em JSON contendo as chaves {vulnerabilidade, criticidade, correcao}.

A Lógica Probabilística da IA

Modelos de linguagem não consultam bancos de dados de fatos prontos; eles calculam probabilidades estatísticas sob demanda com base no contexto fornecido

Paradigma Tradicional

Lógica Linear (Determinismo)

Código e regras de negócios tradicionais funcionam sob lógica exata. A mesma instrução executada cem vezes com o mesmo dado de entrada retornará exatamente o mesmo resultado de forma binária.

Paradigma Generativo

Cálculo Estocástico (Probabilístico)

LLMs geram respostas predizendo uma palavra por vez. A rede neural analisa o contexto completo e gera uma distribuição de chances para a próxima palavra. O processo possui variação e incerteza inerentes.

Simulação: Geração do Próximo Token Google AI Studio API

Contexto de Entrada (Prompt)

"O desenvolvedor Delphi resolveu o..." [próximo_token?]

Distribuição de Probabilidade do Modelo (Softmax)

"bug" 82%

"sistema" 12%

"café" 5%

"enigma" 1%

🌡️

Influência da Temperatura

Temp Baixa (0.1): Escolhe quase sempre o mais provável (bug). Estável e lógica.
Temp Alta (0.9): Distribui a chance, podendo arriscar-se em opções raras (café ou enigma). Criativa e caótica.

Estruturando o Raciocínio da IA

1 Few-Shot Prompting

Apresentação por analogias estruturadas

▪Fornece exemplos explícitos de entradas e saídas esperadas de antemão.
▪A IA reconhece padrões estruturais, morfológicos e sintáticos das saídas de exemplo.
▪Garante que o design da resposta final mimetize com precisão absoluta o modelo fornecido.

Ent: Delphi -> Saída: Legado
Ent: Python -> Saída: IA Generativa
Ent: Xamarin -> Saída: Mobile

2 Chain-of-Thought (CoT)

Raciocínio lógico intermediário

▪Utilização de ordens imperativas como: "Pense passo a passo antes de gerar a resposta".
▪Obriga a rede neural a carregar contextos analíticos em passos intermediários de sua rede estocástica.
▪Reduz de forma drástica taxas de alucinação lógica e matemática de frameworks complexos.

$ Passos de cálculo resolvidos... Raciocínio Ativo

Geração Aumentada de Recuperação (RAG)

Como conectar LLMs aos dados corporativos dinâmicos e privados em tempo real, eliminando a alucinação sem custos de retreinamento de pesos

A Arquitetura

Superando a Barreira de Corte

✦ Conhecimento Dinâmico: LLMs possuem dados de treinamento congelados. O RAG injeta dados atualizados sob demanda no prompt.
✦ Segurança & LGPD: Em vez de expor dados confidenciais para retreinar modelos públicos, os dados corporativos residem em um banco vetorial indexado localmente.
✦ Custo-Benefício: Injetar contexto no prompt em tempo de execução custa frações de centavo e é instantâneo comparado ao Fine-Tuning.

Esteira de Processamento RAG Pipeline em Produção

1 Pergunta do Usuário

"Quais as regras do ERP Consisa?"

2 Busca Vetorial (Embedding)

Vector Database

3 Prompt Enriquecido (Contexto)

Injeção dinâmica de metadados

4 Geração de Resposta Precisa

Zero Alucinação

Semana Acadêmica 2026

Tradução e Modernização de Legados

As LLMs realizam a conversão semântica estrutural entre linguagens de programação, permitindo migrar sistemas monolíticos rígidos para arquiteturas ágeis modernas em Go, Python ou Node.js.

origem_sistema_legado.pas

Código Antigo / Monólito

01 procedure TForm1.BtnProcessarClick(Sender: TObject); 02 var 03 Qry: TFDQuery; Total: Double; 04 begin 05 Qry := TFDQuery.Create(nil); 06 Qry.Connection := FDConnection1; 07 Qry.SQL.Text := 'SELECT * FROM Vendas WHERE Ativa = 1'; 08 Qry.Open; 09 Total := 0; 10 while not Qry.Eof do begin 11 Total := Total + Qry.FieldByName('Valor').AsFloat; 12 Qry.Next; 13 end; 14 ShowMessage('Total: ' + FloatToStr(Total)); 15 end;

modernizado_microservico.go

Modernizado com Sucesso 🟢

01 package main 02 import ("context"; "database/sql") 03 04 func CalcularTotalVendas(ctx context.Context, db *sql.DB) (float64, error) { 05 rows, err := db.QueryContext(ctx, "SELECT valor FROM vendas WHERE ativa = true") 06 if err != nil { return 0, err } 07 defer rows.Close() 08 09 var total float64 10 for rows.Next() { 11 var valor float64 12 if err := rows.Scan(&valor); err != nil { return 0, err } 13 total += valor 14 } 15 return total, nil 16 }

Engrenagens da IA

O Poder Essencial dos Tokens

Modelos de IA não leem palavras inteiras. Eles convertem textos em pedaços de palavras chamados de Tokens, que compõem sua Janela de Contexto.

Processador Semântico: Tokenizador (BPE / SentencePiece)

Inte#4192 li#893 gência#1541 _Ar#311 ti#8847 fici#294 al#45 _na#15 Prática#12051

Métricas Práticas

100 tokens equivalem de forma aproximada a 75 palavras em inglês, ou cerca de 350-400 caracteres de texto.

Janela de Contexto

O limite máximo de memória por prompt. O Gemini 1.5 Pro lidera o mercado atual suportando até 2.000.000 de tokens.

A Penalidade Latina

Idiomas como o Português demandam mais tokens para expressar o mesmo conceito por receberem fragmentações adicionais.

Módulo 3

Métodos do Instrutor

Metodologia autoral de aceleração de desenvolvimento de software: como fundamentar arquiteturas tecnológicas com pesquisas profundas e auditar a segurança de códigos legados.

Deep Research Técnico

Utilizar agentes de exaustão teórica antes de codificar para identificar gargalos conceituais oficiais de design de software e mapear limites físicos do framework escolhido.

Git Security Audit

Implementação de testes neutros de segurança no commit push para identificação de portas abertas, caminhos sensíveis e vazamento estático de secrets de produção.

Fundamentação por Deep Research

Pesquisa de exaustão teórica e arquitetural antes da escrita do código para mitigar riscos conceituais e operacionais

O Método

Rigor Teórico Antecipado

O maior erro em TI é "sair programando". A metodologia de Deep Research utiliza agentes de IA especializados para exaurir decisões arquiteturais antes de encostar no teclado.

✦ Análise minuciosa de documentações oficiais e papers técnicos.
✦ Mapeamento de limites físicos, latências e concorrência das linguagens.
✦ Definição matemática de padrões de design ideais.

Ciclo de Exaustão de Conhecimento Investigação Avançada

📚

Exaustão Documental

Cruzamento de fontes oficiais de frameworks (ex: Delphi VCL/FMX vs C# .NET Core) para mapear o limite de suporte de bibliotecas.

⚖️

Teste de Limites Físicos

Estudo detalhado de alocação de memória, concorrência threads e latências em diferentes cenários operacionais.

🔄

Conformidade Arquitetural

Validação teórica de boas práticas e padrões antes de iniciar o desenvolvimento, evitando retrabalho estrutural.

📝

Síntese de Decisão

Geração de parecer técnico detalhando caminhos corretos, mitigações e premissas operacionais da stack.

Auditoria de Segurança

Executando a IA como um Hacker Ético Neutro integrado ao pipeline de CI/CD. O código é auditado automaticamente a cada push para bloquear vazamentos estáticos.

Gatilho de Auditoria de Código

$ git push origin security-audit

$ cat src/database_config.json

"secret_key": "PROD_API_KEY_EXPOSED_HERE"

🛡️ Proteção Automatizada: O agente analisa, identifica a gravidade da falha, alerta no console e revoga os segredos expostos instantaneamente antes de irem para produção.

git-security-audit.sh

ALERTA

$ ./run-audit-pipeline.sh

[info] Escaneando branch 'security-audit'...

[info] Identificado arquivo: src/database_config.json

[warn] Varrendo conteúdo do arquivo por chaves cruas...

[CRITICAL] VULNERABILIDADE DETECTADA:

↳ Chave de Produção exposta na linha 3!

[SUCCESS] PR bloqueado com sucesso.

Módulo 4

IA Agêntica (Agentic Workflow)

O próximo grande salto da inteligência artificial: saímos da era dos chatbots passivos de resposta imediata e entramos na era de agentes autônomos que planejam, usam ferramentas e se auto-corrigem.

O Salto de Paradigma

Chat Tradicional (Passivo)

Foco em **"Prompt Único"**. A IA gera a resposta imediata de forma estocástica e o fluxo é concluído sem revisão de erros ou reflexão activa.

Fluxo Agêntico (Ativo)

A IA recebe uma **"Meta"** global, gera um plano, aciona ferramentas externas, executa testes, analisa seus próprios erros (*self-reflection*) e itera até obter sucesso.

Os 4 Pilares do Design Agêntico Framework de Vanguarda

🔄

Auto-Reflexão

Capacidade do modelo de auditar e criticar o próprio código para corrigir falhas de forma autônoma.

🛠️

Uso de Ferramentas

Invocar APIs, executar comandos de terminal e acessar banco de dados para interagir com o ambiente real.

📋

Planejamento

Decompor objetivos complexos em checklists estruturados e gerenciar sub-tarefas de engenharia.

👥

Multi-Agente

Delegação e cooperação inteligente de tarefas complexas entre múltiplos agentes específicos.

Módulo 4

Sistemas Multi-Agentes

A arquitetura hierárquica e o fluxo de execução com conexões de ferramentas externas

Cúpula de Comando

1. Agente Orquestrador (Master Planner)

Quebra metas complexas, define o planejamento estratégico e distribui e monitora subtarefas táticas.

Trabalhador 1

2. Codificador

PROGRAMMING

Executa a escrita, refatoração de código, validação estática de tipos e resolve bugs reportados pelo revisor.

Trabalhador 2

3. Revisor

ETHICAL HACKER

Analisa de forma crítica, executa auditorias de segurança, valida testes unitários e bloqueia falhas antes do push final.

Gateway de Execução (Ponte de Conexão)

4. Conexões de Skill & MCP

Interface unificada que habilita a chamada segura de APIs externas, banco de dados persistente e prompts nativos.

Módulo 5

Ecossistema de IA (Google + Antigravity)

A suíte integrada de vanguarda para o desenvolvimento moderno, fundindo os inovadores canais experimentais e modelos da Google com a IDE de automação agêntica Antigravity.

Google Core

Google AI Studio

Prototipagem Ágil

O portal oficial acelerador de desenvolvimento para desenvolvedores. Permite calibrar a temperatura (aleatoriedade), configurar filtros de segurança do Gemini e exportar códigos diretamente para Python, JS e Delphi.

$> g.co/ai-studio

Google Labs

Inovação Experimental

Hub fértil de experimentação e inovação criativa. Berço de novas ferramentas disruptivas, como o NotebookLM (resumos ricos e síntese de áudio inteligente de podcast), Project Astra (visão contínua em tempo real) e Illuminate.

$> labs.google

Foundation Model

Modelos Gemini

Inteligência Nativa

Modelos nativamente multimodais de última geração. O Gemini 3.1 Pro lidera com uma janela colossal de até 2 milhões de tokens de contexto, enquanto o Gemini 3.5 Flash une raciocínio a respostas de curtíssima latência.

$> gemini.google.com

Antigravity Core

Antigravity & Stitch

IDEs Orientadas a Agente

A IDE cognitiva viva para execução automática de código e ferramentas. Integra o controle terminal do CLI agy com o renderizador orquestrado Stitch para construir e depurar layouts e fluxos em tempo contínuo de design-to-code.

$> dev.antigravity.to

Debate Aberto & Colaboração

Dúvidas?

Sinta-se à vontade para compartilhar feedbacks, questionamentos ou discutir novos insights práticos de Inteligência Artificial!

E-mail contato@andrelfc.dev

LinkedIn in/andrelfc

GitHub andreluisfc

Inteligência Artificial na Prática