AITY Logo
Development
SYSTEM OPERATIONAL | v1.2.4-stable

Orquestração Cognitiva
de Interface Desktop

AUTOMAI é um agente autônomo híbrido que converte intenção semântica em execução determinística. Utiliza modelos de raciocínio (Gemini 2.5) para manipular a API Win32 em tempo real.

Restricted Access • Portfolio Demonstration Only

Pipeline de Processamento Lógico

INPUT LAYER
Multimodal Context
Captura de prompt do usuário + Snapshot visual do SO via PyAutoGUI.
REASONING ENGINE
Gemini 2.5 Flash
Análise semântica da imagem. Tradução de pixels para intenção lógica.
PARSING LAYER
JSON Enforcer
Sanitização e validação estrutural do payload para segurança.
EXECUTION LAYER
Win32 Emulator
Injeção de eventos HID (Teclado/Mouse) via ctypes driver.
Response Payload (JSON) ● Validated
{
  "pensamento": "Para abrir o terminal, preciso acionar o atalho de execução.",
  "plano_de_voo": [
    {"acao": "atalho", "teclas": ["win", "r"]},
    {"acao": "esperar", "tempo": 0.5},
    {"acao": "digitar", "texto": "cmd.exe"},
    {"acao": "pressionar", "tecla": "enter"}
  ]
}

Segurança & Controle

A automação de interfaces exige rigorosos protocolos para evitar comportamentos emergentes. O AUTOMAI opera sob princípios de "Human-in-the-loop".

  • Failsafe Mecânico Interrupção imediata via movimento brusco do mouse (Corner 0,0) ou hard-stop na UI.
  • 🔒
    OAuth 2.0 Local Credenciais armazenadas localmente. Nenhuma chave é enviada para servidores de terceiros.

ENGINEERING STACK

Python 3.11
Core Logic & Threading
Tkinter
Native Lightweight GUI
Google Gemini
Vision & Reasoning Model
Win32 API
Low-level OS Integration
Download Build v1.2 (Win64)

Restricted Access • Portfolio Demonstration Only