SYSTEM OPERATIONAL | v1.2.4-stable
Orquestração Cognitiva
de Interface Desktop
AUTOMAI é um agente autônomo híbrido que converte intenção semântica em execução determinística. Utiliza modelos de raciocínio (Gemini 2.5) para manipular a API Win32 em tempo real.
Restricted Access • Portfolio Demonstration Only
Pipeline de Processamento Lógico
INPUT LAYER
Multimodal Context
Captura de prompt do usuário + Snapshot visual do SO via PyAutoGUI.
→
REASONING ENGINE
Gemini 2.5 Flash
Análise semântica da imagem. Tradução de pixels para intenção lógica.
→
PARSING LAYER
JSON Enforcer
Sanitização e validação estrutural do payload para segurança.
→
EXECUTION LAYER
Win32 Emulator
Injeção de eventos HID (Teclado/Mouse) via ctypes driver.
Response Payload (JSON)
● Validated
{
"pensamento": "Para abrir o terminal, preciso acionar o atalho de execução.",
"plano_de_voo": [
{"acao": "atalho", "teclas": ["win", "r"]},
{"acao": "esperar", "tempo": 0.5},
{"acao": "digitar", "texto": "cmd.exe"},
{"acao": "pressionar", "tecla": "enter"}
]
}
Segurança & Controle
A automação de interfaces exige rigorosos protocolos para evitar comportamentos emergentes. O AUTOMAI opera sob princípios de "Human-in-the-loop".
-
⛔Failsafe Mecânico Interrupção imediata via movimento brusco do mouse (Corner 0,0) ou hard-stop na UI.
-
🔒OAuth 2.0 Local Credenciais armazenadas localmente. Nenhuma chave é enviada para servidores de terceiros.
ENGINEERING STACK
Python 3.11
Core Logic & Threading
Tkinter
Native Lightweight GUI
Google Gemini
Vision & Reasoning Model
Win32 API
Low-level OS Integration
Download Build v1.2 (Win64)
Restricted Access • Portfolio Demonstration Only