Leonardo Gomes Ribeiro Gonçalves*
Há uma experiência que qualquer pessoa que trabalhe com inteligência artificial generativa reconhece, ainda que raramente consiga articular com precisão. O sistema entrega um output tecnicamente impecável, bem estruturado, coerente na forma, e, ainda assim, algo pode estar errado. Pode ser uma alucinação ou um erro mais dificilmente identificável no texto. As referências são pertinentes, o raciocínio é fluente, a linguagem é adequada ao contexto, mas quem lê sabe, com uma certeza que precede qualquer análise formal, que aquilo não serve para ser aplicado na realidade. Ou, se serve, é apenas em parte. Ou, ainda, que serve para um mundo que não é exatamente o mundo onde a decisão precisará ser tomada.
Essa estranheza é um sintoma e o diagnóstico passa por um conceito que, até recentemente, era restrito ao vocabulário da engenharia de sistemas: a janela de contexto.
1. Contradições nas Janelas de Contexto
No vocabulário técnico da inteligência artificial generativa, a janela de contexto (context window) é o conjunto de informações que o modelo de linguagem tem disponíveis quando processa uma solicitação e gera uma resposta. Ela tem limites técnicos ou incompletudes atribuíveis a erro ou mau uso do operador.
O que está dentro da janela existe para o modelo e o que está fora, simplesmente não existe. O modelo não ignora o que está além da janela, ele genuinamente não tem acesso a isso porque não lhe é dado. É uma fronteira que não admite gradações: ou a informação está dentro, ou ela não está na janela preenchida pelo usuário.
E, ainda que sejam entregues as informações, a janela de contexto do assistente de IA tem capacidade limitada de processamento. Esses limites têm uma razão técnica, explicada pelo fato de que processar todo o conteúdo de uma janela de uma só vez exige um esforço computacional que cresce de forma exponencial, conforme o diálogo com o usuário se estende. Isso impõe um teto concreto ao seu tamanho. Além do mais, informações posicionadas no meio do contexto tendem a ser processadas com menor precisão do que as situadas no início ou no fim, o que os pesquisadores chamam de lost in the middle. A janela de contexto, portanto, não é apenas finita. Ela também não é uniforme: a posição de uma informação dentro dela importa tanto quanto sua presença.
Nos modelos mais recentes, essa janela pode ser extraordinariamente ampla, capaz de processar centenas de milhares de tokens, equivalentes a livros inteiros de texto corrido. Mas amplitude não é o mesmo que completude. Uma janela grande continua sendo uma janela. E o que fica do lado de fora dela não é necessariamente o que é menos importante, às vezes, é exatamente o contrário.
Para a inteligência artificial, a janela de contexto é constituída exclusivamente por informação digital, como texto, dados estruturados, imagens codificadas, metadados. Tudo o que o modelo sabe sobre o problema que lhe foi apresentado passou por esse filtro. Não há outro canal de entrada, não existe percepção direta, intuição incorporada, memória acumulada de experiências físicas ou capacidade de sentir o peso do que está sendo decidido. O modelo opera sobre parcelas de representações do mundo físico.
Isso, de fato, não é uma limitação a ser corrigida, mas uma característica dos sistemas de IA.
2. A Janela de Contexto do ser humano
O ser humano também tem uma janela de contexto. Só que ela é radicalmente diferente da janela da IA, não apenas em conteúdo, mas na sua natureza.
A janela de contexto humana inclui, evidentemente, as informações que o tomador de decisão tem disponíveis no momento da deliberação. Essas informações não se restringem aos documentos, aos dados, aos precedentes e aos argumentos em disputa, mas incluem também um tipo de informação que não passa por nenhum processo de digitalização, e que, por essa razão, não pode ser inteiramente transmitida a nenhum sistema computacional.
Essa camada é constituída pelo ambiente físico onde a decisão ocorre, ou seja, pela história não documentada de relações entre as partes envolvidas, pelo silêncio que precede uma resposta em uma audiência, pela percepção que o tomador de decisão tem sobre os acontecimentos ao seu redor. Além do mais, há a experiência que um profissional acumulou ao longo de anos, que nenhum currículo escrito consegue descrever com fidelidade, e pelo saber tácito que vem de ter errado antes e de ter carregado as consequências desse erro.
A urgência sentida diante de um prazo real, o peso da responsabilidade e a consciência de que a decisão errada tem um endereço, um nome, um rosto: nada disso passa pelo filtro da digitalização, e o que não se digitaliza não entra na janela da máquina.
A janela de contexto do ser humano não é somente maior do que a da máquina, é de outra natureza. Contém dimensões que não são representáveis em tokens e é por isso que o humano, ao ler o output impecável da inteligência artificial, pode saber que algo está errado antes mesmo de conseguir nomear o que é.
3. O erro de inversão e a ilusão da completude da janela digital
Portanto, o problema não é que a inteligência artificial produza outputs ruins em si. Em muitos domínios, ela produz outputs extraordinários, mais rápidos, mais abrangentes, mais consistentes do que qualquer especialista humano conseguiria produzir sozinho no mesmo intervalo de tempo. Na verdade, o problema é de outra ordem.
O problema é que o usuário, ao receber um output de alta qualidade técnica, tende a tratar a janela de contexto digital como se fosse o espelho da janela de contexto completa, do mundo físico. Como se o que ficou de fora da janela da máquina (porque não foi digitado, porque não existe em formato texto ou porque não foi documentado) fosse indiferente para a aplicação do output da IA.
Utilizando uma metáfora, a janela de contexto digital pode ser considerada como um mapa extraordinariamente detalhado, em muitos casos mais preciso do que qualquer mapa que existia antes. Mas ainda assim é somente uma representação do território, o mundo físico onde a decisão será executada, onde seus efeitos serão sentidos, onde as pessoas que ela afeta acordam de manhã e têm um dia pela frente que o mapa não consegue descrever inteiramente.
Quando o decisor esquece essa distinção, isto é, quando passa a tratar o mapa como território, ele comete o que poderíamos chamar de erro de inversão. Ele organiza seu julgamento em função do recorte digital, e relega o contexto físico à condição de elemento secundário, de ruído a ser administrado. Inverte a hierarquia entre o mundo que existe e a representação que foi feita dele.
O erro, neste caso, é aceitar sem crítica o que a IA produziu ou atribuir a ela um erro por um output produzido em função do que ela não viu na sua janela.
4. O mundo híbrido e a hierarquia que ele exige
Vivemos, hoje, num mundo que é simultaneamente físico e digital. Não há mais uma separação nítida entre os dois planos: as decisões públicas são informadas por sistemas de análise de dados, os processos jurídicos tramitam em plataformas eletrônicas, os contratos são geridos por sistemas automatizados, as políticas são avaliadas por modelos preditivos. O digital penetrou o físico de forma tão profunda que falar em “separação” entre os dois já parece anacrônico.
Mas tornar o mundo híbrido não significa dizer que o físico e o digital sejam uma coisa só e que tenham a mesma natureza.
O mundo híbrido é físico com uma camada digital, não é um mundo digital com uma camada física. A face digital do mundo existe porque o mundo físico a sustenta, a alimenta e lhe confere sentido. Os dados são coletados a partir de fenômenos que existem antes de serem medidos. Os modelos são treinados em textos que foram escritos por pessoas que vivem, habitam territórios, constroem relações. A infraestrutura computacional que processa esses dados está instalada em data centers que consomem energia elétrica produzida em usinas que existem em lugares físicos, operadas por trabalhadores que têm histórias pessoais. O digital é derivado do real, é uma representação de segunda ordem de um mundo que existe em primeira ordem.
Se a face digital está inserida na face física do mundo, e não o contrário, então o decisor que opera no mundo híbrido precisa habitar e transitar entre os dois planos ao mesmo tempo, com consciência da hierarquia entre eles. Ele pode usar o output da inteligência artificial, mas deve usá-lo sabendo que esse output foi produzido a partir de uma janela de contexto que não inclui o território onde a decisão vai produzir efeitos.
5. A decisão deve sempre ser humana
Há uma formulação que circula com frequência nos debates sobre inteligência artificial, geralmente com intenção tranquilizadora: “a decisão final é sempre humana”. A afirmação é correta, mas ela pode ser usada de forma que esvazia seu próprio conteúdo.
Dizer que a decisão é humana não basta se o humano que decide simplesmente homologa o output da máquina sem exercer o julgamento que seria necessário para avaliá-lo criticamente. Nesse caso, a decisão é formalmente humana e há um responsável, mas é substantivamente delegada a um sistema que não tem acesso integral ao contexto em que ela vai operar.
A decisão é humana não porque o humano aperta o botão de confirmar. É humana porque o humano é o interlocutor do contexto físico que a máquina não vê, porque o humano produz a janela de contexto da máquina e vive a janela de contexto que contém o que não foi digitado, o que não foi documentado e que não existe em nenhum banco de dados.
Isso significa que a decisão humana é superior à da máquina? Não. Significa que ela é diferente e que essa diferença não é suprimível por mais capacidade computacional que se adicione ao sistema. O que o humano pode fazer, e a máquina estruturalmente não pode, é integrar o output digital ao contexto físico onde ele vai funcionar. Essa integração é o trabalho decisório propriamente dito.
Esse trabalho exige uma competência que não é técnica. Trata-se da capacidade de identificar o que a janela de contexto da máquina não incluiu e entender a razão pela qual essa janela não foi completa. Dito de outro modo, é preciso perguntar: o que estava fora da janela quando esse texto foi gerado? Que aspectos do problema real não foram representados na entrada que o sistema processou? Onde o mapa diverge do território?
A capacidade de leitura crítica da janela alheia não se desenvolve apenas com treinamento em redação de prompts de inteligência artificial. Ela se desenvolve com a prática do julgamento, com a experiência acumulada de ter errado em contextos específicos e com o conhecimento que só se possui por estar dentro de uma organização por tempo suficiente para saber o que ela não documenta sobre si mesma.
6. Clareza para compreender
A questão que o mundo híbrido coloca, então, não é técnica, mas epistêmica. Não consiste apenas em saber usar as ferramentas disponíveis, mas em compreender o seu funcionamento e as suas limitações, especialmente os limites da janela que elas enxergam.
Diante dessas limitações, há duas respostas que se complementam. A primeira consiste em compreender o funcionamento da janela de contexto da máquina, para saber o que ela processa bem, o que tende a perder, e como estruturar as informações entregues a ela de forma a aproximar o recorte digital do problema real. Trata-se de uma competência adquirível, com efeitos concretos na qualidade dos outputs.
A segunda resposta, porém, não é suprimível pela primeira. Mesmo a janela de contexto mais bem construída, alimentada com os melhores dados disponíveis, continuará sendo um ponto de vista parcial. Os melhores outputs serão sempre produzidos a partir de recortes do mundo físico, porque ele, de fato, ainda não cabe em nenhuma janela digital. Para o jurista, isso se traduz no reconhecimento de que um parecer produzido com auxílio de inteligência artificial pode ser tecnicamente sólido e ao mesmo tempo inadequado para o contexto institucional específico onde vai ser aplicado, porque esse contexto tem uma história, uma cultura, relações de poder e práticas informais que nenhum modelo é capaz de conhecer integralmente.
Para o gestor público, significa entender que uma análise de dados rigorosa pode produzir uma recomendação correta para os dados que foram coletados e errada para o território que esses dados representam, porque o território sempre excede sua representação.
Para o médico, para o engenheiro, para o educador, para qualquer profissional que tome decisões com consequências reais sobre vidas reais, a exigência é a mesma: saber que a janela de contexto da máquina não coincide com a janela de contexto do problema real e saber suprir essa diferença com o julgamento que só é possível a quem habita o mundo físico onde as decisões humanas produzem efeitos.
As contradições entre as janelas de contexto não recomendam que se rejeite a tecnologia. Recomendam que se saiba, com clareza, o que cada janela contém e o que ela deixa de fora. Esse discernimento é, no mundo híbrido, parte constitutiva do julgamento humano.
*Doutor em Direito Constitucional pelo (IDP). Mestre em Direito da Regulação (FGV Direito Rio). Advogado e procurador do Estado do Piauí.
