Overfitting existencial
Por que ser muito bom em algo é uma forma lenta de parar de enxergar
A noite em Portugal tinha um cheiro específico: papel velho de um visto que não chegava, o ar parado de um quarto onde eu não dormia há dias, a tela do notebook iluminando uma planilha aberta às três da manhã. Eu tinha o curso planejado, a carreira desenhada, os dez anos seguintes em células que só faltava executar. Sabia calcular o valor presente de um fluxo de caixa, sabia o que era margem de segurança, sabia reconhecer uma boa empresa a quilômetros de distância. Era competente naquilo de um jeito que me dava um orgulho silencioso.
E então a vida fez a pergunta que não estava no cronograma. Visto atrasado. Saúde mental ruindo. Um corpo que parou de obedecer. E eu, diante da planilha, descobri que nenhuma das minhas ferramentas servia. Quando tudo o que temos é um martelo, todo problema vira prego, e eu não tinha mais nada além do martelo. Era ótimo num jogo que tinha parado de ser jogado. Fora da sala onde eu brilhava, eu emudecia.
Levei anos para entender que isso tem nome, e que o nome vem de uma área que eu deveria conhecer melhor do que conhecia a mim mesmo.
O nome do problema
Em machine learning, você treina um modelo mostrando a ele uma montanha de exemplos do passado para que ele aprenda a prever o futuro. O perigo tem nome: overfitting. Em linguagem simples, e usando a licença poética que ninguém me deu, é quando o modelo aprende os exemplos bem demais. Decora não só o padrão que importa, mas o ruído que veio junto: as idiossincrasias daquele conjunto específico, os acidentes que não vão se repetir.
Por dentro, parece sucesso. O modelo acerta quase tudo na amostra com que foi treinado. Ficaria orgulhoso de si, se modelos tivessem orgulho. Só que, no instante em que você o solta no mundo real, diante de dados que ele nunca viu, ele desmorona. Ficou perfeito no passado ao custo de ficar inútil no futuro.
A tradução para uma vida é mais desconfortável do que parece.
O preço de ser aprovado
Passamos a juventude sendo treinados para um ambiente. A escola tem suas métricas, o trabalho tem as dele, a família tem as suas, e cada nicho que escolhemos vem com um gabarito. E nós, querendo ser reconhecidos, porque otimizar para a aprovação é, no fundo, querer ser reconhecido, decoramos o gabarito. Aprendemos tão bem que viramos excelentes naquele recorte. Tiramos a nota, ganhamos o cargo, recebemos o aceno de cabeça de quem queríamos agradar. Por dentro, parece que estamos vencendo.
O que ninguém avisa é o preço.
Porque não ajustamos apenas o que fazemos. Ajustamos o que vemos. O modelo que nos fez acertar a prova não fica guardado numa gaveta à espera da próxima prova. Ele vira a lente com que olhamos o resto.
Passei tanto tempo treinado para ler o mundo como mercado que comecei a ler tudo como mercado. Relações viraram alocação. Tempo virou ativo. Descanso virou custo de oportunidade.
Eu não escolhi enxergar assim. A lente foi se instalando sozinha, como sequela de cada vitória. Era boa demais para uma coisa e cega para todas as outras. Relações humanas, como alguns amigos me disseram com paciência, não são quantificáveis, ainda que, por vezes, eu insistisse.
E aqui está o que me persegue: cada vez que eu ficava melhor no meu jogo, ficava um pouco mais cego para os jogos onde aquilo não valia. A excelência não é neutra. Ela cobra pedágio na visão periférica. Quanto mais perfeitamente eu me encaixava num ambiente, menos eu conseguia existir fora dele. O brilho e a cegueira cresciam juntos, alimentados pela mesma fonte. Ninguém me avisou que ser muito bom em uma coisa é uma forma lenta de parar de ver as outras. De certa forma, a ideia de multidisciplinaridade deste blog também veio disso.
O olho não se vê
Podemos imaginar que a saída é óbvia: basta olhar para além do modelo. Mas é aqui que a armadilha se fecha, e é a parte que mais me incomoda. Com o que, exatamente, eu olharia para além? A única ferramenta que tenho para julgar se estou vendo sinal ou ruído é o próprio modelo que está viciado. Ele não consegue auditar a si mesmo, pela mesma razão que um olho não consegue se ver.
O que o sucesso dentro do modelo viciado me impede de enxergar, também me impede de enxergar a falta. Não é um ponto cego que eu poderia procurar com atenção. É um ponto cego sobre a existência do ponto cego. Não sei o que estou deixando passar, e não sei que não sei, porque a ferramenta que detectaria a falha é justamente a que está falhando.
Foi por isso que aquela noite em Portugal não tinha resposta. Eu estava tentando resolver com a planilha um problema que a planilha tinha ajudado a criar.
Não vou fingir que encontrei a saída, seria mentira, e contradiria tudo o que acabei de escrever. Mas existe uma pista, e ela vem do mesmo lugar de onde veio o diagnóstico.
Piorar de propósito
Quando um modelo está viciado nos próprios dados, a técnica para corrigir o problema é quase ofensiva ao bom senso: você o piora de propósito. Coloca um freio que o impede de se ajustar com perfeição ao treino. Aceita errar mais no passado conhecido em troca de acertar mais no futuro desconhecido. O nome disso é regularização, e o princípio é este: deixar margem. Não otimizar até o último decimal. Sacrificar um pouco de perfeição local para preservar a capacidade de funcionar em terreno novo.
Traduzido para uma vida, é quase insuportável de aceitar: piorar, de propósito, naquilo em que você é bom. Não dar o máximo em todo lugar. Deixar folga onde você poderia espremer mais resultado. Recusar a otimização final que o tornaria imbatível dentro da sala e inútil do lado de fora.
A margem
Talvez a maturidade não seja parar de fazer overfitting. Talvez seja apenas perceber, um pouco mais cedo a cada vez, que de novo estou ajustando minha vida inteira a um conjunto de dados que vai mudar. E voltar a deixar uma margem de segurança. Não de uma vez. Mas sempre que surge algo novo.
Quem fica perfeito e ajustado demais para o presente costuma ser o primeiro a quebrar quando o futuro chega.
E o futuro sempre chega com dados que ninguém viu no treino.



O olho não se vê sozinho. Dois já se enxergam, dependendo do ângulo. Como os teus amigos te ensinaram (que “relação humana não é planilha”), talvez a ideia não seja se analisar no escuro, mas deixar outro olhar. Conte com meus olhos para esses textos excelentes, meu amigo.
Eu adorei a referência ao aprendizado de máquina. Obrigado de novo por compartilhar o texto.