Goodhart Law IA

Categoria

Termos Tecnicos Avancados

Goodhart Law aplicada a IA afirma que quando uma métrica se torna alvo de otimização, ela deixa de ser uma boa métrica. Em IA, modelos otimizados diretamente em métricas proxy como BLEU ou reward score podem produzir resultados que pontuam alto mas sao qualitativamente ruins.

Categoria

Termos Tecnicos Avancados

Goodhart Law aplicada a IA

A Lei de Goodhart, quando aplicada a inteligência artificial, alerta que quando uma métrica se torna o objetivo direto de otimização, ela deixa de ser uma medida confiavel do que realmente queremos medir.

Manifestacoes em IA:

Modelos otimizados em BLEU geram texto que pontua alto mas é artificial
Reward models hackeados por LLMs que encontram exploits na métrica
Metricas de engagement que levam a conteúdo viciante em vez de útil
Otimizacao de acuracia que mascara falhas em subgrupos minoritarios

Implicacoes práticas:

Usar multiplas métricas complementares, não apenas uma
Incluir avaliação humana além de métricas automáticas
Monitorar métricas que não sao alvo de otimização
Avaliar qualidade real em produção, não apenas em benchmarks

A Trilion aplica principios da Lei de Goodhart ao desenhar sistemas de avaliação de IA, usando multiplas métricas é avaliação humana para garantir que otimização produza melhoria genuina.

Goodhart Law IA

Goodhart Law aplicada a IA

Termos relacionados

Glossário...