Few-Shot Prompting

A ideia: Inclua pares de tradução verificados e de alta qualidade como exemplos em contexto para que o LLM aprenda os padrões, estilo e convenções da língua alvo por demonstração em vez de instrução.

:::info Este é um cookbook, não uma implementação finalizada Este guia esboça a abordagem e suas principais decisões de design. Adapte-o para seu par de idiomas e recursos disponíveis. :::

Quando Usar Isto

Você tem um pequeno conjunto de traduções verificadas (até 5–10 pares de ouro ajudam)
Você quer que o LLM corresponda a um estilo ou registro específico por exemplo em vez de regra
Sua língua alvo tem padrões que são mais fáceis de mostrar do que descrever (ordem das palavras, padrões de afixação, marcadores de formalidade)

Como Funciona

Curar pares de exemplo — selecione traduções fonte→alvo de alta qualidade que demonstrem padrões-chave
Formatar como exemplos em contexto — inclua-os no prompt do sistema ou do usuário antes da solicitação de tradução real
Executar o harness — meça se os exemplos melhoram as métricas em relação ao zero-shot
Iterar na seleção de exemplos — troque exemplos para cobrir diferentes modos de falha

Estrutura de Prompt de Exemplo

You are translating English to Plains Cree (SRO orthography).

Examples of correct translations:
- "Hello" → "tânisi"
- "Thank you" → "kinanâskomitin"  
- "I am going home" → "nikîwân"
- "The children are playing" → "awâsisak mêtawêwak"

Now translate the following:
- "Welcome to the school"

Regra Crítica: Sem Contaminação de Dados de Avaliação

:::danger NÃO use dados de avaliação como exemplos few-shot Se seus exemplos vêm do conjunto de dados de avaliação, seu método será desqualificado do leaderboard. Exemplos few-shot devem vir de fontes independentes — dicionários, livros didáticos, pares verificados pela comunidade ou um conjunto de desenvolvimento separado. O harness faz fingerprint do seu prompt exato; a contaminação é detectável. :::

Principais Decisões de Design

Quantos exemplos? 3–8 é o ponto ideal. Menos dá ao LLM muito pouco sinal; mais consome a janela de contexto com retornos decrescentes.

Quais exemplos? Priorize diversidade em vez de dificuldade. Cubra diferentes estruturas de sentença, comprimentos de palavras e características gramaticais. Não agrupe exemplos em torno de um padrão.

Seleção estática vs. dinâmica? Exemplos estáticos são mais simples. Seleção dinâmica (escolher exemplos semelhantes à entrada atual) pode melhorar a qualidade, mas adiciona complexidade — considere modelos encadeados para a etapa de recuperação.

Prós e Contras


✅ Poderoso para correspondência de estilo	❌ Pequena janela de contexto limita a contagem de exemplos
✅ Sem treinamento necessário	❌ Seleção de exemplos é uma arte, não uma ciência
✅ Funciona com qualquer LLM	❌ Risco de contaminação de dados de avaliação (desqualificação)
✅ Fácil de fazer testes A/B com diferentes conjuntos de exemplos	❌ Exemplos podem não generalizar para todos os tipos de entrada

Combina Bem Com

Coached LLM Prompting — regras + exemplos juntos vencem qualquer um sozinho
Dictionary-Augmented LLM — termos forçados + exemplos de estilo
FST-Gated Pipeline — exemplos para estilo, FST para correção morfológica

Veja Também

MT Evaluation Rules — o que é desqualificado
Evaluation Datasets — saiba o que você NÃO PODE usar como exemplos
Support a Low-Resource Language

Quando Usar Isto​

Como Funciona​

Estrutura de Prompt de Exemplo​

Regra Crítica: Sem Contaminação de Dados de Avaliação​

Principais Decisões de Design​

Prós e Contras​

Combina Bem Com​

Veja Também​