Cómo se paga a los hablantes
Nota de transparencia. Cada número en esta página ya aparece en una especificación publicada — la Especificación del Benchmark §10, el Protocolo de Validación de Hablantes, y la Especificación de Premios. Esta página los reúne en un solo lugar, en lenguaje claro, para que nadie tenga que leer una especificación para averiguar cuánto vale el tiempo de un hablante aquí. No hace compromisos más allá de lo que esos documentos ya establecen.
Un hablante bilingüe que pueda juzgar si una oración producida por una máquina es real, fluida y significa lo correcto es el participante más escaso y valioso en todo este sistema. Todo lo demás — arneses, métricas, tablas de clasificación — existe para hacer que una pequeña cantidad del tiempo de esa persona rinda mucho.
Así que la primera regla es simple: los hablantes se pagan por su tiempo, a tasas profesionales, independientemente de lo que muestren los resultados.
Por qué pagar a los hablantes es innegociable
La investigación en tecnología del lenguaje tiene una larga costumbre de tratar a los hablantes fluidos como un recurso gratuito — "participación comunitaria" que produce conjuntos de datos, artículos y carreras para todos excepto para los hablantes. Consideramos ese patrón extractivo, y las personas más calificadas para hacer este trabajo son precisamente aquellas cuyo tiempo ya está reclamado por el trabajo urgente de enseñar, traducir y criar hijos en el idioma.
Tres consecuencias de diseño se derivan de esto:
- Sin canal de voluntarios. No pedimos a los hablantes que donen trabajo de evaluación como un favor a la investigación. La participación es un compromiso pagado, y rechazarlo no le cuesta nada a un hablante.
- El pago es incondicional. Los hablantes se pagan independientemente de si sus calificaciones se utilizan o no, y el pago no está condicionado a los resultados. El protocolo publicado se compromete al pago dentro de dos semanas de completar cada bloque de tareas.
- La compensación no es todo el trato. Los hablantes que contribuyen calificaciones también reciben crédito (nombrado o anónimo, su elección), coautoría opcional en publicaciones que usan sus calificaciones, el derecho de retirar sus contribuciones en cualquier momento, y poder de veto sobre la publicación de resultados que encuentren problemáticos. Esos términos están en el Protocolo de Validación de Hablantes §5–6, no en una carta adicional.
Las tasas publicadas
El marco de costos del benchmark establece la compensación de hablantes bilingües en $50–65 CAD por hora para trabajo de corpus y validación. Lo que eso significa por rol:
Construir un corpus de benchmark
Crear las traducciones de referencia contra las que se califica cada método es la tarea fundamental del hablante. El presupuesto de establecimiento publicado por idioma:
| Trabajo | Rango publicado | Base |
|---|---|---|
| Curación de corpus (50–150 entradas) | $2,500–6,000 | $50–65/hr, tiempo de hablante bilingüe |
| Revisión de salida de métodos | $500–1,500 | Mismas tasas horarias |
Un corpus completo tradicionalmente toma a un hablante aproximadamente 80 horas; el flujo de trabajo asistido por agentes planeado (redacción y formato de oraciones manejados por herramientas, traducción siempre por un humano) está diseñado para llevar eso hacia 30–40 horas — menos horas de trabajo repetitivo, la misma tarifa horaria, con el hablante haciendo solo las partes que genuinamente requieren un humano.
Validar las métricas
Antes de que las puntuaciones automatizadas signifiquen algo, los hablantes tienen que verificarlas contra el juicio humano. El Protocolo de Validación de Hablantes publica las tareas exactas, horas y pago:
| Tarea | Tiempo | Pago por hablante |
|---|---|---|
| A — Calificar 200 traducciones de máquinas por adecuación y fluidez | ~8 horas | $400–520 CAD |
| B — Revisar 50 pares de traducciones "equivalentes" | ~2 horas | $100–130 CAD |
| C — Revisar 100 palabras que el analizador morfológico rechazó | ~1.5 horas | $75–100 CAD |
Un hablante que hace las tres tareas se compromete aproximadamente 11.5 horas durante dos a cuatro semanas por $575–750 CAD. La ronda completa de validación de tres hablantes cuesta al proyecto $1,475–1,920 — que es el punto: la validación de hablantes es un pequeño rubro para el proyecto y nunca debería ser donde se "ahorren" costos.
Revisar reclamaciones de premios
Ningún premio se paga solo en puntuaciones automatizadas. El Premio del Fundador ($10,000 CAD, inglés→Plains Cree) requiere que al menos dos hablantes bilingües revisen independientemente una muestra estratificada de al menos 30 salidas, y que el 70% o más se califique como "aceptable" o "excelente". Esa revisión es trabajo de hablante pagado bajo las mismas tasas — y también es una puerta: los hablantes pueden hundir una reclamación de premio, y eso es por diseño.
Cómo escala con concursos
El modelo está construido para que la compensación de hablantes crezca con la plataforma en lugar de ser diluida por ella:
- Cada nuevo idioma comienza con un compromiso de corpus pagado. El costo de establecimiento publicado por idioma ($3,350–8,500 todo incluido) es principalmente compensación de hablantes — el componente individual más grande, deliberadamente.
- Cada nuevo fondo de premios trae su propia revisión pagada. Cada concurso patrocinado que sigue la plantilla de premios lleva el mismo requisito de validación comunitaria, lo que significa que cada concurso financia trabajo de revisión de hablantes para ese idioma.
- Los métodos desplegados financian revisión continua. Cuando un método de propiedad comunitaria genera ingresos de API, el 90% fluye hacia la organización de gobernanza de la comunidad (el modelo económico), que puede financiar revisión continua, crecimiento de corpus y programas de idioma como lo considere conveniente. Esa asignación es decisión de la comunidad, no la nuestra.
Lo que no hemos prometido
La honestidad requiere marcar los bordes:
- Las tasas anteriores son las tasas publicadas para el trabajo actual de Plains Cree. Las tasas para idiomas futuros se establecerán con la comunidad asociada y se publicarán de la misma manera — en las especificaciones, antes de que comience el trabajo.
- El volante (ingresos → comunidad → más trabajo pagado) requiere financiamiento externo para comenzar y aún no es autosuficiente. El modelo económico describe el mecanismo, no una garantía.
- "Pagado justamente" es necesario pero no suficiente. El pago por sí solo no hace que un proyecto sea no extractivo — la propiedad y el control lo hacen, por lo que la compensación se encuentra dentro de la arquitectura de soberanía en lugar de reemplazarla.
Lo que esto significa para usted
:::info Si es miembro de la comunidad Si es bilingüe en un idioma poco atendido e inglés, su juicio es la entrada más valiosa en este sistema, y los términos publicados son: $50–65 CAD/hora, horarios flexibles, pago dentro de dos semanas, crédito en sus términos, y el derecho de retirar sus contribuciones. No se requiere programación. Comience con Para Comunidades de Idiomas o el Protocolo de Validación de Hablantes §7. :::
:::info Si es investigador Presupueste la compensación de hablantes como un costo de investigación de primera clase — las cifras publicadas ($1,475–1,920 para una ronda de validación de métricas; $2,500–6,000 para curación de corpus) son pequeñas según los estándares de subvenciones y son lo que hace que las puntuaciones automatizadas sean defendibles. La Estrategia de Asociación de Corpus muestra cómo un departamento académico se conecta con esto con trabajo de hablantes financiado incorporado. :::
:::info Si es constructor Se beneficia del trabajo de hablantes pagados incluso si nunca lo financia: las métricas validadas son lo que hace que su puntuación de tabla de clasificación sea significativa, y la revisión comunitaria pagada es lo que se interpone entre su método y un premio. Si gana, espere que los hablantes hayan sido pagados para escudriñar su salida — y espere que la propiedad de su método se transfiera a la comunidad cuyo idioma sirve. :::
Véase también
- La Traducción No Es Revitalización — por qué la autoridad del hablante enmarca todo lo demás
- Reportar Errores y Asumir Correcciones — autoridad del hablante después del benchmark, también
- Especificación del Benchmark §10 — el marco de costos completo del que provienen estos números