Fouten Melden en Correcties Beheren

Standpunt. Fouten maken is onvermijdelijk voor een platform dat feiten en evaluaties over duizenden talen publiceert. Wat niet onvermijdelijk is, is wie geloofd wordt wanneer een fout wordt gemeld, en wie de correctie beheert. Ons antwoord: de melding van een moedertaalspreker heeft meer gewicht dan onze automatisering, elke correctie bevat herkomstinformatie over wie wat heeft gewijzigd en waarom, en een gemeenschap kan het gebruik van haar taalgegevens intrekken of verbieden — niet als beleefdheidsgebaar, maar als een afdwingbare eigenschap van de architectuur.

De meeste dataplatforms behandelen foutmeldingen als supporttickets: een gebruiker klaagt, een beheerder beslist, het record wordt stilzwijgend gewijzigd. Voor gegevens over inheemse talen staat dat model op zijn kop. De persoon die de fout meldt, is doorgaans gezaghebbender dan het platform — een spreker die ons vertelt dat een woord onjuist is, is geen "gebruiker"; zij zijn de grondwaarheid die een proxy corrigeert. Het onderstaande ontwerp volgt uit het serieus nemen van dat gegeven.

Twee soorten fouten, één principe

Het platform publiceert twee soorten beweringen die onjuist kunnen zijn:

Feiten over een taal — de taalkaarten die evaluatie sturen: classificatiegegevens, orthografie, taalkundige kenmerken, welke metrieken van toepassing zijn. Een kaart kan een onjuiste schatting van het aantal sprekers bevatten, een onjuiste dialectrelatie, of een onjuiste status van het schrijfsysteem.
Oordelen over vertalingen — een referentievertaling in een corpus die een spreker als onjuist of onnatuurlijk beschouwt; een geautomatiseerde metriek die een geldig woord afwijst of een ongeldig woord accepteert; een "Deployable"-badge op uitvoer die sprekers niet zouden accepteren.

Het principe dat beide dekt, reeds bindend in de Scoringsspecificatie en Benchmarkspecificatie §7: geautomatiseerde uitvoer zijn proxies; sprekers zijn de grondwaarheid. De gepubliceerde toezegging in het Sprekervalidatieprotocol §6 stelt het onomwonden: als een spreker zegt dat de linter ergens fout zit, passen wij de linter aan.

Hoe een melding verloopt

Hieronder staat het traject dat een melding aflegt, met eerlijke statusmarkeringen — een deel hiervan werkt vandaag, een deel is gespecificeerd maar nog niet gebouwd.

Een onjuiste vertaling of metriekoordeel melden (vandaag operationeel, via direct kanaal). Een spreker die een onjuiste referentievertaling, een ten onrechte afgewezen woord, of een onaanvaardbaar "equivalent" ziet, kan dit melden via de openbare issue tracker van het project of door rechtstreeks contact op te nemen met het project. De gestructureerde versie hiervan — beoordelingsschermen met opties afwijzen / globale betekenis / acceptabel / uitstekend en vrije-tekstvelden — is de community review-interface, die is gespecificeerd in Benchmarkspecificatie §7.3 maar nog niet live is. Tot die tijd worden meldingen persoonlijk afgehandeld, en zijn de validatietaken zelf (betaalde, gestructureerde sprekersbeoordeling — zie Hoe Sprekers Betaald Worden) de voornaamste correctiepijplijn.

Een onjuist feit op een taalkaart melden (vandaag operationeel, via dezelfde kanalen). Kaartcorrecties volgen hetzelfde traject: melding, beoordeling, versiegebonden wijziging. Omdat kaarten het evaluatiegedrag sturen — welke metrieken worden geladen, welke modellen worden aanbevolen — kan een kaartcorrectie scores wijzigen; correcties worden daarom toegepast als vastgelegde gegevenswijzigingen, nooit als stille bewerkingen.

Wat er daarna gebeurt — wie beslist:

Taalkundige oordeelsvragen behoren toe aan sprekers van die taal. Of een vorm geldig is, of twee formuleringen equivalent zijn, of een register passend is — het platform implementeert het antwoord; het levert het niet. Waar sprekers het oneens zijn (dialecten, orthografische conventies), wordt het antwoord vastgelegd als variatie, niet door ons beslecht — de corpus- en linterschema's ondersteunen het labelen van dialectvarianten als aanvaardbare alternatieven in plaats van één winnaar af te dwingen.
Beslissingen over de gegevens van een gemeenschap behoren toe aan haar bestuursorganisatie. Voor talen met een bestuursorganisatie verlopen wijzigingen in evaluatiecorpora, het accepteren van correcties in verzegelde testsets en de gevolgen voor inzet via hen — dat is het Controleprincipe van OCAP® geïmplementeerd als proces, niet als poster.
Mechanische fouten worden gewoon gecorrigeerd. Een typefout, een verbroken link, een verkeerd geparseerd veld — gemeld, gecorrigeerd, gelogd. Niet alles vereist een raadsvergadering.

Correcties bevatten herkomstinformatie

Een correctie die u niet kunt traceren, is slechts een recentere mening. Drie herkomstregels gelden voor elk feit en elke correctie:

Elk feit vermeldt zijn bron. Taalkaarten en corpusitems leggen vast waar elke waarde vandaan komt — een gepubliceerde dataset, een gemeenschapsbijdrage, een beoordeling van een spreker.
Afgeleide waarden worden gelabeld als van ons, niet van de upstream. Wanneer het platform iets berekent — een aggregaat, een hercodering, een samengestelde score — wordt dit vastgelegd als een platformafleiding van de upstreambron, nooit onder de naam van de upstream geschreven. Een upstreamdataset mag nooit de schuld krijgen van, of de eer ontvangen voor, een getal dat zij niet heeft gepubliceerd.
Correcties worden onderdeel van het record. De correctie van een spreker wordt vastgelegd als een nieuwe, toegeschreven bewering (op naam of anoniem, naar keuze van de spreker — dezelfde voorwaarden als voor validatiewerk) die de oude waarde vervangt; de geschiedenis van wat er is gewijzigd blijft controleerbaar. Corpusversies zijn voorzien van hash-manifesten (Corpuspartnerschap §4.4), zodat een gecorrigeerd corpus een zichtbaar nieuwe versie is, en elke run card legt exact vast tegen welke versie is gescoord — oude scores blijven interpreteerbaar, nieuwe scores weerspiegelen de correctie.

Het vetorecht, concreet

"Gemeenschapscontrole" is gemakkelijk te claimen. Hier is wat het concreet betekent in de gepubliceerde architectuur:

Sprekers kunnen hun bijdragen intrekken. Een spreker kan zijn of haar beoordelingen op elk moment intrekken, en intrekking verwijdert deze uit alle analyses (Sprekervalidatie §5). Sprekers hebben ook vetorecht over de publicatie van resultaten die zij problematisch achten.
Gemeenschappen kunnen evaluatie volledig stopzetten. Verzegelde testsets zijn versleuteld, met sleutels die zo worden bewaard dat het platform ze nooit alleen kan reconstrueren; een gemeenschap kan evaluatietoegang intrekken door niet deel te nemen aan sleutelreconstructie (Corpuspartnerschap §4.3). "Wat als we willen stoppen?" heeft een gespecificeerd antwoord: de verzegelde gegevens worden nooit blootgesteld, en de evaluatie eindigt.
Geen enkele score overstijgt een gemeenschapsbeslissing. Een methode die bovenaan de ranglijst staat, wordt pas ingezet als de bestuursorganisatie daarmee instemt (Eigendomsoverdracht) — en een gemeenschap die besluit dat MT voor haar taal helemaal niet ingezet mag worden, maakt gebruik van het systeem zoals het is ontworpen, en breekt het niet (zie Vertaling Is Geen Revitalisering).

Wat we nog niet hebben gebouwd

In de geest van de rest van dit onderdeel: de community review-interface is gepland, maar niet live. Bestuursorganisaties zijn voor geen van de huidige talen opgericht — het gemeenschapsbeheer voor de Plains Cree-benchmark is in bevestiging, en wij noemen beheerders niet publiekelijk voordat zij toestemming hebben gegeven. Tot die onderdelen bestaan, verlopen correcties via directe, traceerbare kanalen, en blijven de gepubliceerde specificaties — niet deze pagina — de bindende beschrijving van het proces. Waar deze pagina en een specificatie van elkaar afwijken, prevaleert de specificatie, en wij beschouwen de afwijking zelf als een fout die het melden waard is.

Wat dit voor u betekent

:::info Als u een gemeenschapslid bent Als er iets over uw taal op dit platform onjuist is — een feit, een vertaling, een label — is uw melding getuigenis van de grondwaarheid, geen klacht die moet worden geprioriteerd. U beslist of uw correctie op naam wordt vermeld; uw bijdrage kan later worden ingetrokken; en uw gemeenschap kan het gebruik van haar gegevens volledig stopzetten. Begin bij Voor Taalgemeenschappen, of open gewoon een issue in de openbare repository. :::

:::info Als u een onderzoeker bent Correcties hier zijn gegevens met herkomstinformatie, geen stille bewerkingen: corpusversies zijn voorzien van hashes, run cards pinnen de exacte versie waartegen is gescoord, en afgeleide waarden zijn gelabeld als afleidingen. Als u voortbouwt op Arena-scores of -corpora, citeer dan de versie — en beschouw een golf van sprekergestuurde correcties als een bevinding over de geldigheid van metrieken, want dat is wat het is. :::

:::info Als u een ontwikkelaar bent De score van uw methode kan legitiem veranderen zonder dat uw code verandert — een ten onrechte afgewezen woord wordt toegestaan, een referentievertaling wordt gecorrigeerd, een variantklasse wordt gecorrigeerd. Ontwerp hierop in: pin corpusversies in uw run cards (Run Card-specificatie), houd dataset-changelogs bij, en beschouw sprekerscorrecties als het betrouwbaarste foutssignaal dat u ooit gratis zult ontvangen. :::

Zie ook

Hoe Sprekers Betaald Worden — dezelfde sprekerautoriteit, in de benchmarkfase
Van Benchmark naar Dagelijks Gebruik — waar correcties de publicatieworkflow ontmoeten
Gegevenssouvereiniteit — OCAP®, CARE en Te Mana Raraunga, de principes achter dit ontwerp

Twee soorten fouten, één principe​

Hoe een melding verloopt​

Correcties bevatten herkomstinformatie​

Het vetorecht, concreet​

Wat we nog niet hebben gebouwd​

Wat dit voor u betekent​

Zie ook​