Ite est Common Voice? Est una faina/aina de Mozilla. Pertocat fintzas sa limba sarda? Eja. Pro ite naschet custu progetu e pro ite interessat sas limbas de minoria chi sufrint s’egemonia de àteras dominantes? Sa risposta cheret chircada sestende un’analizu in contu de dataset de tecnologias vocales. Su bonu de custos archìvios est de propiedade aziendale, sos testos sunt lèghidos mescamente in inglesu e su prus de sas bortas sas boghes sunt de òmines biancos.
Duncas, si sa punna de su profetu econòmicu e sa mancàntzia de democratzia sunt s’alfa e s’omega de custos sistemas de màdrighe capitalista, Mozilla faeddat de sesi giai in sa home page sua: «Non semus s’azienda tecnològica tìpica. Su chi aprontamus ponet sas persones e sa privadesa issoro a dae in antis de su profetu». E de sos de Sardware giai l’ischimus ite est chi sunt faghende pro sardizare sa tecnologia. Non nch’at coladu tempus meda dae cando, paris, s’azienda californiana e sos ativistas sardos e sardòfonos, ant presentadu a Firefox in sa versione cun sa limba nostra. Como, lu fìamus antitzipende, est sa borta de Common Voice.
Common Voice est unu pachete de datos vocales a disponimentu pùblicu chi movet dae sas boghes de sos collaboradores de totu su mundu; collaboradores voluntàrios chi, faghende custu, agiudu mannu dant pro s’annestru de sos modellos de machine learning (una suta-casta de s’Ia pro su megioru de sas prestatziones cunforma a sos datos collidos). Sa versione in sardu l’agatamus inoghe, cun pagos e prus chi non fàtziles inditos de impreu.
Sa faina est comintzende e, pro chi sos motores istatìsticos siant annestrados, bi diant chèrrere oras e oras de registratziones chi sos utentes podent lassare in cue, in archìviu, seberende s’optzione “chistiona”. Àteru sèberu est su de “ascurta” pro chi s’utente potzat validare su chi at intesu. A su presente – como chi semus isterrende custas rigas – b’at 3 oras de registratziones unu unu livellu de cunvàlida de su 67%.
Si damus una mirada a Common Voice, podimus bìdere currende, in suta de ogros nostros, unu muntone de fràsias in sardu istèrridas in custos annos de iscritura militante (mancari como privos de una polìtica linguìstica de impreu massissu de sa Lsc, truncu mama pro sos innestos terminològicos e base naturale pro sos linguàgios informàticos e de sa tecnologia). Fràsias chi posca cherent lèghidas e registradas in cue etotu pro chi abarrent in sa natura vocale issoro. Carchi esèmpiu? «A bìdere istemus su cando» (belle una serrada de editoriale giornalìsticu cun congiuntivu càrrigu de dudas); «Ma sa limba de sa Repùblica est su frantzesu» (pro seguru pigada dae un’artìculu chi faeddat de un’isula surella e de sa limba sua); «Paràula crae: prodùere giogu» (una crònaca de disafiu de fùbalu?). E gasi sighende·bi·la.
Ite narant sos voluntàrios ativistas de Sardware? «Podet èssere fintzas unu giogu ispassiosu pro imparare a sa pitzocalla», gosi Maurizio Piroddi, babbu de duos pipios. Galu: «Sa filosofia de Mozilla est pròpiu a s’imbesse de sa de is aziendas tecnològicas mannas», annaghet Gianfranca Orunesu. Aziendas chi, cheret naradu, pagu bi punnant a sas limbas nostras. Ma su mundu est fatu prus de persones chi non non de aziendas. E (acò·lu s’iscumprou) b’at prus oras registradas in catalanu (3864) chi no in inglesu (3499). Ambas custas duas limbas (chi non tenent su matessi nùmeru de locutores peri su mundu, cheret ammentadu) sunt a su 73% de livellu de cunvàlida.
S’esèmpiu catalanu nos dat s’idea de comente una limba minorizada ma populare potzat dare resurtados ispantosos che a custu. De su restu, ammentat Adrià Martín, membru de Sardware e chircadore in tecnologias pro sa tradutzione, «Common Voice est istadu adotadu dae su guvernu catalanu: dae ativistas fintzas a su presidente de su guvernu, meda gente at contribuidu donende sa boghe sua, e at incoragiadu a àtere a ddu fàghere. Fintzas iscuadras comente su Bartzellona ant mustradu publitzidade de su progetu durante is partidas in s’istàdiu».
Nois pro como non nde cuntentamus de su Cagliari abarradu in Sèrie A. Ma in contu de limba semus galu in categorias minores. Si amus a avantzare – campionadu cun campionadu, produende giogu – at a èssere fintzas pro mèdiu de custos trastes.
Attività realizzata col contributo della Regione Sardegna – IMPRENTAS 2023-2024. LR 22/2018. Atividade realizada cun su contributu de sa Regione Sardigna – IMPRENTAS 2023-2024 LR 22/2018