Hramadstva22

Prajekt SONORA šukaje tych, chto dapamoža «padklučyć» biełaruski hołas da BigTech

U kanale «TTS pa-biełarusku» źjaviłasia abjava ab zapusku SONORA. Heta prajekt, dzie ŭdzielniki zapisvajuć adkryty biełaruski dataset dla TTS — «kab biełaruskaja hučała naturalna ŭ sučasnych AI-servisach», piša telehram-kanał Dzik Pic.

Zdymak ilustracyjny. Fota: freepik.com

U čym prablema? Jak śćviardžajecca na sajcie, siońnia ŭ śviecie amal nie isnuje jakasnych biełaruskamoŭnych hałasavych datasetaŭ, śpiecyjalna zapisanych dla navučańnia sučasnych TTS-madelaŭ. Pry hetym u biełaruskaj movie tysiačy amohrafaŭ: adnolkavaje napisańnie, ale rozny sens u zaležnaści ad nacisku. Kali madel pamylajecca z naciskam, łamajecca i hučańnie, i sens. 

Druhaja prablema — fanietyčnaja karektnaść: miakkaść, «ŭ», «dz/dž», intanacyja i rytm:

«Bieź jakasnaha studyjnaha materyjału madeli paŭtarajuć pamyłki i hučać mienš naturalna».

Tak, siońnia ŭžo isnujuć padobnyja inicyjatyvy, naprykład, Donar.by albo madel BexTTS. Ale Sonora praciahnie ichni šlach i «vyviedzie jaho na studyjny ŭzrovień».

Tamu entuzijasty zapuścili supolnaje finansavańnie, kab «arhanizavać prafiesijny studyjny zapis biełaruskaha maŭleńnia na śpiecyjalna padabranych tekstach». Karystacca datasetam zmohuć daśledčyki, entuzijasty, startapy i adukacyjnyja inicyjatyvy.

Akramia taho, kamanda płanuje partniorstva z Google, OpenAI i ElevenLabs — «kab naš dataset uzmacniŭ ich rašeńni dla biełarusaŭ».

SONORA šukaje ciopłyja intry/pramyja kantakty ŭ:

  • Google;
  • OpenAI;
  • ElevenLabs;
  • Speechify;
  • Meta.

«Kali viedajecie kaho-niebudź u hetych kampanijach i možacie zrabić intra — napišycie, kali łaska, u pryvat, albo napišycie zvarot ad nas sami. Tekst zvarotu tut», — prosiać stvaralniki.

Vy možacie pasłuchać, jak hučyć biełaruskaja mova ŭ technałohijach siońnia, na startavaj staroncy.

Kamientary2

  • ???
    09.03.2026
    Čamu naprykład hetym nie zajmajecca Kaardynacyjnaja Rada? Ci hiendarnyja kvoty i łhbt važniej čym biełaruskaja mova?
  • Čarhovy viełasipied
    10.03.2026
    Tak a ŭ čym roźnica pamiž dadzienym prajektam i Donar.by? Donar.by ž śpiecyjalna pašyraŭ funkcyjanał Common Voice, kab byli datasety nie tolki na raspaznavańnie havorki, ale i na ahučku.

    Nu a nakont "amal nie isnuje jakasnych biełaruskamoŭnych hałasavych datasetaŭ", to naohuł chłuśnia, na adnym tolki Common Voice na dadzieny momant zapisana i pravierana 1800 hadzin ad bolš jak 8000 čałaviek. Takija vialikija datasety ŭ svabodnym dostupie mała dla jakoj movy isnujuć.

Ciapier čytajuć

Prapahanda rychtuje hramadstva da zahadkavaj «praciahłaj kamandziroŭki» Łukašenki29

Prapahanda rychtuje hramadstva da zahadkavaj «praciahłaj kamandziroŭki» Łukašenki

Usie naviny →
Usie naviny

Budynak krejdavaha zavoda ŭ Biełharadskaj vobłaści razburany ŭ vyniku ŭdaru bieśpiłotnikaŭ1

Orden Biełaha Arła, jaki zabrali ŭ Zialenskaha, viarnuŭsia ŭ Polšču. Što ź im budzie ciapier?4

U Krymie zdaryłasia maštabnaje adklučeńnie śviatła6

Dla ramontu mosta kala płoščy Pieramohi budzie pierakryty praśpiekt Niezaležnaści

Čamu ŭ Minsku nie pabudujuć mietro ŭ «Paŭnočny Bierah»?14

Pačaŭ chamić: siamiejnaja para ŭ Biełarusi admoviłasia ad 16‑hadovaha syna2

Nivodzin łukašenkaŭski ŚMI i kanał nie vykarystaŭ słova «retranślatary». Što heta moža aznačać?64

Prezidentka Mieksiki zaprasiła znakamituju kačku Mierlin da siabie ŭ pałac, a taja dzieŭbanuła jaje ŭ ruku

Lepielskaja sudździa Kručynina, jakaja represavała miedykaŭ, pastara, ratavalnikaŭ, zvolniłasia pa ŭłasnym žadańni8

bolš čytanych navin
bolš łajkanych navin

Prapahanda rychtuje hramadstva da zahadkavaj «praciahłaj kamandziroŭki» Łukašenki29

Prapahanda rychtuje hramadstva da zahadkavaj «praciahłaj kamandziroŭki» Łukašenki

Hałoŭnaje
Usie naviny →

Zaŭvaha:

 

 

 

 

Zakryć Paviedamić