Slovenščina 3.0
Manage episode 426911152 series 3496831
Andraž "Brodul" Brodnik in Oto Brglez sta v Portorožu v sklopu konference Make IT 2024 govorila z dr. Markom Bajcem. dr. Marko Bajec je vodja Laboratorija za podatkovne tehnologije na UL FRI.
Kjer se zadnja letapospešeno ukvarjajo z jezikovnimi in govornimi tehnologijami.
V okviru projekta RSDO (Razvoj slovenščine v digitalnem okolju) je vodil projekt “govorne tehnologije”, v okviru katerega so razvili razpoznavalnik slovenskega govora ter strojni prevajalnik za par slovenščina, angleščina. (Orodja: Prevajalnik, Razpoznalnik, Terminološki portal in ostalo na slovenscina.eu,...
Govorne tehnologije razvijajo naprej v okviru spinoff-a Vitasis. Njihove rešitve (razpoznava slovenskega govora, sinteza govora, strojno prevajanje) so že prisotne v zdravstvu, telekomunikacijah, državni upravi, RTV,...
Raziskovalno gledano je na področju jezikovnih in govornih tehnologij veliko izzivov in zadnje čase tudi priložnosti. Nekaj teh Marko s koleg naslavlja s projekti, kot so PoVeJMo: Prilagodljiva obdelava naravnega jezika s pomočjo Velikih Jezikovnih Modelov, ARIS, 2023-2026, Mezzanine: teMeljnE raZiskave Za rAzvoj govorNih vIrov in tehNologij za slovEnščino, ARIS, veliki temeljni projekt, 2023-2025, ProteVerb: Pravni, etični in tehnološki vidiki obdelave besedilnih in govornih virov podatkov za znanstvene, raziskovalne in razvojne namene, Ministrstvo za digitalno preobrazbo, 2022-2024,…
Slovenščina spada med “male jezike”, zato je potrebna inovativnost, saj prenos znanja iz velikih jezikov včasih ni izvedljiv.
Nekaj teh praktičnih, organizacijskih, pravnih ter tehničnih izzivov smo razkrili tudi v našem pogovoru.
Epizodo so omogočili podporniki via Patreon in podjetja 3fs, Humanfrog ter Kaldi!
P.s: zelo veseli bomo tudi vašega mnenja via Discord - https://bit.ly/discord-ogrodje 🚀
48 episod