Xiaomi heeft een ultrasnel spraakherkenningsmodel ontwikkeld en het OpenSource gemaakt
Xiaomi heeft een spraakherkenningsmodule genaamd MiDashengLM-7B ontwikkeld. Door gebruik te maken van neurale netwerken in plaats van vaste algoritmes, heeft het bedrijf de snelste spraakherkenningsprestaties behaald in 22 synthetische tests. Dit maakt het mogelijk om gebruikersplatforms te bouwen die bijna zonder vertraging werken. Het model kan worden gebruikt in smartphones, smart home-systemen, auto's, enz.
MiDashengLM-7B analyseert audio in realtime en scheidt omgevingsgeluiden of muziek. Xiaomi past dit spraakmodel al actief toe in de praktijk in zijn producten, bijvoorbeeld de YU7-auto die voortdurend geluid analyseert en het geluid van krassen of brekend glas kan detecteren, wat je in staat stelt om het alarm in te schakelen, zelfs wanneer er geen impact is die door de bewegingssensor zou worden gedetecteerd.
Xiaomi heeft de broncode voor de geavanceerde spraak gepubliceerd onder de Apache License 2.0, evenals gedetailleerde documentatie over de training en implementatie van de technologie. Het model kan dienen als basis voor ontwikkelaars en academische onderzoekers die open spraak systemen willen creëren zonder afhankelijkheid van gesloten ecosystemen.
Chinese bedrijven staan niet bekend om hun werk aan open-sourceprojecten. Door het taalmodel open te stellen, trekt Xiaomi meer ontwikkelaars aan, wat dit product helpt concurreren op gelijke voet met analogieën van grote technologiecorporaties. De ervaring heeft geleerd dat grote en complexe softwareproducten, zoals een besturingssysteem of browser, sneller ontwikkelen en competitiever worden als ze worden ontwikkeld door een open gemeenschap van programmeurs in plaats van door een enkel bedrijf.