Du måste aktivera javascript för att sverigesradio.se ska fungera korrekt och för att kunna lyssna på ljud. Har du problem med vår sajt så finns hjälp på https://kundo.se/org/sverigesradio/

Ny teknik håller isär röster i stökig miljö

Kontor med cirka tio medarbetare som går, står och sitter framför datorskärmar och pratar med varandra och i telefon. Två blonda kvinnliga medarbetare vid sina datorer i förgrunden.
På kontoret kan det vara så pratigt att den kan vara svårt att urskilja röster, i alla fall om man är maskin. Foto: Gustaf Klarin

Japanska forskare har med hjälp av maskininlärning utvecklat teknik som identifierar unika detaljer i enskilda röster, en sorts röstens fingeravtryck.

Det kan vara svårt att höra i stökiga miljöer, särskilt om man är en maskin. 

Men nu kommer ny teknik som ska kunna urskilja olika röster på det stökiga kontoret eller cocktailpartyt.

Inom området röststyrning av telefoner och andra apparater är det här ett problem som är viktigt att hitta lösningar på.

Japanska forskare har med hjälp av maskininlärning utvecklat teknik som som kan urskilja EN röst i pratiga och stökiga ljudmiljö. Teknik som förmår identifiera unika detaljer i enskilda röster, en sorts röstens fingeravtryck. Det skriver New Scientist.

Men det är en bit kvar. Tekniken kan i nuläget att skilja två talande åt med 90 procent träffsäkerhet. När det är tre som pratar minskar den till 80 procent.

Referens: Deep clustering: John R. Hershey et al, Discriminative embeddings for segmentation and separation, Cornell university library, arXiv:1508.04306v1

Grunden i vår journalistik är trovärdighet och opartiskhet. Sveriges Radio är oberoende i förhållande till politiska, religiösa, ekonomiska, offentliga och privata särintressen.
Har du frågor eller förslag gällande våra webbtjänster?

Kontakta gärna Sveriges Radios supportforum där vi besvarar dina frågor vardagar kl. 9-17.

Du hittar dina sparade avsnitt i menyn under "Min lista".