Teramos - audiomatching

Speciální metody porovnávání zvukových záznamů

Od roku 2010 vyvíjíme sadu speciálních, velmi výkonných, robustních a unikátně přesných algoritmů pro analýzu a porovnávání audio záznamů. Umožňují nám prohledávat a zpracovávat souběžně obrovské množství audio záznamů a vyhledávat v nich unikátní výskyty předem definovaných vzorů.

Pro každou specifickou typologii požadavku máme k dispozici odlišné algoritmy. Systém umožňuje rozsáhlou volbu parametrů pro každou metodu se záměrem navýšení přesnosti, rychlosti, nebo snížení paměťové náročnosti.

Celé řešení je vytvářeno v programovacím jazyce C s využitím Assembleru a specializovaných SSE a AVX instrukcí, proto dosahuje opravdu úctyhodné rychlosti.

Řešení umožňuje hledání shod krátkých úseků v záznamech (od jedné sekundy), ale i delších bloků (jako například hudebních útvarů).

Následující příklady dokládají robustnost algoritmů našeho audiomatchingu. První z nich je spektrogram originálního souboru pořízeného z rozhlasového vysílání ČRo 1: original.mp3, recorded.mp3

Jak je patrné z poslechu i ze spektrálních grafů pořízená nahrávka (druhý soubor) je velmi těžko rozeznatelná kvůli zarušení hlukem motoru (dlouhá rovná čára na spektrogramu) a také kvůli dalším zdrojům rušení, nicméně i přes tyto velmi špatné podmínky, kvůli nimž je záznam na samé hranici subjektivní rozpoznatelnosti, je audiomatching způsobilý najít podobu v hodnotách vyšších než 95%, což je i zřejmé na časovém průniku obou nahrávek.

Spektrogram hledaného vzorku audio úseku:

Spektrogram pořízeného záznamu:

Optimální nalezený průnik s hledaným vzorem: