![]() |
TERAMOS |
Pro naše interní potřeby vyvíjíme od roku 2010 sadu speciálních, velmi výkonných, robustních a přesných algoritmů pro analýzu a porovnávání audio záznamů, ty nám dovolují zpracovávat tisíce audio záznamů a prohledávat v nich unikátní výskyty předem definovaných vzorů.
Pro každý individuální případ máme k dispozici odlišné algoritmy, výhodou je také rozsáhlá volba parametrů pro každou metodu se záměrem navýšení přesnosti, rychlosti, nebo snížení paměťové náročnosti.
Celé řešení je vytvářeno v programovacím jazyce C s využitím Assembleru a specializovaných SSE a AVX instrukcí, proto dosahuje opravdu úctyhodné rychlosti.
Řešení je možné použít pro hledání krátkých podobných úseků (od 1s) tak delších bloků jako například hudby.
Níže uvedené příklady demonstrují jak robustní naše algoritmy audiomatchingu jsou, první je spektrogram orignálního souboru pořízeného z rozhlasového vysílání ČRo 1: original.mp3, recorded.mp3
Jak je patrné z poslechu i ze spektrálních grafů pořízená nahrávka (druhý soubor) je velmi těžko rozeznatelná kvůli hluku motoru (dlouhá rovná čára na spektrogramu) a ostatnímu rušení, nicméně i přes tyto velmi špatné podmínky je schopný audiomatching najít podobu z více jak 95% což je i vidět na časovém průniku obou nahrávek.
Spektrogram hledaného vzorku audio úseku:
Spektrogram pořízeného záznamu:
Optimální nalezený průnik s hledaným vzorem: