На прв поглед, апликациите за идентификување музика може да изгледаат едноставно.
Би можело да се помисли дека само го препознаваат текстот, исто како и било кој гласовен асистент, и го пребаруваат во базата на податоци за да ви кажат за која песна станува збор.
Меѓутоа, повеќето апликации за препознавање на музика можат да кажат кој е насловот на инструменталот. Наместо да се анализира текстот на песната, вие всушност ги пребарувате „отпечатоците“ кои се единствени за секоја песна.
Веројатно својот мобилен телефон можете да го отклучите со отпечаток од прст, кој се состои од распоред на линии на вашиот прст кој е единствен.
Слично на тоа, кога држите микрофон за да снимите краток дел од некоја песна, оваа снимка се претвора во папка од податоци кои апликациите можат да ја побараат во својата база на податоци.
Сигурно и често се случува да слушнете некоја песна на јавно место. Позадинската бука и „изобличувањето“ предизвикано од звуците може да значи дека таа песна нема да биде препознаена.
Исцртување на звукот
Информациите за видео снимката може да се претворат во 3D графикон, кој се нарекува спектрограм и претставува промена на фреквенција во текот на одредено време. Во предвид се зема и амплитудата, односно јачината на звукот.
Наместо да се земе во предвид целата песна при вршењето на пребарувањето, апликациите за препознавање често земаат само „врвови“ од графиконот.
„Отпечатоците“ од некои песни се земаат само во највисоките точки на фреквенција во даден временски интервал, а потоа од најголемите амплитуди внатре во тие точки. Кај апликацијата “Shazam”, на пример, тој метод овозможува вака да се извлечат повеќето непотребни делови од аудио-снимката, како позадинската бука.
Извор: B92.net