Ako na radiju čujemo nepoznatu pjesmu koja lako "uđe u uvo", vrlo je vjerovatno da ćemo najprije posegnuti za svojim pametnim telefonom, pokrenuti Shazam i saznati sve o toj pjesmi. Ali, svima je velika misterija na koji to način Shazam uspjeva prepoznati svaku pjesmu.


Shazam je muzička aplikacija lansirana 2002. godine u Velikoj Britaniji, a široku popularnost dostiže pojavom u obliku iPhone aplikacije u SAD-u, a način na koji prepoznaje pjesme za mnoge je korisnike i dalje je poput kakve čarolije.

Ova aplikacija posjeduje biblioteku sa više od 8 miliona pjesama, a kompanija je razvila tehniku pomoću koje svaku muzičku numeru razlaže na jednostavan numerički potpis – kod jedinstven svakoj muzičkoj numeri.



Kada želite da Shazam prepozna određenu numeru, aplikacija pjesmu pomoću iste metode pretvara u taj potpis. Nakon toga je potrebno samo uskladiti obrasce. Shazam pretražuje svoju biblioteku u potrazi za kodom koji je stvorio na temelju pjesme koju želite da prepozna, a kad prepozna taj dio, jednostavno zna da je pronašao traženu pjesmu.


Ipak, ostaje pitanje kako Shazam radi ove otiske?

Pristup ove kompanije dugo se činio nepraktičnim. Smatralo se da unutar jedne pjesme postoji previše informacija da bi se stvorio jednostavan potpis. Shazam je to uspio riješiti na način da se unutar pjesme fokusirao isključivo na nekoliko "intenzivnih" trenutaka.

Za svaku se pjesmu u bazi stvara spektrogram – grafikon koji prikazuje tri dimenzije muzike: frekvenciju nasuprot amplitude nasuprot vremena. Algoritam zatim bira samo ona mjesta koja se nalaze na samom vrhu grafikona – note koje posjeduju "energetski viši sadržaj" od ostalih oko njih.

Iako su mnogi smatrali da će ignorisanje gotovo svih informacija u vezi s nekom pjesmom dovesti do netačnih preklapanja, ova se tehnika pokazala izuzetno imunom na ometanje, a pjesmu može prepoznati i u bučnoj sredini. Takođe, algoritam može prepoznati različite verzije iste pjesme, uključujući i one ubrzane.

Što se neuspjeha tiče, najčešći razlog neuspjeha u prepoznavanju pjesme krije se u nedovoljnom broju podataka. Sistemu je potrebno barem 5 sekundi muzike kako bi prepoznao pjesmu, a ljudi vrlo često ovu aplikaciju uključe na samom kraju pjesme.

Osim toga, još jedan problem je i izvođenje pjesama uživo. Shazam je ovu mogućnost isključio zbog "poslovnih razloga".

Kompanija takođe planira predstavljanje novih servisa, poput enginea za preporuke koji će korisnicima omogućiti dijeljenje glazbenih sadržaja i svog glazbenog ukusa s drugim ljudima.




Post a Comment

 
Top