Zadání projektu

Platforma Spotify se stala fenoménem ve sdílení hudebního obsahu. Za druhý kvartál roku 2020 ji využilo 288 milionů uživatelů (viz https://backlinko.com/spotify-users). Kromě hudebního obsahu disponuje Spotify i rozsáhlými metada databázemi popisující hudební obsah. Nejznámější nadstavbou je služba Echonest, která navrací fyzikální popis skladby (např. frekvenční charakteristiky skladeb). Tyto charakteristiky lze využít pro vytváření služeb umělé inteligence a strojového učení. Typickou ukázkou je aplikace Shazan, která je schopna detekovat skladbu na základě ukázky nahrávky. Cílem této práce je navrhnout klasifikátor hudebních žánrů na základě charakteristik skladeb ze služby Echonest. Konkrétně: 

  1. Proveďte analýzu API rozhraní Echonet a identifikujte charakteristiky skladeb, které jsou vhodné ke klasifikaci. 
  2. Proveďte extrakci dat z API rozhraní Echonet. Extrakce, transformace a uchování dat bude probíhat automatizovaným způsobem prostřednictvím principu ETL. 
  3. Navrhněte klasifikátor pomocí knihovny scikit-learn: 
  4. Proveďte analýzu závislosti datových atributů, 
  5. Aplikujte algoritmus PCA pro redukci dimenzionality dat, 
  6. Proveďte natrénování algoritmu strojového učení (využijte rozhodovací strom a logistickou regresi), 
  7. Proveďte vyhodnocení úspěšnosti algoritmu učení (accuracy a recall) 
  8. Navrhněte API, pomocí něhož bude možno klasifikátor používat. 
  9. Celý projekt bude realizován pomocí technologií Python, DBMS, GitLab. 

Oblasti na které je projekt zaměřen

Datová analytika, Programování

Informace pro maturanty, kteří budou projekt řešit jako maturitní práci

Maximální počet žáků v týmu, který bude projekt realizovat: 3

Maximální počet týmů, které mohou projekt realizovat: 1

Téma si mohou vybrat žáci se zaměřením: Vývoj aplikací/Správa systémů

Autor zadání: Ing. Marek Lukšík (autor nemusí být zároveň vedoucí práce)

Toto zadání pro Vás připravila společnost

VOŠ a SPŠE Plzeň

Ukázky realizovaného projektu

Zatím nerealizováno