Eğer bir Spotify kullanıcısıysanız muhtemelen Spotify’ın her pazartesi kullanıcılarına olarak hazırladığı haftalık keşif listesini incelemişsinizdir veya hoşunuza giden bir parçanın şarkı radyosundan yeni şarkılar bulmuşsunuzdur. Uygulama üzerinden müzik dinleyen milyonlarca kullanıcının yararlandığı bu hizmetlerin nasıl hazırlandığını hiç düşündünüz mü? Nasıl oluyor da Spotify haftalık keşif listemizde dinlediğimiz tarza benzer şarkılar öneriyor? Bir şarkının radyosunda birbirine benzeyen şarkılar listeleniyor?
Şarkı tavsiyelerinin hazırlanışı
Sorunun detayına inmeden cevaplamak gerekirse, Spotify bu listeleri bize sunarken arka planda karışık bir tavsiye algoritması çalışıyor. Spotify kullandığı algoritmalar ile kullanıcılara beğenme ihtimali daha yüksek olan şarkıları sunabiliyor.
Peki Spotify tavsiye algoritmasının bu kadar başarılı çalışmasının sırrı ne? Neden müzik yayını uygulamaları arasında Spotify ön plana çıkıyor? Cevap çok basit:
Spotify kullanıcılarının isteklerini çok iyi analiz ediyor, bu sebeple diğer uygulamaların aksine tek bir algoritmadan yararlanmakla kalmıyor, 3 farklı algoritmayı birlikte kullanıyor!
Spotify şarkı tavsiyeleri algoritmaları
Şimdi işin teknik kısmına girmeden Spotify’ın şarkı öneri sisteminde kullandığı bu algoritmaların çalışma prensibini inceleyelim. Belirttiğimiz gibi Spotify’ın kullanmış olduğu 3 farklı tahmin modeli bulunuyor.
- Collaborative Filtering (İşbirlikçi Filtreleme): Bu model hem kullanıcının daha önce beğendiği şarkıları, hem de benzer müzik zevklerine sahip farklı kullanıcıların sevdiği şarkıları değerlendiriyor, bu değerlendirme sonunda şarkı önerisi hazırlıyor.
- Natural Language Processing (Doğal Dil İşleme): Metinlerin analitik incelenmesinde kullanılan dil işleme modelleri Spotify’ın şarkı tavsiyesi algoritmalarında da karşımıza çıkıyor. Bir şarkı hakkında sosyal medyada yazılanları inceleyip hangi yönlerinin beğenildiğini, hangi yönlerinin eksik bulunduğunun analizini yapan Spotify, kullanıcılarına tavsiye verirken sosyal medyadan da yararlanmış oluyor.
- Audio (Ses) Modelleri: Kullandıkları ses modelleri ile birlikte her bir şarkının ses dalgalarını inceleyen Spotify, yeni çıkmış ve çok az dinlenmiş şarkıları, yani algoritmanın “yabancı” olduğu şarkıları dahi inceleme fırsatı tanıyor.
Uygulamanın kullandığı son teknoloji ürünü algoritma sayesinde müşteri sadakatini arttırmayı başardığını söyleyebiliriz. Spotify kullanıcılardan sosyal medyaya, haber sitelerinden ses dalgalarına kadar veri toplayabileceği her noktan veri topluyor.
Spotify bünyesindeki şarkıların özellikleri
Kullanılan modellerin arasından ses modeli özellikle ilgimizi çekiyor. Veri bilimi ve fiziğin kesişim kümesi olarak düşünebileceğimiz bu model sonucunda şarkıların birçok farklı özelliği sayısal olarak takip edilebiliyor.
Yukarıdaki görselde Daft Punk grubunun “Around the World” adlı parçasının 30 saniyelik bir kısmının ses modellerince işlenmiş halini görebilirsiniz. Şarkının dans edilebilirliği, ne kadar vokal/enstrüman olduğu, enerjisi ve diğer birçok özelliği elde ediliyor ve benzer özelliklere sahip şarkılar tavsiye edilmeye aday hale geliyor.
Spotify’ın bünyesinde bulunan bütün şarkıları özelliklerine göre incelediğini, hatta bu veri setini geliştiriciler ile paylaştığını belirtelim. Bu son teknoloji ürünü çalışmayı kullanıma sunmaları Spotify’ın sektöründe lider konumunda olduğunu bir kez daha doğruluyor.
Spotify şarkıları kümeleme analizi
Biz de Spotify API kullanarak elde ettiğimiz, 2000 yılından bugüne dek çıkmış olan yaklaşık 25,000 adet şarkıyı Spotify şarkı özelliklerine göre inceledik ve şarkıları farklı kümelere ayırmaya çalıştık. Bunun sonucunda şarkıların özellikleri arasında ne gibi ilişkiler bulunuyor, inceleme fırsatı elde ettik.
Şarkıları Spotify şarkı özelliklerine, şarkıların çıkış yılına ve popülerliklerine göre incelenmesi ve yaptığımız kümeleme analizleri sonucunda 4 farklı kümeye ayırdık. Farklı kümeler ve şarkı özelliklerinin korelasyon değerlerini aşağıdaki tabloda inceleyebilirsiniz.
Öncelikle “Korelasyon Nedir?” sorusunu cevaplamakta fayda var. Korelasyon, iki değişken arasındaki ilişkinin yönünü ve gücünü gösterir. Korelasyon katsayısı “r” ile gösterilir ve -1 ile +1 arasında değerler alır.
Korelasyon katsayısı;
- -1 ise tam negatif doğrusal bir ilişki vardır.
- +1 ise tam pozitif doğrusal bir ilişki vardır.
- 0 ise iki değişken arasında ilişki yoktur.
Bu bağlamda korelasyon katsayısı aşağıdaki aralıklara göre şu şekilde yorumlanır:
- 0.00 => ilişki yok
- 0.1 – 0.29 => düşük düzeyde ilişki
- 0.30 – 0.70 => orta düzeyde ilişki
- 0.71 – 0.99 => yüksek düzeyde ilişki
- 1.00 => mükemmel ilişki
Şarkı özellikleri arasında en belirgin pozitif ilişkinin 0.76 korelasyon değeriyle “loudness (ses gürlüğü)” ve “enerji” arasında olduğunu görüyoruz. Özellikler arasında negatif ilişkileri incelediğimizde şarkının akustik özellikleri ile enerjisi arasında ters bir ilişki olduğunu görüyoruz. Yani, akustik özelliği yüksek olan şarkıların daha sakin parçalar olduğunu genellememiz mümkün.
Görseli daha rahat inceleyebilmek adına çeşitli bölgeleri numaralandırdık. Buna göre, 1. kısma baktığımızda şarkıların bulunduğu kümeyi en çok etkileyen iki faktörün şarkının çıkış yılı ve popülerliği olduğunu görebiliyoruz. Şarkıların çıkış yılı ve popülerliği arasındaki ilişkiyi 2. Kısımda görebilirsiniz. Bu iki değerin korelasyon oranın 0.48 olduğunu görüyoruz, bir başka değişle yeni çıkan şarkıların genellikle daha popüler olduğunu görebiliyoruz. Yani, kümeleme analizimizde en belirgin faktörün şarkının piyasa sürüldüğü yıl olduğunu söyleyebiliriz.
Spotify şarkı önerileri sonuçları
Sonuç olarak, Spotify’ın hali hazırda kullandığı algoritmaların çok karışık olduğunu ve birçok farklı kaynaktan yararlandığını söyleyebiliriz. Spotify, sizin ve diğer kullanıcıların beğendiği şarkılardan, sosyal mecralardan ve şarkının özelliklerinden yararlanarak bugün de olduğu gibi her pazartesi yeni bir liste sunuyor. Hemen şimdi Spotify’ın size hazırlamış olduğu listeyi inceleyebilir, şarkı tavsiyelerinin ne kadar tutarlı olduğunu yorumlarda paylaşabilirsiniz.
Kaynak: Spotify API, How Does Spotify Know You So Well?