Yandex publikuje zbiór danych rekomendacji muzycznych Yambda o otwartym kodzie źródłowym

Darmowy zbiór danych Yahdex Yambda pozwala każdemu stworzyć własną usługę rekomendacji muzycznych. (Źródło obrazu: Yandex)

Yandex opublikował Yambdę, największy na świecie otwarty zbiór danych dla systemów rekomendacji muzycznych, zawierający 4,79 miliarda anonimowych interakcji użytkowników, aby pomóc programistom w tworzeniu inteligentnych usług muzycznych, które odtwarzają tylko te utwory, których słuchacze chcą słuchać.

David Chien (tłumaczenie Ninh Duy), Opublikowany 30/05/2025 🇺🇸 🇪🇸 ...

AI Software Open Source Audio Business DIY

Yandex udostępnił swój zbiór danych Yambda o otwartym kodzie źródłowym zawierający informacje o preferencjach słuchaczy muzyki do wykorzystania w tworzeniu usługi strumieniowego przesyłania dźwięku podobnej do Spotify z personalizacją list odtwarzania opartą na sztucznej inteligencji.

Usługi streamingowe, takie jak Spotify, Tidal i Qobuz, wykorzystują algorytmy oprogramowania lub modele sztucznej inteligencji do tworzenia list odtwarzania w oparciu o indywidualne preferencje. Usługi te zazwyczaj nie udostępniają swojego kodu ani modeli, ponieważ ich wyjątkowa zdolność do automatycznego odtwarzania utworów, które lubią słuchacze, jest uważana za tajemnicę handlową ich sukcesu.

Yandex w ciągu dziesięciu miesięcy zebrał dane w postaci 4,79 miliarda interakcji użytkowników z 9,39 milionami utworów muzycznych z puli 28 milionów miesięcznych użytkowników Yandex Music użytkowników. Obejmuje to kluczowe informacje zwrotne od słuchaczy Yandex Music - czego wybierają do słuchania, a także ich upodobania i antypatie. Wszystkie interakcje są znakowane czasem w celu zwiększenia precyzji.

Zbiór danych można pobrać w rozmiarach pięciu miliardów (1 milion użytkowników), pięciuset milionów (100 000 użytkowników) i pięćdziesięciu milionów (10 000 użytkowników) modeli zdarzeń, przy czym maksymalny wymaga co najmniej 85 GB przestrzeni dyskowej. Zbiór danych jest przechowywany w formacie Apache Parquet formacie Apache Parquet, zorientowanym na kolumny formacie pliku danych dla wygodnej analizy i badań.

Czytelnicy mogą podarować streaming muzyki dzięki karcie podarunkowej Spotify.

Źródło(a)

Yambda na HuggingFace, Komunikat prasowy Yandex

⟨

Oprogramowanie Nintendo Switch 2, podwójne ładowanie i nie tylko: Wczesny użytkownik Switch 2 organizuje AMA na Reddit

Wyciekły szczegóły kamery Xiaomi 16

⟩

Add as a preferred source on Google

Editor of the original article: David Chien - Tech Writer - 1056 articles published on Notebookcheck since 2023

Translator: Ninh Ngoc Duy - Editorial Assistant - 809732 articles published on Notebookcheck since 2008

contact me via: Facebook

> laptopy testy i recenzje notebooki > Nowinki > Archiwum v2 > Archiwum 2025 05 > Yandex publikuje zbiór danych rekomendacji muzycznych Yambda o otwartym kodzie źródłowym

David Chien, 2025-05-30 (Update: 2025-05-30)