השירים של ספוטיפיי זמינים להורדה בטורנטים כחלק מפרויקט גיבוי שנוי במחלוקת

לוגו ספוטיפיי (צילום: רונן מנדזיצקי, גאדג'טי) צילום: רונן מנדזיצקי, גאדג’טי

⭐ נקודות עיקריות

  • Anna’s Archive טוענת שביצעה גיבוי רחב היקף של קטלוג Spotify והפיצה אותו להורדה בטורנטים בהיקף של כ-300TB.
  • לפי הטענה, המאגר כולל מטא-דאטה על כ-256 מיליון שירים וקובצי אודיו לכ-86 מיליון מהם.
  • ספוטיפיי מאשרת כי זיהתה גישה לא מורשית שכללה scraping של מטא-דאטה ועקיפת מנגנוני DRM לצורך גישה לחלק מקובצי האודיו.
  • הפרשה מחדדת את המתח בין שימור תרבות דיגיטלי, אבטחת שירותי סטרימינג וזכויות יוצרים.

Anna’s Archive, אתר המזוהה עם עולם “ספריות הצל” והפצת מאגרי מידע בקבצים גדולים, פרסם פוסט שבו נטען כי צוות הפרויקט הצליח לבצע גיבוי רחב היקף של ספוטיפיי – הן של מטא-דאטה והן של קבצי מוזיקה – ולהפיץ את התוצאה באמצעות טורנטים בהיקף של כ-300 טרה-בייט.

לפי הדיווח, המאגר כולל מסד נתוני מטא-דאטה שכולל כ-256 מיליון רשומות של שירים (Tracks) וכ-186 מיליון מזהי הקלטה ייחודיים (ISRC), לצד כ-86 מיליון קובצי אודיו.

אנשי האתר טוענים כי הם תיעדפו את הגיבוי לפי מדד “פופולריות” של ספוטיפיי, כך שקבצי האודיו שבידיהם מייצגים לכאורה כ-99.6% מההאזנות בפלטפורמה.

נתוני השירים, האלבומים והאמנים בספוטיפיי
קרדיט: Anna’s Archive

מה בדיוק נטען שנאסף – ואיך זה מופץ?

ב-Annа’s Archive מציגים את הפרויקט כ”ארכיון שימור” פתוח, כזה שניתן לשכפל (Mirror) על ידי כל מי שיש לו מספיק נפח אחסון ותשתית.

לפי התיאור שלהם, ההפצה נעשית בשלבים:

  • מטא-דאטה – מסדי נתונים בפורמט SQLite שמרכזים מידע על אמנים, אלבומים, שירים, זמינות לפי מדינות, תמונות עטיפה ונתונים נוספים.
  • קובצי מוזיקה – הפצה מדורגת לפי פופולריות. לפי הטענה, בחלק מהמקרים מדובר בקבצים באיכות המקורית כפי שסופקה מהשירות, ובחלק מהמקרים בקבצים שעברו קידוד מחדש כדי לצמצם נפח.
  • שכבות נוספות – נתוני “Audio Features” ו-“Audio Analysis”, ומאגרי פלייליסטים בהיקף גדול (לטענתם – מיליוני פלייליסטים).

חשוב להדגיש: עצם העובדה שהמידע “קיים בטורנטים” לא אומרת שהוא נגיש לכל אחד בקלות – מדובר בהיקף חריג שדורש משאבי אחסון, רוחב פס וניהול הפצה.

מצד שני, זו בדיוק נקודת החוזק של מודל טורנטים: אם מספיק אנשים ימשיכו להפיץ (Seed), יהיה קשה מאוד “להעלים” את הנתונים האלה מהאינטרנט.

לצד היקף הנתונים, הפרויקט מציג גם ניתוח של ריכוזיות ההאזנות בספוטיפיי. לפי ההערכות של Anna’s Archive, שלושת השירים המושמעים ביותר במועד הניתוח:

  • “Die With A Smile” של ליידי גאגא וברונו מארס (3.075 מיליארד השמעות)
  • “BIRDS OF A FEATHER” של בילי אייליש (3.137 מיליארד השמעות)
  • “DtMF” של באד באני (1.124 מיליארד השמעות)

השלושה צברו יחד מספר השמעות גבוה יותר מזה של עשרות מיליוני שירים בעלי פופולריות נמוכה, אם כי האתר מדגיש שמדובר בהערכה המבוססת על מדד הפופולריות של ספוטיפיי ולא על נתוני סטרימינג רשמיים.

ציון לשירים לפי כמות השמעות בספוטיפיי
קרדיט: Anna’s Archive

האם זה בכלל חוקי?

ברוב התרחישים – לא.

יש כאן שני רבדים שונים מבחינת דיני זכויות יוצרים:

  • קובצי האודיו – שירים מוגנים בזכויות יוצרים (ובזכויות שכנות של מבצעים וחברות תקליטים). הורדה, שכפול והפצה שלהם ללא רישיון היא בדרך כלל הפרה ישירה. גם אם המטרה המוצהרת היא “שימור”, החרגות של שימור קיימות לרוב למוסדות מוגדרים (ספריות/ארכיונים) ובתנאים מאוד מסוימים – ובדרך כלל לא כוללות הפצה פתוחה לציבור של קטלוג מסחרי מלא.
  • מטא-דאטה – עובדות יבשות (כמו שמות שירים/אמנים/תאריכים) לא תמיד מוגנות כשלעצמן, אבל אוסף מאורגן בקנה מידה גדול יכול להיתקל בהגנות אחרות: תנאי שימוש (ToS), הגנות על מסד נתונים (בייחוד באיחוד האירופי), מגבלות על “איסוף שיטתי” (scraping) ולעיתים גם טענות על עקיפת מנגנוני הגנה או שימוש באמצעים לא מורשים.

בנוסף, פעולת scraping בקנה מידה כזה כמעט בוודאות מפרה את תנאי השימוש של השירות, ולפי שיטת ההשגה בפועל היא עשויה לגרור גם טענות חמורות יותר – החל מגישה לא מורשית ועד עקיפה של מנגנונים שנועדו למנוע הורדה המונית.

תגובת ספוטיפיי

לצד הטענות של Anna’s Archive, ספוטיפיי מסרה בתגובה שפורסמה באתר Billboard כי חקירה פנימית שביצעה זיהתה גישה לא מורשית לפלטפורמה.

לפי החברה, צד שלישי ביצע scraping של מטא-דאטה ציבורי, ובמקביל השתמש באמצעים לא חוקיים לצורך עקיפת מנגנוני ה-DRM, מה שאפשר גישה לחלק מקובצי האודיו שבשירות.

ספוטיפיי לא פירטה את היקף הקבצים שנחשפו, את משך הפעילות או את זהות הגורמים המעורבים, אך הבהירה כי מדובר בפעילות שאינה מורשית ואינה תואמת את תנאי השימוש בפלטפורמה.

למה זה חשוב גם למי שלא מוריד טורנטים?

מעבר לדרמה סביב זכויות היוצרים, יש כאן כמה השלכות מעניינות:

  • שימור מול אפשרות גישה – ספוטיפיי היא לא ארכיון לאומי. שירים נעלמים משירותי סטרימינג מסיבות של רישוי, מחלוקות או החלטות עסקיות (ע”ע אמנים שהסירו את המוסיקה שלהם משירותי מוסיקה כ”מחאה” נגד ישראל). פרויקטים כאלה מנצלים את הפער בין הרצון “לשמור תרבות” לבין מודל הסטרימינג שמבוסס רישוי זמני.
  • סיכון לשכפול שירותים – מאגר מטא-דאטה עצום + קבצי אודיו + נתוני פלייליסטים יכולים לאפשר לצד שלישי לבנות חוויית “ספוטיפיי חלופי” או לאמן מודלים סביב מוזיקה בקנה מידה שמעטים יכלו להרשות לעצמם בעבר.
  • אבטחה ומניעת הורדה המונית – אם הטענה נכונה, המשמעות היא שנמצאה דרך יציבה לאסוף נתונים ותכנים בקנה מידה תעשייתי. זה יוביל כמעט בוודאות להקשחה נוספת של מערכי זיהוי שימוש חריג, rate limiting ואכיפה.

בשלב זה, התמונה המלאה עדיין אינה ברורה. מצד אחד, ב-Anna’s Archive מציגים את המהלך כפרויקט שימור תרבותי רחב היקף.

מצד שני, ספוטיפיי מאשרת בתגובתה כי זוהתה פעילות לא מורשית שכללה גישה למידע ולקבצי אודיו תוך עקיפת מנגנוני הגנה.

בלי אימות עצמאי של היקף המאגר ובלי פירוט נוסף מצידה של ספוטיפיי, קשה לקבוע האם מדובר באירוע חריג וחד-פעמי או באיתות לבעיה רחבה יותר במודל ההפצה והשמירה של מוזיקה בעידן הסטרימינג.

כך או כך, הפרשה מדגישה מחדש את המתח שבין שימור תרבות דיגיטלי לבין מודלים מסחריים מבוססי רישוי, ואת השאלה מי באמת שולט בזיכרון המוזיקלי בעידן הדיגיטלי.

השוואת מפרטים