האם הגונב מגנב פטור? תכינו את עצמכם לקצת רכילות AI 🍿
חברת Anthropic פרסמה בלוג פוסט שמאשים את DeepSeek AI, Moonshot AIו-MiniMax, שהן יצרו 24,000 חשבונות מזויפים ושלחו 16 מיליון שאילתות ל-Claude כדי "לזקק" (distill) את היכולות שלו לתוך המודלים שלהן.
מה זה Distillation?
בגדול, הסינים נתפסו כשהם "מעתיקים את השיעורי בית". הם שאלו את Claude שאלות ממוקדות על coding, reasoning ו-tool use, ואז השתמשו בתשובות כדי לאמן את המודלים שלהם בשבריר מהזמן והעלות.
(וזה לא הפעם הראשונה שזה קורה. בגרסה הקודמת של DeepSeek, כשהייתי שואל אותו איזה מודל הוא, הוא היה עונה ChatGPT)
למה זה אירוני?
כי קלוד וכל החברים שלו מאומנים את המודלי שפה שלהם על רוב האינטרנט בלי שהם בקשו רשות או רכשו זכויות יוצרים.
למעשה, חברת אנטרופיק עצמה שילמה 1.5 מיליארד דולר בספטמבר 2025 בפשרה על כך שהורידה מיליוני ספרים מאתרי פיראטיות כדי לאמן את Claude.
ובאותו משפט נפסק באופן תקדימי שאימון AI על ספרים שנרכשו אבל בצורה חוקית, דווקא נחשב "fair learning" וחוקי לחלוטין (באופן לא מאוד שונה ממה שעשו הסינים).
בסופו של יום Distillation היא לא פריצה ולא גניבת קוד. זו הפרה של תנאי שימוש, אבל לא ברור שזה בכלל עבירה פלילית.
מה חושבים? לגיטימי או לא? (לא שהדעות שלנו משנות לסינים משהו)
<style>
.blog_post-01, .container-p--large {
direction: rtl;
text-align: right;
}
</style>