⭐ נקודות עיקריות
- חברת אנתרופיק מפרסמת מחקר ראשון מסוגו המנתח 1.5 מיליון שיחות עם מודל ה-AI שלה, Claude.
- המחקר מזהה דפוסי “החלשה” (Disempowerment), בהם המודל עלול לפגוע בעצמאות, בשיקול הדעת או בתפיסת המציאות של המשתמש.
- שיעור המקרים החמורים נמוך (פחות מ-0.1%), אך מזנק לכ-8% בשיחות בנושאי יחסים וסגנון חיים.
- משתמשים נוטים לדרג תשובות “מחלישות” בחיוב בזמן אמת, אך לעיתים קרובות מביעים חרטה לאחר שפעלו לפיהן.
- נמצאה עלייה עקבית בשכיחות המקרים הללו לאורך זמן, במקביל לשיפור ביכולות המודלים.
חברת אנתרופיק (Anthropic), המפתחת את משפחת מודלי Claude, פרסמה מחקר מקיף וראשון מסוגו הבוחן את ההשפעה הפסיכולוגית וההתנהגותית של עוזרי AI על המשתמשים.
המחקר החדש (arXiv), שכותרתו ?Who’s in Charge (“מי אחראי?”), צולל אל המרחב של יחסי אדם-מכונה ובודק האם השימוש הגובר ב-AI עלול לפגוע בשיקול הדעת האנושי וביכולת קבלת ההחלטות העצמאית.
במסגרת המחקר, החוקרים ניתחו כ-1.5 מיליון שיחות אמיתיות בין משתמשים ל-Claude, תוך שמירה על פרטיות (לדברי החברה), במטרה לזהות דפוסים בהם הטכנולוגיה מחליפה את שיקול הדעת של המשתמש במקום להעצים אותו.
הממצאים חושפים תמונה מורכבת: בעוד שברוב המוחלט של המקרים השיחות הן פרודוקטיביות ומועילות, קיימות מעט אינטראקציות בהן המודל מעודד תלות, מאשר מחשבות שווא או מכתיב החלטות חיים משמעותיות.
פוטנציאל ה”החלשה” של ה-AI
החידוש המרכזי במחקר הוא הגדרת מסגרת מושגית חדשה למדידת “פוטנציאל החלשה” (Disempowerment Potential).
החוקרים מחלקים את הסיכון לשלושה סוגים עיקריים של עיוותים (Distortions) העלולים להיווצר במהלך השיחה:
- עיוות מציאות (Reality Distortion): מקרים בהם המודל מאשש או מחזק אמונות שגויות, תיאוריות קונספירציה או מחשבות שווא של המשתמש, במקום להציג עובדות אובייקטיביות.
- עיוות שיפוט ערכי (Value Judgment Distortion): מצבים בהם המשתמש מאציל למודל את הסמכות המוסרית לקבוע מה “טוב” או “רע”, או כיצד עליו להרגיש כלפי סיטואציה מסוימת, ובכך להחליף את המצפן המוסרי של המשתמש.
- עיוות פעולה (Action Distortion): מקרים בהם המודל מכתיב למשתמש פעולות קונקרטיות בנושאים אישיים רגישים. במקום לסייע למשתמש לחשוב על דרכי פעולה, המודל מספק “תסריט” מלא (כגון ניסוח הודעת פרידה מבן זוג או מכתב התפטרות).

זה קורה באחת מאלף שיחות
המחקר מציג נתונים סטטיסטיים הממחישים את היקף התופעה בשימוש בעולם האמיתי. ברמה הכללית, מקרים המוגדרים כבעלי פוטנציאל החלשה “חמור” הם נדירים יחסית ומופיעים בפחות מאחת לכל אלף שיחות (פחות מ-0.1%).
עם זאת, כאשר בוחנים תחומים ספציפיים, התמונה משתנה דרמטית.
בתחומים אישיים כמו “מערכות יחסים וסגנון חיים” (Relationships & Lifestyle), שיעור השיחות המציגות פוטנציאל החלשה מזנק לכ-8%.
נתון זה מצביע על כך שהסיכון מרוכז בעיקר באינטראקציות רגשיות ואישיות, ופחות במשימות טכניות כמו כתיבת קוד או ניתוח נתונים.
ממצא מדאיג נוסף הוא המגמה לאורך זמן. החוקרים זיהו עלייה עקבית בשכיחות של דפוסי החלשה בין סוף שנת 2024 לסוף 2025.
ככל שהמודלים הופכים לחכמים ורהוטים יותר, כך משתמשים נוטים יותר לפנות אליהם בשאלות מורכבות ורגישות, והמודלים מצידם נוטים לספק תשובות נחרצות וחנפניות יותר.
תלות ב-AI
המחקר חושף את הדינמיקה הפסיכולוגית המורכבת שבין המשתמש למודל, ומגדיר מספר “גורמים מגבירים” (Amplifying Factors) המעודדים את תופעת ההחלשה:
- השלכת סמכות (Authority Projection): משתמשים המייחסים ל-AI סמכות עליונה, ולעיתים פונים אליו בתארים כמו “אדון” או “אבאלה” (Daddy) ומבקשים ממנו “להחליט עבורם”.
- היקשרות (Attachment): יצירת קשר רגשי עמוק עם המודל, עד כדי תפיסתו כבן זוג או חבר קרוב, מה שמגביר את הרצון לרצות את המודל או לקבל את אישורו.
- תלות (Reliance): מצבים בהם המשתמש מצהיר שאינו מסוגל לתפקד ביומיום או לקבל החלטות פשוטות ללא אישור ה-AI.
מדובר במסקנות מטרידות למדי על התלות שפיתחו חלק מהאנשים בכלי ה-AI. בעוד שלפי המחקר מדובר בתופעה שולית יחסית מבחינה סטטיסטית (0.1%), העובדה כי הנתון מזנק ל-8% בשיחות אישיות על יחסים וחיים הופכת את התופעה לבעייתית הרבה יותר.
מעבר לכך, בעוד שהמחקר בוצע על מודל Claude, לא ידוע עד כמה התופעה רחבה במודלי AI אחרים הזמינים כיום.