גוגל משיקה כלים חדשים לשליטה בעלויות Gemini API

הגבלת הוצאה ב-Gemini API קרדיט: Google

⭐ נקודות עיקריות

  • גוגל מציגה כלים חדשים לניהול והבנת עלויות השימוש ב-Gemini API.
  • פיצ’ר Project Spend Caps מאפשר להגדיר תקרת הוצאה חודשית לכל פרויקט בנפרד.
  • מערכת Usage Tiers עודכנה ותציע שדרוג אוטומטי ומהיר יותר לפי היסטוריית שימוש ותשלום.
  • לוח מחוונים חדש מציג נתוני שימוש, מגבלות קצב ועלויות בצורה מפורטת ושקופה יותר.

גוגל (Google) הכריזה על סדרת כלים חדשה שנועדה להעניק למפתחים שליטה ושקיפות טובה יותר בנוגע לעלויות השימוש ב-Gemini API.

העדכונים מגיעים כחלק משיפורים שמבצעת החברה ב-Google AI Studio, סביבת הפיתוח למודלי הבינה המלאכותית שלה, וכוללים יכולות לניהול תקציב, מערכת דרגות שימוש חדשה ולוחות מחוונים מפורטים לניטור פעילות.

העדכון המרכזי הוא פיצ’ר חדש בשם Project Spend Caps, המאפשר להגדיר תקרת הוצאה חודשית עבור כל פרויקט המשתמש ב-Gemini API.

הכלי החדש נועד לסייע למפתחים וארגונים לשלוט טוב יותר בתקציב שלהם, במיוחד כאשר מספר פרויקטים שונים משתמשים באותו חשבון חיוב.

שליטה בתקציב ותקרת הוצאה לפרויקט

עם Project Spend Caps ניתן להגדיר סכום מקסימלי בדולרים עבור כל פרויקט ב-AI Studio.

ברגע שהתקרה נקבעת, היא נשארת פעילה עד שהמשתמש משנה או מבטל אותה. האפשרות זמינה לבעלי הרשאות ניהול בפרויקט וניתן להגדירה בלשונית Spend תחת האפשרות Monthly spend cap.

היכולת להגביל הוצאה ברמת הפרויקט מאפשרת לנהל טוב יותר סביבות פיתוח שבהן מספר צוותים עובדים תחת אותו חשבון חיוב, כאשר לכל פרויקט מוקצה תקציב משלו.

עם זאת, גוגל מציינת כי נתוני החיוב במערכת עשויים להתעדכן באיחור של עד כ-10 דקות.

כתוצאה מכך, ייתכן שבפרק זמן קצר לאחר חציית התקרה ייווצרו חיובים נוספים לפני שהמערכת תפסיק את הפעילות.

רמות שימוש חדשות ב-API של Gemini

גוגל עדכנה את מערכת רמות השימוש (Usage Tiers), המגדירה את מכסות השימוש ואת קצב הבקשות האפשרי ל-API.

המערכת החדשה נועדה להפוך את תהליך ההתרחבות לפשוט ושקוף יותר עבור מפתחים.

בין השינויים המרכזיים:

  • ספי שימוש נמוכים יותר – קל יותר לעבור לדרגות שימוש גבוהות יותר עבור חשבונות עם היסטוריית תשלום חיובית.
  • שדרוג אוטומטי ומהיר יותר – המערכת תעלה את המשתמש לדרגה גבוהה יותר באופן אוטומטי כאשר הוא עומד בקריטריונים.
  • תקרת הוצאה לחשבון החיוב – כל דרגת שימוש כוללת תקרת הוצאה חודשית לחשבון כולו.

התקרות המוגדרות לפי הדרגות הן:

  • Tier 1 – עד 250 דולר בחודש
  • Tier 2 – עד 2,000 דולר בחודש
  • Tier 3 – בין 20,000 ל-100,000 דולר בחודש

תקרות אלו מחושבות ברמת חשבון החיוב כולו, כלומר סך ההוצאות מכל הפרויקטים המשויכים אליו.

כאשר התקרה החודשית מגיעה למקסימום המותר בדרגה, הגישה לשירות מושעית עד תחילת מחזור החיוב הבא.

לפי גוגל, אכיפת התקרות הללו תחל ב-1 באפריל 2026, אם כי הממשק שלהן כבר מוצג ב-AI Studio כדי לאפשר למפתחים להיערך מראש.

לוחות מחוונים חדשים לניטור שימוש ועלויות

בנוסף לניהול התקציב, גוגל הציגה גם סדרת לוחות מחוונים חדשים שנועדו לשפר את השקיפות בנוגע לשימוש במודלים.

בין הכלים החדשים:

  • Rate Limit Dashboard – מציג את התקדמות השימוש מול מגבלות קצב לפי שלושה מדדים מרכזיים: בקשות לדקה (RPM), טוקנים לדקה (TPM) ובקשות ליום (RPD).
  • Cost Dashboard – גרף פירוט יומי של עלויות השימוש לפי פרויקט, מודל ותקופת זמן.
  • Usage Dashboard – תצוגה מורחבת של ביצועי המערכת הכוללת נתוני שימוש בטוקנים, שגיאות וסטטיסטיקות יצירה.
דאשבורים חדשים לניהול הוצאות ב-Gemini API
צילומסך מתוך Gemini API

בנוסף, המערכת כוללת גרפים ייעודיים לשירותים כמו Imagen ליצירת תמונות ו-Veo ליצירת וידאו, לצד כלים נוספים כמו שילוב מידע ממנוע החיפוש של גוגל ומ-Google Maps.

שקיפות בתחום ה-AI

לדברי גוגל, השינויים הם חלק מסדרת עדכונים שהחברה משיקה בחודשים האחרונים ב-Google AI Studio, במטרה לשפר את חוויית השימוש בשירותים בתשלום ולספק למפתחים שליטה טובה יותר בעלויות.

החברה מציינת כי מודל התמחור של Gemini API מבוסס על מספר גורמים, בהם כמות הטוקנים בקלט ובפלט, שימוש בטוקנים במטמון ומשך האחסון שלהם.

באמצעות הכלים החדשים, גוגל שואפת לאפשר למפתחים לבנות יישומים מבוססי בינה מלאכותית בביטחון גדול יותר – תוך הבנה ברורה של מגבלות השימוש וההשפעה התקציבית של כל פרויקט.

לפרטים נוספים על Project Spend Caps

השוואת מפרטים