Google оновлює ціну на API Gemini, оплата за використання за рівнями залежно від кількості запитів

Google нещодавно оновив тарифні рівні API Gemini, оптимізаційні рішення та ціноутворення базуються на фактичних потребах у використанні.
Нові рівні сервісу для розуміння включають: стандартний(Standard), гнучкий(Flex), пріоритетний(Priority), пакетний(Batch) та кешований(Caching).
Зокрема, гнучкий рівень для розуміння використовує непікові вільні обчислювальні ресурси, пропонуючи півціни від стандартної ціни, цільова затримка становить від 1 до 15 хвилин, але гарантія затримки не надається.
Пакетний API також пропонує півціни від стандартної ставки, максимальна затримка може досягати 24 годин.
Кешований рівень тарифікації базується на кількості токенів(Token) та тривалості зберігання, рекомендується для чат-ботів із складними системними командами, повторного аналізу довгих відеофайлів та пошуку у великих документаційних масивах.
Ціноутворення пріоритетного рівня на 75% до 100% вище за стандартну ціну, затримка може бути контрольована в мілісекундах або секундах.
Google рекомендує цей рівень для сценаріїв у реальному часі, таких як чат-боти для обслуговування клієнтів, виявлення шахрайства в реальному часі та ключові інтелектуальні помічники.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити