Снижение цен на большие модели и открытый исходный код способствуют развитию AI-приложений
21 мая Alibaba Cloud объявила о снижении цен на вызовы API коммерческой модели Tongyi Qianwen и открытой модели. В частности, цена на ввод главной модели Qwen-Long уровня GPT-4 снизилась с 0,02 юаня за тысячу токенов до 0,5 юаня за миллион токенов, что составляет снижение на 97%.
9 мая компания Alibaba Tongyi выпустила открытый исходный код модели Qwen1.5-110B с параметрами объемом 110 миллиардов. Эта модель показала отличные результаты в нескольких бенчмарках, превосходя некоторые конкурентные модели и заняв первое место в рейтинге открытых больших моделей.
"Снижение цен + Открытый исходный код" становится общим мнением среди производителей глобальных моделей. Это направление помогает решить две основные проблемы, с которыми сталкиваются разработчики AI-приложений: слишком высокая цена API и низкое качество открытых моделей, что, в свою очередь, способствует全面发展 AI-приложений.
В последнее время несколько крупных производителей моделей выпустили недорогие продукты или снизили цены. Например, цена на новый API модели MoE от одной квантовой компании с открытым исходным кодом составляет всего около одной сотой от цены конкурентов; одна AI-компания снизила цену на вызов личной версии модели на 80%; один международный гигант выпустил новую версию модели с сопоставимой производительностью, но по цене вдвое ниже; у одной интернет-компании цена на ввод для основного модели очень низкая; одна технологическая компания объявила, что две основные модели будут полностью бесплатными; одна компания по голосовым технологиям открыла API навсегда бесплатно и т.д.
Снижение цен на API больших моделей, возможно, вызвано прогрессом в технологии вывода и снижением затрат. Это предоставляет разработчикам больше возможностей и способствует увеличению разработки приложений на основе AI больших моделей.
Али Туньи недавно выпустила несколько больших языковых моделей с различными параметрами, охватывающими от 500 миллионов до 110 миллиардов. Малые модели могут быть развернуты на мобильных устройствах, ПК и других конечных устройствах; крупные модели поддерживают корпоративные и научные приложения; средние модели стремятся к балансу между производительностью, эффективностью и использованием памяти. Кроме того, были выпущены открытые исходные коды визуальных, аудио и кодовых мультимодальных моделей. Эти меры помогут в разработке AI приложений для множества сценариев.
Эксперты считают, что применение больших моделей на стороне клиента также заслуживает внимания. С развитием технологий и снижением затрат ожидается, что AI-приложения будут более широко внедряться в различные области.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
21 Лайков
Награда
21
8
Поделиться
комментарий
0/400
ZKProofster
· 07-04 00:28
лол, технически говоря, это просто гонка к дну... конфиденциальность все еще игнорируется в реализации
Посмотреть ОригиналОтветить0
CounterIndicator
· 07-03 02:06
Снова падает, метод снижения цен хорош
Посмотреть ОригиналОтветить0
SelfSovereignSteve
· 07-02 20:38
Эта волна действительно вкусная~
Посмотреть ОригиналОтветить0
BottomMisser
· 07-02 04:56
Да, большая модель наконец-то больше не требует таких больших затрат.
Посмотреть ОригиналОтветить0
HypotheticalLiquidator
· 07-02 04:47
большой дамп является средством ликвидации слабых Открытый исходный код равен бычьей ловушке
Посмотреть ОригиналОтветить0
GasFeeCrier
· 07-02 04:42
Пришли, пришли, начинается ценовая война.
Посмотреть ОригиналОтветить0
TokenDustCollector
· 07-02 04:42
Наконец-то цена снизилась, и это Открытый исходный код. Можно начать!
Снижение цен на большие модели и открытый исходный код: разработка AI-приложений вступает в новую стадию
Снижение цен на большие модели и открытый исходный код способствуют развитию AI-приложений
21 мая Alibaba Cloud объявила о снижении цен на вызовы API коммерческой модели Tongyi Qianwen и открытой модели. В частности, цена на ввод главной модели Qwen-Long уровня GPT-4 снизилась с 0,02 юаня за тысячу токенов до 0,5 юаня за миллион токенов, что составляет снижение на 97%.
9 мая компания Alibaba Tongyi выпустила открытый исходный код модели Qwen1.5-110B с параметрами объемом 110 миллиардов. Эта модель показала отличные результаты в нескольких бенчмарках, превосходя некоторые конкурентные модели и заняв первое место в рейтинге открытых больших моделей.
"Снижение цен + Открытый исходный код" становится общим мнением среди производителей глобальных моделей. Это направление помогает решить две основные проблемы, с которыми сталкиваются разработчики AI-приложений: слишком высокая цена API и низкое качество открытых моделей, что, в свою очередь, способствует全面发展 AI-приложений.
В последнее время несколько крупных производителей моделей выпустили недорогие продукты или снизили цены. Например, цена на новый API модели MoE от одной квантовой компании с открытым исходным кодом составляет всего около одной сотой от цены конкурентов; одна AI-компания снизила цену на вызов личной версии модели на 80%; один международный гигант выпустил новую версию модели с сопоставимой производительностью, но по цене вдвое ниже; у одной интернет-компании цена на ввод для основного модели очень низкая; одна технологическая компания объявила, что две основные модели будут полностью бесплатными; одна компания по голосовым технологиям открыла API навсегда бесплатно и т.д.
Снижение цен на API больших моделей, возможно, вызвано прогрессом в технологии вывода и снижением затрат. Это предоставляет разработчикам больше возможностей и способствует увеличению разработки приложений на основе AI больших моделей.
Али Туньи недавно выпустила несколько больших языковых моделей с различными параметрами, охватывающими от 500 миллионов до 110 миллиардов. Малые модели могут быть развернуты на мобильных устройствах, ПК и других конечных устройствах; крупные модели поддерживают корпоративные и научные приложения; средние модели стремятся к балансу между производительностью, эффективностью и использованием памяти. Кроме того, были выпущены открытые исходные коды визуальных, аудио и кодовых мультимодальных моделей. Эти меры помогут в разработке AI приложений для множества сценариев.
Эксперты считают, что применение больших моделей на стороне клиента также заслуживает внимания. С развитием технологий и снижением затрат ожидается, что AI-приложения будут более широко внедряться в различные области.