26 лютого, за пекинським часом, Anthropic, провідна компанія у сфері штучного інтелекту у США, оголосила про придбання Vercept — стартапу з орієнтованим на візію в галузі автоматизації комп’ютерів, щоб компенсувати візуальні недоліки функцій Computer Use. Це друге придбання Anthropic після придбання стартапу Bun у грудні 2025 року.
Використання комп’ютерів — це основна можливість прямого керування комп’ютерами за допомогою ШІ, створена компанією Anthropic для своєї великої моделі Claude, що дозволяє Клоду «дивитися на екран, рухати мишею, набирати клавіатуру та керувати програмним забезпеченням» як людина, а також виконувати складні багатокрокові та міжзастосункові завдання, які будуть випущені разом із Claude 3.5 Sonnet у жовтні 2024 року.
Однак через вузькі місця у візуальному розумінні, точності візуального розуміння, складному розпізнаванні інтерфейсів і динамічній обробці сцен на ранніх етапах моделі, успішність роботи комп’ютера низька, і завдання легко провалити. Накопичення Vercept у високоточному розпізнаванні інтерфейсу, просторовому мисленні, динамічному відстеженні інтерфейсів і низькозатримковій візуальній обробці може компенсувати вищезазначені недоліки.
За даними Anthropic, розробники використовують Claude для виконання дедалі складніших завдань, включно з написанням і запуском коду між репозиторіями, синтезом досліджень із десятків джерел та управлінням робочими процесами між різними інструментами та командами. Використання комп’ютера дозволяє Клоду працювати в реальному часі з різним програмним забезпеченням, ніби він сидить перед комп’ютером, виконуючи багато багатокрокових завдань, які неможливо виконати лише кодом. Придбання Vercept допоможе компанії ще більше розширити ці можливості.
Штаб-квартира Vercept розташована в Сіетлі, США, була заснована випускниками Allen Institute for AI (AI2) і займає позицію AI Agent, орієнтованого на перше зоріння, зосереджуючись на автоматизації без API, яка «дивиться на екрани та керує комп’ютерами як люди». Основні члени команди відповідають за робототехніку та втілений інтелект, AI Agent та навчання за допомогою підкріплення.
Виходячи з акумулації технологій та досвіду засновницької команди, Vercept завершила початковий раунд фінансування на суму 16 мільйонів доларів у січні 2025 року, вартістю близько 67 мільйонів, а серед інвесторів — колишній генеральний директор Google Ерік Шмідт, головний науковець Google DeepMind Джефф Дін, засновник Cruise Кайл Вогт та інші. Загальна сума коштів, зібраних Vercept, становить приблизно 50 мільйонів доларів.
Anthropic вважає, що експертиза Vercept у сприйнятті та взаємодії безпосередньо застосовується до деяких із найскладніших проблем, які Anthropic вирішує. Десктопний додаток Vercept Vy буде закритий на 30 днів, і в рамках переходу Vercept заохочує користувачів спробувати інструмент Claude від Anthropic як альтернативу під час завершення сервісу.
Говорячи про аспекти придбання, співзасновник Vercept Лука Вайс сказав, що в майбутньому здатність Claude виконувати робочі завдання, засновані на знаннях, буде порівнянна з рівнем коду, який він пише сьогодні, що означає, що спосіб взаємодії людей з комп’ютерами може кардинально змінитися, щоб цей досвід взаємодії був таким же важливим, як і базова модель.
Це придбання відображає зростаючу конкуренцію в напрямку AI Agent, який може керувати комп’ютерами та іншими пристроями, а також виконувати завдання для користувачів. Окрім Anthropic, активно впроваджується OpenAI. У середині лютого засновник OpenClaw Пітер Стайнбергер оголосив, що приєднається до OpenAI на повний робочий день для розробки наступного покоління персональних AI-агентів. Проєкт OpenClaw не був придбаний OpenAI і не об’єднаний з компанією, а був переданий Independent Open Source Foundation, продовжуючи зберігати протокол відкритого коду MIT та автономію спільноти. OpenAI надає фінансування, технології та спонсорство ресурсів моделей, але не володіє і не контролює рішення проєктів. Завдяки методу «введення талантів» він доповнює здатність OpenAI залучати персональних AI-агентів і захищає передові переваги Anthropic серед корпоративних агентів.
Хоча існують відмінності у методах роботи, це фактично ставка між двома компаніями на трасі AI Agent. Засновник Anthropic Даріо Амодей у нещодавньому інтерв’ю заявив, що найкраща форма еволюції ШІ — це не текстовий генератор, а замкнена система виконання з універсальним комп’ютерним контролем. Він може виконувати складні виробничі завдання, такі як відеомонтаж і розробка програмного забезпечення, спостерігаючи за екранами, консультуючи історію, розуміючи контекст і співпрацюючи між платформами, як люди.
Головна перешкода в сучасній індустрії — не інтелект, а надійність взаємодії — тобто здатність моделювання достатньо сильна, але все одно недостатня для стабільного, точного виконання завдання без помилок. У наступні один-три роки ШІ вирішить більшість робочих потреб, які потребують «навчання на робочому місці», завдяки поєднанню управління довгим контекстом і контролю комп’ютерного зору.
(Джерело статті: Yicai)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Anthropic купує OpenAI, щоб залучити кадри: яку гру грають «дві сили» Кремнієвої долини?
26 лютого, за пекинським часом, Anthropic, провідна компанія у сфері штучного інтелекту у США, оголосила про придбання Vercept — стартапу з орієнтованим на візію в галузі автоматизації комп’ютерів, щоб компенсувати візуальні недоліки функцій Computer Use. Це друге придбання Anthropic після придбання стартапу Bun у грудні 2025 року.
Використання комп’ютерів — це основна можливість прямого керування комп’ютерами за допомогою ШІ, створена компанією Anthropic для своєї великої моделі Claude, що дозволяє Клоду «дивитися на екран, рухати мишею, набирати клавіатуру та керувати програмним забезпеченням» як людина, а також виконувати складні багатокрокові та міжзастосункові завдання, які будуть випущені разом із Claude 3.5 Sonnet у жовтні 2024 року.
Однак через вузькі місця у візуальному розумінні, точності візуального розуміння, складному розпізнаванні інтерфейсів і динамічній обробці сцен на ранніх етапах моделі, успішність роботи комп’ютера низька, і завдання легко провалити. Накопичення Vercept у високоточному розпізнаванні інтерфейсу, просторовому мисленні, динамічному відстеженні інтерфейсів і низькозатримковій візуальній обробці може компенсувати вищезазначені недоліки.
За даними Anthropic, розробники використовують Claude для виконання дедалі складніших завдань, включно з написанням і запуском коду між репозиторіями, синтезом досліджень із десятків джерел та управлінням робочими процесами між різними інструментами та командами. Використання комп’ютера дозволяє Клоду працювати в реальному часі з різним програмним забезпеченням, ніби він сидить перед комп’ютером, виконуючи багато багатокрокових завдань, які неможливо виконати лише кодом. Придбання Vercept допоможе компанії ще більше розширити ці можливості.
Штаб-квартира Vercept розташована в Сіетлі, США, була заснована випускниками Allen Institute for AI (AI2) і займає позицію AI Agent, орієнтованого на перше зоріння, зосереджуючись на автоматизації без API, яка «дивиться на екрани та керує комп’ютерами як люди». Основні члени команди відповідають за робототехніку та втілений інтелект, AI Agent та навчання за допомогою підкріплення.
Виходячи з акумулації технологій та досвіду засновницької команди, Vercept завершила початковий раунд фінансування на суму 16 мільйонів доларів у січні 2025 року, вартістю близько 67 мільйонів, а серед інвесторів — колишній генеральний директор Google Ерік Шмідт, головний науковець Google DeepMind Джефф Дін, засновник Cruise Кайл Вогт та інші. Загальна сума коштів, зібраних Vercept, становить приблизно 50 мільйонів доларів.
Anthropic вважає, що експертиза Vercept у сприйнятті та взаємодії безпосередньо застосовується до деяких із найскладніших проблем, які Anthropic вирішує. Десктопний додаток Vercept Vy буде закритий на 30 днів, і в рамках переходу Vercept заохочує користувачів спробувати інструмент Claude від Anthropic як альтернативу під час завершення сервісу.
Говорячи про аспекти придбання, співзасновник Vercept Лука Вайс сказав, що в майбутньому здатність Claude виконувати робочі завдання, засновані на знаннях, буде порівнянна з рівнем коду, який він пише сьогодні, що означає, що спосіб взаємодії людей з комп’ютерами може кардинально змінитися, щоб цей досвід взаємодії був таким же важливим, як і базова модель.
Це придбання відображає зростаючу конкуренцію в напрямку AI Agent, який може керувати комп’ютерами та іншими пристроями, а також виконувати завдання для користувачів. Окрім Anthropic, активно впроваджується OpenAI. У середині лютого засновник OpenClaw Пітер Стайнбергер оголосив, що приєднається до OpenAI на повний робочий день для розробки наступного покоління персональних AI-агентів. Проєкт OpenClaw не був придбаний OpenAI і не об’єднаний з компанією, а був переданий Independent Open Source Foundation, продовжуючи зберігати протокол відкритого коду MIT та автономію спільноти. OpenAI надає фінансування, технології та спонсорство ресурсів моделей, але не володіє і не контролює рішення проєктів. Завдяки методу «введення талантів» він доповнює здатність OpenAI залучати персональних AI-агентів і захищає передові переваги Anthropic серед корпоративних агентів.
Хоча існують відмінності у методах роботи, це фактично ставка між двома компаніями на трасі AI Agent. Засновник Anthropic Даріо Амодей у нещодавньому інтерв’ю заявив, що найкраща форма еволюції ШІ — це не текстовий генератор, а замкнена система виконання з універсальним комп’ютерним контролем. Він може виконувати складні виробничі завдання, такі як відеомонтаж і розробка програмного забезпечення, спостерігаючи за екранами, консультуючи історію, розуміючи контекст і співпрацюючи між платформами, як люди.
Головна перешкода в сучасній індустрії — не інтелект, а надійність взаємодії — тобто здатність моделювання достатньо сильна, але все одно недостатня для стабільного, точного виконання завдання без помилок. У наступні один-три роки ШІ вирішить більшість робочих потреб, які потребують «навчання на робочому місці», завдяки поєднанню управління довгим контекстом і контролю комп’ютерного зору.
(Джерело статті: Yicai)