Интервью | Большие технологии обучают ИИ на мусорных данных: Интуиция

Модели ИИ становятся все более мощными, но данные, на которых они обучаются, становятся все хуже, говорит основатель Intuition Билли Людтке. Резюме

  • Искусственный интеллект хорош настолько, насколько хороши данные, которые мы ему предоставляем, говорит Билли Людтке, основатель Intuition.
  • Мы находимся в эпохе “вход, выход”, поскольку ИИ становится рекурсивным
  • Децентрализованные модели имеют преимущество в технологиях и пользовательском опыте

С ростом популярности систем ИИ пользователи все чаще сталкиваются с ограничениями, которые трудно исправить. Хотя модели улучшаются, исходные данные, на которых обучаются эти модели, остаются прежними. Более того, рекурсия, или обучение моделей ИИ на данных, сгенерированных другими ИИ, может на самом деле усугубить ситуацию.

Чтобы поговорить о будущем ИИ, crypto.news поговорил с Билли Людтке, основателем Intuition, децентрализованного протокола, сосредоточенного на обеспечении проверяемой атрибуции, репутации и собственности на данные для ИИ. Людтке объясняет, почему текущие наборы данных для ИИ имеют фундаментальные недостатки и что можно сделать для их исправления.

Crypto.news: Все сейчас сосредоточены на инфраструктуре ИИ — GPU, энергии, дата-центрах. Недостаточно ли люди оценивают важность слоя доверия в ИИ? Почему это важно?

Билли Людтке: 100%. Люди определенно недооценили это — и это важно по нескольким причинам.

Во-первых, мы входим в то, что я называю эпохой “входящих и исходящих данных”. ИИ хорош настолько, насколько хороши данные, которые он использует. Но эти данные — особенно из открытой сети — в значительной степени загрязнены. Они не чистые. Они не отражают человеческих намерений. Большая часть этих данных исходит от игрофицированного поведения в интернете: лайков, отзывов, уловок вовлечения — все это фильтруется через алгоритмы, оптимизированные для привлечения внимания.

Когда ИИ сканирует интернет, то, что он видит, не является целостным изображением того, кто мы есть. Он видит людей, которые играют на платформе. Я не веду себя так же на Twitter, как в реальной жизни. Никто из нас не ведет. Мы оптимизируемся под алгоритм — а не выражаем искренние мысли.

Это тоже рекурсивно. Платформы обучают нас, а мы возвращаем обратно более искаженное поведение. Это создает замкнутый круг — спираль — которая еще больше искажает восприятие человечества ИИ. Мы не учим его тому, что думаем; мы учим его тому, что, по нашему мнению, получит лайки.

Обычный пользователь не гуглит, не сравнивает источники и не мыслит критически. Они просто задают вопрос ChatGPT или другой модели и принимают ответ за чистую монету.

Это опасно. Если модель непрозрачна — черный ящик — и компания, которая ее контролирует, также контролирует, какую информацию вам показывают или не показывают, тогда это полный контроль над нарративом. Это централизовано, неподотчетно и чрезвычайно мощно.

Представьте, что вы спрашиваете Грока о лучшем подкасте, и ответом будет тот, кто заплатил Элонy больше всего. Это не интеллект — это просто реклама под прикрытием.

CN: Как мы можем это исправить? Как мы можем создать системы, которые приоритизируют истину и ценность вместо вовлеченности?

BL: Нам нужно изменить стимулы. Эти системы должны служить людям — не институтам, не акционерам, не рекламодателям. Это означает создание нового уровня для интернета: примитивы идентичности и репутации. Вот что мы делаем в Intuition.

Нам нужно проверяемое атрибуция: кто что сказал, когда и в каком контексте. И нам нужна портативная, децентрализованная репутация, которая помогает определить, насколько мы можем доверять любому данному источнику данных — не основываясь на ощущениях, а на фактической контекстуальной истории.

Reddit — это идеальный пример. Это один из крупнейших источников обучающих данных для моделей. Но если пользователь саркастически говорит: “Просто k*** себя”, это может быть собрано и появиться в рекомендациях модели для кого-то, кто спрашивает о медицинских советах.

Это ужасно — и именно это происходит, когда модели не имеют контекста, атрибуции или веса репутации. Нам нужно знать: Этот человек является надежным в медицине? Он имеет репутацию в финансах? Это надежный источник или просто еще один случайный комментарий?

CN: Когда вы говорите об атрибуции и репутации, эти данные должны храниться где-то. Как вы думаете об этом с точки зрения инфраструктуры — особенно с такими вопросами, как авторское право и компенсация?

BL: Именно это мы решаем в Intuition. Как только у вас есть проверяемые примитивы атрибуции, вы знаете, кто создал какие данные. Это позволяет токенизировать право собственности на знания — и с этим, компенсацию.

Таким образом, вместо того чтобы ваши данные хранились на серверах Google или API OpenAI, они находятся на децентрализованной графе знаний. Каждый владеет тем, что он вносит. Когда ваши данные используются или обрабатываются в выводе ИИ, вы получаете долю от созданной им ценности.

Это важно, потому что сейчас мы цифровые крепостные. Мы тратим наши самые ценные ресурсы — время, внимание и креативность — на генерацию данных, которые кто-то другой монетизирует. YouTube не ценен только потому, что он размещает видео; он ценен, потому что люди его курируют. Без лайков, комментариев или подписок YouTube не имеет никакой ценности.

Поэтому мы хотим мир, где каждый может зарабатывать на той ценности, которую он создает — даже если вы не влиятельная личность или экстраверт. Если вы постоянно первыми находите новых артистов, например, ваш вкус имеет ценность. Вы должны иметь возможность строить репутацию вокруг этого и монетизировать её.

CN: Но даже если мы получим прозрачность, эти модели по-прежнему очень трудно интерпретировать. Сам OpenAI не может полностью объяснить, как его модели принимают решения. Что тогда происходит?

BL: Отличный момент. Мы не можем полностью интерпретировать поведение модели — они слишком сложны. Но то, что мы можем контролировать, это обучающие данные. Это наш рычаг.

Я приведу вам пример: я слышал о научной работе, где один ИИ был одержим совами, а другой прекрасно разбирался в математике. Они тренировались вместе только на задачах, связанных с математикой. Но в конце концов, математический ИИ тоже начал любить сов — просто впитывая шаблон от другого.

Сумасшествие, насколько подсознательны и тонки эти паттерны. Так что единственная настоящая защита — это намерение. Мы должны осознанно подходить к тому, какие данные мы подаем этим моделям. Нам нужно “исцелить себя”, так сказать, чтобы представить себя в интернете более аутентично и конструктивно. Потому что ИИ всегда будет отражать ценности и искажения своих создателей.

CN: Давайте поговорим о бизнесе. OpenAI сжигает деньги. Их инфраструктура чрезвычайно дорога. Как децентрализованная система, такая как Intuition, может конкурировать — финансово и технически?

BL: У нас есть два основных преимущества: композируемость и координация.

Децентрализованные экосистемы — особенно в криптовалюте — невероятно хорошо координируются. У нас есть глобальные, распределенные команды, работающие над различными компонентами одной и той же более крупной проблемы. Вместо того чтобы одной компании сжигать миллиарды, сражаясь с миром, у нас есть сотни согласованных участников, создающих совместимые инструменты.

Это похоже на мозаику. Одна команда работает над репутацией агентов, другая — над децентрализованным хранением, третья — над примитивами идентичности — и мы можем соединить это вместе.

Это суперсила.

Второе преимущество - это пользовательский опыт. OpenAI зафиксирована в своей защитной зоне. Они не могут позволить вам перенести ваш контекст из ChatGPT в Grok или Anthropic - это подорвёт их защиту. Но нас не волнует привязка к поставщику.

В нашей системе вы сможете владеть своим контекстом, брать его с собой и подключать его к любому агенту, который вам нужен. Это создаёт лучший опыт. Люди будут выбирать это.

****CN:Что насчет инфраструктурных затрат? Запуск крупных моделей чрезвычайно дорогой. Видите ли вы мир, где меньшие модели работают локально?

BL: Да, на 100%. Я на самом деле считаю, что именно в этом направлении мы движемся — к множеству небольших моделей, работающих локально, соединенных как нейроны в распределенном рое.

Вместо одного большого монолитного центра обработки данных у вас есть миллиарды потребительских устройств, которые вносят свою долю вычислений. Если мы сможем их скоординировать — а именно в этом криптовалюты преуспевают — это станет превосходной архитектурой.

И именно поэтому мы также создаем слои репутации агентов. Запросы могут быть направлены к правильному специализированному агенту для выполнения задачи. Вам не нужна одна огромная модель, чтобы делать всё. Вам просто нужна умная система для маршрутизации задач — как слой API для миллионов агентов.

CN: Как насчет детерминизма? LLM не очень подходят для задач, таких как математика, где нужны точные ответы. Можем ли мы сочетать детерминированный код с ИИ?

BL: Вот что я хочу. Нам нужно вернуть детерминизм в цикл.

Мы начали с символического мышления — полностью детерминированного — а затем резко переключились на глубокое обучение, которое является недетерминированным. Это дало нам взрыв, который мы видим сейчас. Но будущее — нейросимволическое — сочетание лучшего из обоих.

Позвольте ИИ заниматься нечетким рассуждением. Но также позвольте ему запускать детерминированные модули — скрипты, функции, логические движки — где вам нужна точность. Подумайте: “Кто из моих друзей любит этот ресторан?” Это должно быть на 100% детерминированно.

****CN:Увеличивая масштаб: мы видели, как компании интегрируют ИИ в свои операции. Но результаты были неоднозначными. Вы считаете, что текущее поколение LLM действительно повышает продуктивность?

BL: Абсолютно. Сингулярность уже здесь — она просто неравномерно распределена.

Если вы не используете ИИ в своем рабочем процессе, особенно для кода или контента, вы работаете на долю скорости, с которой работают другие. Технология реальна, и приросты эффективности огромны. Дисрупция уже произошла. Люди просто еще не осознали это полностью.

CN: Последний вопрос. Многие люди говорят, что это пузырь. Венчурный капитал иссякает. OpenAI сжигает деньги. Nvidia финансирует своих собственных клиентов. Как это закончится?

BL: Да, есть пузырь — но технологии реальны. Каждый пузырь лопается, но то, что остается после, это фундаментальные технологии. ИИ будет одной из них. Глупые деньги — все эти обертки приложений без реальных инноваций — уходят в небытие. Но команды глубокой инфраструктуры? Они выживут.

На самом деле, это может пойти одним из двух путей: мы получаем мягкую коррекцию и возвращаемся к реальности, но прогресс продолжается. Или, прирост производительности настолько велик, что ИИ становится дефляционной силой в экономике. ВВП может вырасти в 10 или 100 раз по производственной мощности. Если это произойдет, затраты были оправданы — мы поднимаемся как общество.

В любом случае, я оптимист. Будет хаос и утрата рабочих мест, да — но также есть потенциал для изобилующего мира без дефицита, если мы создадим правильную основу.

ON-9.41%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить