Fuente de la imagen: Generada por la herramienta de IA Unbounded
Esta mañana, hora occidental, el gigante de big data Databricks anunció que ha firmado un acuerdo definitivo para adquirir MosaicML, una startup de inteligencia artificial con sede en San Francisco, por 1.300 millones de dólares.
Después de la adquisición, MosaicML pasará a formar parte de la plataforma Databricks Lakehouse. Todo el equipo y la tecnología de MosaicML pasarán a estar bajo la bandera de Databricks, proporcionando a las empresas una plataforma unificada para gestionar activos de datos y poder utilizar sus propios datos patentados para construir, Poseer y proteger Modelos de IA generativos propios.
Vale la pena señalar que **MosaicML es una empresa de IA generativa muy joven, se estableció en San Francisco en 2021. Solo ha revelado públicamente una ronda de financiamiento y tiene solo 62 empleados. En la última ronda de financiación, su valoración fue de 220 millones de dólares estadounidenses, es decir, la valoración de la adquisición de MosaicML saltó directamente 6 veces. **
El acuerdo es la mayor adquisición anunciada en el campo de la IA generativa en lo que va del año. No hace mucho tiempo, el gigante de la computación en la nube Snowflake acaba de anunciar la adquisición de otra empresa de IA generativa, Neeva. Después de unos meses de frenesí de inversión, parece estar en marcha una ola corporativa masiva de adquisiciones de nuevas empresas de IA generativa.
**¿Quién es MosaicML? **
MosaicML fue fundado por Naveen Rao, exdirector de productos de inteligencia artificial de Intel, cofundador de Nervanas, y Hanlin Tang, director sénior de Intel AI Labs.
Los fundadores de MosaicML, Hanlin Tang (primero desde la izquierda), Naveen Rao (segundo desde la izquierda), imágenes de MosaicML
Naveen Rao se graduó de la Universidad de Duke con una especialización en ciencias de la computación en 1997 y luego obtuvo un doctorado en neurociencia de la Universidad de Brown. Ha estado comprometido durante mucho tiempo con el estudio y el desarrollo de redes neuronales de inteligencia artificial. Trabajó como investigador de máquinas neuromórficas en Qualcomm y fundó la empresa de inteligencia artificial Nervanas en 2014.
Quizás muchas personas no estén familiarizadas con Nervana ahora, pero en el campo del aprendizaje profundo y los chips de IA, se puede decir que Nervana ha tenido el mismo protagonismo. **El objetivo de Nervana es mejorar la eficiencia informática del aprendizaje profundo a través de sus servicios en la nube y productos de hardware. En 2015, lanzó Neon, un marco subyacente de aprendizaje profundo de superrendimiento, que se convirtió en un éxito en la industria, y luego lo lanzó en 2016. Plataforma en la nube de aprendizaje profundo Nervana Cloud y acelerador de hardware dedicado Nervana Engine. **
Nervana dijo que después de ejecutar el marco Neon en el chip Nervana Engine en Nervana Cloud, la combinación puede lograr un rendimiento 10 veces mayor que NVIDIA Titan X. El sólido desempeño de Nervana también atrajo la atención del señor de los chips Intel en ese momento, y el primer gran movimiento de Intel en el campo de la IA fue adquirir Nervana por $ 400 millones. **
Reportaje sobre la adquisición de Nervana por parte de Intel en 2016, foto tomada de Vox
Después de la adquisición, Naveen Rao se convirtió en la persona a cargo de los productos de inteligencia artificial de Intel. La arquitectura Neon y los productos relacionados con Nervana también se integraron en la línea de productos de Intel. El motor Nervana se denominó serie Crest.
Desde entonces, de 2017 a 2019, Intel ha anunciado repetidamente el progreso de Nervana Lake Crest y ha anunciado repetidamente productos de chips relacionados, incluida la serie Nervana NNP-T. Pero mientras todos esperaban la producción en masa de esta serie de chips, en 2020, Intel anunció repentinamente que reemplazaría el chip de aceleración de IA del lado del servidor Nervana original con los productos de la serie Habana de la compañía israelí que luego adquirió por $ 2 mil millones. La razón analizada por la industria en ese momento fue que la tecnología y el diseño de Habana eran más escalables y ya tenía capacidades de entrega de producción en masa.
**Después de que Intel decidiera "abandonar" Nervana, Naveen Rao y Hanlin Tang, ex empleados principales de Nervana, también abandonaron Intel y los dos fundaron MosaicML por separado. **Según la información de LinkedIn, Hanlin Tang debería ser un chino, que obtuvo un doctorado en biofísica de la Universidad de Harvard, y actualmente es el CTO de MosaicML.
Entonces, ¿cuál es el negocio principal de MosaicML después de dejar Intel?
MosaicML sigue comprometido a ayudar a las empresas a mejorar la eficiencia de la IA, pero esta vez ya no invierten demasiada energía en hardware, sino que se centran en la IA generativa. **En pocas palabras, MosaicML proporciona una plataforma que permite a varios tipos de empresas entrenar e implementar fácilmente modelos de IA en un entorno seguro y ayuda a las empresas a reducir la sobrecarga de los sistemas de IA. **
Su cartera de productos incluye modelos de la serie MPT Foundation de código abierto con licencia comercial y servicios de inferencia y capacitación MosaicML, que brindan una serie de herramientas para las empresas.
Por ejemplo, MosaicML Explorer puede ayudar a los desarrolladores a explorar y comprender el tiempo, el rendimiento y el costo entre diferentes servicios en la nube y opciones de hardware para simplificar y evaluar las opciones de implementación. Lanzó MosaicML Composer, una biblioteca de aprendizaje profundo de código abierto que proporciona 20 métodos para la visión artificial y el procesamiento del lenguaje natural, incluidos modelos, conjuntos de datos y puntos de referencia. Lanzó la plataforma de desarrollo de inteligencia artificial MosaicML, que proporciona implementación de modelos rentables y capacitación personalizada, al tiempo que garantiza la seguridad de los datos, lo que permite a los usuarios tener la propiedad del modelo, etc.
Imagen del sitio web oficial de MosaicML
Apuntando a los servicios empresariales, Databricks también usa IA generativa para realizar movimientos
Mirando hacia atrás al equipo fundador de MosaicML, se puede decir que sus elecciones comerciales siempre han estado un paso por delante de la tendencia. Cree chips de IA cuando todos todavía estén esperando y observando, y tome la iniciativa en la exploración de la comercialización de la IA generativa en el centro de la industria de la IA.
**Basándose en un sólido equipo técnico y experiencia en la industria, MosaicML recibió USD 37 millones en financiamiento del conocido capital de riesgo DCVC, Lux Capital, Future Ventures y otros inversionistas poco después de su establecimiento, y el financiamiento total aumentó a USD 64. millones desde entonces. **Se entiende que la adquisición de MosaicML por parte de Databricks se debe principalmente a las capacidades de comercialización de su modelo de IA generativa en el extremo empresarial.
Naveen Rao, CEO de MosaicML, declaró anteriormente que desde 2018, la complejidad de los modelos de inteligencia artificial que utilizan grandes cantidades de datos para "entrenar" ha aumentado considerablemente, y entrenar un modelo ahora cuesta al menos millones de dólares. generalmente no puede permitírselo.
Después de esta adquisición, el producto conjunto de la plataforma Lakehouse de **Databricks y la tecnología MosaicML permitirá a las empresas usar sus propios datos patentados para entrenar y construir modelos de IA generativos de manera simple, rápida y a bajo costo. El desarrollo de modelos de IA personalizados puede ocurrir sin control y propiedad de los datos. **
Imagen del sitio web oficial de MosaicML
La optimización automatizada del entrenamiento de modelos de MosaicML promete un entrenamiento de 2 a 7 veces más rápido que los métodos tradicionales, y la escalabilidad casi lineal de los recursos garantiza que los modelos con miles de millones de parámetros se puedan entrenar en horas, no en días. **Según Databricks, con la plataforma y el soporte técnico de Databricks y MosaicML, el costo de capacitación y uso de LLM para empresas se reducirá significativamente y se espera que baje a varios miles de dólares. **
Vale la pena señalar que antes de que se uniera MosaicML, Databricks había desarrollado un modelo de lenguaje de 12 000 millones de parámetros llamado Dolly-2 basado en Pythia-12b de EleutherAI, y con la incorporación de MosiacML, Databricks proporcionará a Dolly-2 y MosaicML MPT dos modelos líderes de lenguaje grande. .
"Toda organización debería poder beneficiarse de la revolución de la IA y tener más control sobre cómo se utilizan sus datos. Databricks y MosaicML tienen una oportunidad increíble para democratizar la IA y convertir a Lakehouse en el centro neurálgico de la generación de construcciones. El mejor lugar para la inteligencia artificial. ", dijo Ali Ghodsi, cofundador y director ejecutivo de Databricks, en un comunicado de prensa.
60 empleados están felices de mencionar el "gran paquete de regalo", comenzó la ola de fusiones y adquisiciones de AIGC
La adquisición de MosaicML es actualmente la transacción más grande divulgada públicamente en el campo de la IA generativa. El monto de la adquisición de hasta 1.300 millones es sin duda un "gran paquete de regalo" para MosaicML, que actualmente tiene solo 62 empleados.
Según Levels.fyi, el salario promedio de un ingeniero de software en MosaicML estaba entre $750,000 y $850,000. No está claro si las opciones de los empleados se descontarán en efectivo o se convertirán en opciones de Databricks, pero con la adquisición, todo el equipo de MosaicML se unirá a Databricks.
Imagen vía Levels.fyi
En el auge actual de la IA, es posible que la fusión y adquisición de nuevas empresas de IA generativa por parte de grandes empresas recién comience.
No hace mucho, Snowflake, la empresa de gestión de datos en la nube líder en el mundo, anunció que había adquirido Neeva, una startup de búsqueda generativa de inteligencia artificial fundada por dos ex empleados de Google, con un monto de transacción no revelado. El negocio principal de Neeva es utilizar IA generativa para la búsqueda y se enfoca principalmente en el campo de la búsqueda empresarial. **Después de unirse a Snowflake, Neeva ayudará a los clientes empresariales de servicios a utilizar la IA para buscar y analizar rápidamente puntos de datos, activos de datos y obtener información sobre los datos.
A partir de las sucesivas adquisiciones de Snowflake y Databricks, podemos ver que las grandes empresas de tecnología están pasando gradualmente de la investigación y el desarrollo independientes y la inversión estratégica a la etapa de fusiones y adquisiciones de tecnología de IA generativa. Esto también brinda más oportunidades para algunas empresas emergentes de inteligencia artificial generativa. Por lo menos, veremos más adquisiciones similares en la segunda mitad de este año.
Además, ya sea la dirección de la aplicación de estas dos grandes adquisiciones o los unicornios recientes como Cohere y Anthropic, su enfoque comercial se centra principalmente en la aplicación a nivel empresarial de la tecnología de IA generativa. **
Después de más de medio año de entusiasmo por parte del consumidor, la tecnología de IA generativa ha comenzado a avanzar agresivamente hacia los usuarios empresariales.
Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
La mayor adquisición en el campo AIGC: Databricks compró MosaicML por 1300 millones de USD, con 60 empleados después de solo 2 años de establecimiento
Texto: junio Editor: VickyXiao
Esta mañana, hora occidental, el gigante de big data Databricks anunció que ha firmado un acuerdo definitivo para adquirir MosaicML, una startup de inteligencia artificial con sede en San Francisco, por 1.300 millones de dólares.
Después de la adquisición, MosaicML pasará a formar parte de la plataforma Databricks Lakehouse. Todo el equipo y la tecnología de MosaicML pasarán a estar bajo la bandera de Databricks, proporcionando a las empresas una plataforma unificada para gestionar activos de datos y poder utilizar sus propios datos patentados para construir, Poseer y proteger Modelos de IA generativos propios.
Vale la pena señalar que **MosaicML es una empresa de IA generativa muy joven, se estableció en San Francisco en 2021. Solo ha revelado públicamente una ronda de financiamiento y tiene solo 62 empleados. En la última ronda de financiación, su valoración fue de 220 millones de dólares estadounidenses, es decir, la valoración de la adquisición de MosaicML saltó directamente 6 veces. **
El acuerdo es la mayor adquisición anunciada en el campo de la IA generativa en lo que va del año. No hace mucho tiempo, el gigante de la computación en la nube Snowflake acaba de anunciar la adquisición de otra empresa de IA generativa, Neeva. Después de unos meses de frenesí de inversión, parece estar en marcha una ola corporativa masiva de adquisiciones de nuevas empresas de IA generativa.
**¿Quién es MosaicML? **
MosaicML fue fundado por Naveen Rao, exdirector de productos de inteligencia artificial de Intel, cofundador de Nervanas, y Hanlin Tang, director sénior de Intel AI Labs.
Naveen Rao se graduó de la Universidad de Duke con una especialización en ciencias de la computación en 1997 y luego obtuvo un doctorado en neurociencia de la Universidad de Brown. Ha estado comprometido durante mucho tiempo con el estudio y el desarrollo de redes neuronales de inteligencia artificial. Trabajó como investigador de máquinas neuromórficas en Qualcomm y fundó la empresa de inteligencia artificial Nervanas en 2014.
Quizás muchas personas no estén familiarizadas con Nervana ahora, pero en el campo del aprendizaje profundo y los chips de IA, se puede decir que Nervana ha tenido el mismo protagonismo. **El objetivo de Nervana es mejorar la eficiencia informática del aprendizaje profundo a través de sus servicios en la nube y productos de hardware. En 2015, lanzó Neon, un marco subyacente de aprendizaje profundo de superrendimiento, que se convirtió en un éxito en la industria, y luego lo lanzó en 2016. Plataforma en la nube de aprendizaje profundo Nervana Cloud y acelerador de hardware dedicado Nervana Engine. **
Nervana dijo que después de ejecutar el marco Neon en el chip Nervana Engine en Nervana Cloud, la combinación puede lograr un rendimiento 10 veces mayor que NVIDIA Titan X. El sólido desempeño de Nervana también atrajo la atención del señor de los chips Intel en ese momento, y el primer gran movimiento de Intel en el campo de la IA fue adquirir Nervana por $ 400 millones. **
Después de la adquisición, Naveen Rao se convirtió en la persona a cargo de los productos de inteligencia artificial de Intel. La arquitectura Neon y los productos relacionados con Nervana también se integraron en la línea de productos de Intel. El motor Nervana se denominó serie Crest.
Desde entonces, de 2017 a 2019, Intel ha anunciado repetidamente el progreso de Nervana Lake Crest y ha anunciado repetidamente productos de chips relacionados, incluida la serie Nervana NNP-T. Pero mientras todos esperaban la producción en masa de esta serie de chips, en 2020, Intel anunció repentinamente que reemplazaría el chip de aceleración de IA del lado del servidor Nervana original con los productos de la serie Habana de la compañía israelí que luego adquirió por $ 2 mil millones. La razón analizada por la industria en ese momento fue que la tecnología y el diseño de Habana eran más escalables y ya tenía capacidades de entrega de producción en masa.
**Después de que Intel decidiera "abandonar" Nervana, Naveen Rao y Hanlin Tang, ex empleados principales de Nervana, también abandonaron Intel y los dos fundaron MosaicML por separado. **Según la información de LinkedIn, Hanlin Tang debería ser un chino, que obtuvo un doctorado en biofísica de la Universidad de Harvard, y actualmente es el CTO de MosaicML.
MosaicML sigue comprometido a ayudar a las empresas a mejorar la eficiencia de la IA, pero esta vez ya no invierten demasiada energía en hardware, sino que se centran en la IA generativa. **En pocas palabras, MosaicML proporciona una plataforma que permite a varios tipos de empresas entrenar e implementar fácilmente modelos de IA en un entorno seguro y ayuda a las empresas a reducir la sobrecarga de los sistemas de IA. **
Su cartera de productos incluye modelos de la serie MPT Foundation de código abierto con licencia comercial y servicios de inferencia y capacitación MosaicML, que brindan una serie de herramientas para las empresas.
Por ejemplo, MosaicML Explorer puede ayudar a los desarrolladores a explorar y comprender el tiempo, el rendimiento y el costo entre diferentes servicios en la nube y opciones de hardware para simplificar y evaluar las opciones de implementación. Lanzó MosaicML Composer, una biblioteca de aprendizaje profundo de código abierto que proporciona 20 métodos para la visión artificial y el procesamiento del lenguaje natural, incluidos modelos, conjuntos de datos y puntos de referencia. Lanzó la plataforma de desarrollo de inteligencia artificial MosaicML, que proporciona implementación de modelos rentables y capacitación personalizada, al tiempo que garantiza la seguridad de los datos, lo que permite a los usuarios tener la propiedad del modelo, etc.
Apuntando a los servicios empresariales, Databricks también usa IA generativa para realizar movimientos
Mirando hacia atrás al equipo fundador de MosaicML, se puede decir que sus elecciones comerciales siempre han estado un paso por delante de la tendencia. Cree chips de IA cuando todos todavía estén esperando y observando, y tome la iniciativa en la exploración de la comercialización de la IA generativa en el centro de la industria de la IA.
**Basándose en un sólido equipo técnico y experiencia en la industria, MosaicML recibió USD 37 millones en financiamiento del conocido capital de riesgo DCVC, Lux Capital, Future Ventures y otros inversionistas poco después de su establecimiento, y el financiamiento total aumentó a USD 64. millones desde entonces. **Se entiende que la adquisición de MosaicML por parte de Databricks se debe principalmente a las capacidades de comercialización de su modelo de IA generativa en el extremo empresarial.
Naveen Rao, CEO de MosaicML, declaró anteriormente que desde 2018, la complejidad de los modelos de inteligencia artificial que utilizan grandes cantidades de datos para "entrenar" ha aumentado considerablemente, y entrenar un modelo ahora cuesta al menos millones de dólares. generalmente no puede permitírselo.
Después de esta adquisición, el producto conjunto de la plataforma Lakehouse de **Databricks y la tecnología MosaicML permitirá a las empresas usar sus propios datos patentados para entrenar y construir modelos de IA generativos de manera simple, rápida y a bajo costo. El desarrollo de modelos de IA personalizados puede ocurrir sin control y propiedad de los datos. **
La optimización automatizada del entrenamiento de modelos de MosaicML promete un entrenamiento de 2 a 7 veces más rápido que los métodos tradicionales, y la escalabilidad casi lineal de los recursos garantiza que los modelos con miles de millones de parámetros se puedan entrenar en horas, no en días. **Según Databricks, con la plataforma y el soporte técnico de Databricks y MosaicML, el costo de capacitación y uso de LLM para empresas se reducirá significativamente y se espera que baje a varios miles de dólares. **
Vale la pena señalar que antes de que se uniera MosaicML, Databricks había desarrollado un modelo de lenguaje de 12 000 millones de parámetros llamado Dolly-2 basado en Pythia-12b de EleutherAI, y con la incorporación de MosiacML, Databricks proporcionará a Dolly-2 y MosaicML MPT dos modelos líderes de lenguaje grande. .
"Toda organización debería poder beneficiarse de la revolución de la IA y tener más control sobre cómo se utilizan sus datos. Databricks y MosaicML tienen una oportunidad increíble para democratizar la IA y convertir a Lakehouse en el centro neurálgico de la generación de construcciones. El mejor lugar para la inteligencia artificial. ", dijo Ali Ghodsi, cofundador y director ejecutivo de Databricks, en un comunicado de prensa.
60 empleados están felices de mencionar el "gran paquete de regalo", comenzó la ola de fusiones y adquisiciones de AIGC
La adquisición de MosaicML es actualmente la transacción más grande divulgada públicamente en el campo de la IA generativa. El monto de la adquisición de hasta 1.300 millones es sin duda un "gran paquete de regalo" para MosaicML, que actualmente tiene solo 62 empleados.
Según Levels.fyi, el salario promedio de un ingeniero de software en MosaicML estaba entre $750,000 y $850,000. No está claro si las opciones de los empleados se descontarán en efectivo o se convertirán en opciones de Databricks, pero con la adquisición, todo el equipo de MosaicML se unirá a Databricks.
En el auge actual de la IA, es posible que la fusión y adquisición de nuevas empresas de IA generativa por parte de grandes empresas recién comience.
No hace mucho, Snowflake, la empresa de gestión de datos en la nube líder en el mundo, anunció que había adquirido Neeva, una startup de búsqueda generativa de inteligencia artificial fundada por dos ex empleados de Google, con un monto de transacción no revelado. El negocio principal de Neeva es utilizar IA generativa para la búsqueda y se enfoca principalmente en el campo de la búsqueda empresarial. **Después de unirse a Snowflake, Neeva ayudará a los clientes empresariales de servicios a utilizar la IA para buscar y analizar rápidamente puntos de datos, activos de datos y obtener información sobre los datos.
A partir de las sucesivas adquisiciones de Snowflake y Databricks, podemos ver que las grandes empresas de tecnología están pasando gradualmente de la investigación y el desarrollo independientes y la inversión estratégica a la etapa de fusiones y adquisiciones de tecnología de IA generativa. Esto también brinda más oportunidades para algunas empresas emergentes de inteligencia artificial generativa. Por lo menos, veremos más adquisiciones similares en la segunda mitad de este año.
Además, ya sea la dirección de la aplicación de estas dos grandes adquisiciones o los unicornios recientes como Cohere y Anthropic, su enfoque comercial se centra principalmente en la aplicación a nivel empresarial de la tecnología de IA generativa. **
Después de más de medio año de entusiasmo por parte del consumidor, la tecnología de IA generativa ha comenzado a avanzar agresivamente hacia los usuarios empresariales.