

París, Francia. Kyutai es un laboratorio sin fines de lucro enteramente dedicado a la investigación abierta en inteligencia artificial (IA). Su objetivo es abordar los principales desafíos de la IA moderna, en particular desarrollando grandes modelos multimodales (que utilizan texto pero también sonido, imágenes, etc.) e inventando nuevos algoritmos para mejorar sus capacidades, confiabilidad y eficiencia. Para ello, el laboratorio utilizará la potencia informática que pone a su disposición Scaleway, filial del Grupo Iliad. El superordenador de Scaleway tiene la potencia informática de mayor rendimiento para aplicaciones de IA implementadas hasta la fecha en Europa.
Kyutai, firmemente comprometido con la democratización de la IA, se está posicionando como un actor líder en la ciencia abierta de la IA. Su ambición es compartir sus avances con todo el ecosistema de IA: la comunidad científica, los desarrolladores, las empresas, la sociedad en general y los tomadores de decisiones en las democracias.
Kyutai también contribuirá a la formación de futuros expertos en IA, ofreciendo pasantías a estudiantes de programas de maestría y supervisando a estudiantes de doctorado y posdoctorados.
Una iniciativa privada y sin ánimo de lucro
Kyutai fue fundada conjuntamente por el Grupo iliad, el Grupo CMA CGM y Schmidt Futures. El Grupo Iliad y el Grupo CMA CGM han aportado cada uno 100 millones de euros para financiar el laboratorio de investigación. Schmidt Futures también se ha unido como cofundador, forjando una sólida asociación basada en un compromiso compartido con este proyecto.
Con casi 300 millones de euros ya invertidos, Kyutai busca atraer a otros inversores privados. Los cofundadores están invitando a otras entidades a unirse a ellos para proporcionar financiación a largo plazo al trabajo de esta organización sin ánimo de lucro.
Un equipo científico excepcional con sede en París
Kyutai ya ha incorporado a un equipo de investigadores con destacada trayectoria académica y empresarial. Las oficinas de Kyutai tienen su sede en París.
Alexandre Défossez
Alexandre estudió matemáticas y física en la École Normale Supérieure (París) antes de especializarse en matemáticas aplicadas para el aprendizaje automático, graduándose con una maestría en la École Normale Supérieure (Saclay). Completó su doctorado en colaboración con Inria y Facebook AI Research (FAIR) en París, abarcando tanto las propiedades teóricas del entrenamiento de modelos de aprendizaje profundo como sus aplicaciones para la separación de fuentes de audio.
En 2020, se incorporó a FAIR como científico investigador y continuó su trabajo en modelado de audio. Dirigió la investigación y el desarrollo del marco AudioCraft de código abierto, que presenta muchos modelos de audio de última generación, como EnCodec (compresión/tokenización), AudioGen y MusicGen (generación de audio y música). Con un gran interés en la ciencia en general, también ha realizado contribuciones clave al campo de la neurociencia computacional junto al Dr. Jean Remi King.
Edouard Tumba
Edouard es un científico investigador con ocho años de experiencia en los laboratorios de investigación corporativos, Apple MLR y Facebook AI Research (FAIR). Antes de eso, realizó dos posdoctorados en UC Berkeley y la Universidad de Columbia. Obtuvo su doctorado en informática en la Universidad París VI y se graduó en la Ecole Polytechnique con una maestría en aprendizaje automático y visión por computadora.
Los intereses de investigación de Edouard giran en torno a grandes modelos de lenguaje, procesamiento del lenguaje natural y aprendizaje profundo eficiente. Mientras estuvo en FAIR, codirigió el desarrollo del modelo de lenguaje grande LLaMA y la biblioteca fastText.
Hervé Jégou
Después de obtener un doctorado en compresión y corrección de errores, Hervé fue contratado como investigador científico en Inria, donde inventó algoritmos para buscar en bases de datos muy grandes de imágenes y vídeos. Se unió a Facebook AI Research cuando se fundó el laboratorio de París en 2015, donde ocupó el cargo de gerente y luego de director.
Sus intereses de investigación incluyen visión por computadora, entrenamiento eficiente de redes neuronales, compresión, protección de datos e indexación. Inventó, en particular, el algoritmo de búsqueda de dominio comprimido de “cuantización de productos” utilizado por muchas empresas de tecnología y búsqueda de vectores. La biblioteca Faiss que fundó en FAIR es una de las bibliotecas de búsqueda de vectores de código abierto más populares, si no la más popular.
Laurent Mazaré
Después de estudiar matemáticas aplicadas e informática en la Ecole Polytechnique, Laurent obtuvo un doctorado en la intersección de criptografía y métodos formales. Luego pasó a la industria financiera, trabajando como estratega cuantitativo en Goldman Sachs. En 2013 se unió a Jane Street como desarrollador de software, trabajando en sistemas distribuidos, análisis y estrategias comerciales. En 2017 se trasladó a DeepMind, donde trabajó como ingeniero de investigación en su grupo de visión por computadora. Regresó a Jane Street como investigador en 2018 y dedicó su tiempo en la mesa de valores creando estrategias basadas en nuevas técnicas de modelado, así como construyendo infraestructura para la investigación.
Laurent también ha realizado importantes contribuciones de código abierto a lo largo de los años, y las dos más notables se encuentran entre las bibliotecas de aprendizaje automático más utilizadas para Rust.
Patrick Pérez
Licenciado en matemáticas aplicadas por la École Centrale Paris, Patrick tiene más de treinta años de experiencia en visión por computadora y aprendizaje automático, compartida entre laboratorios públicos y privados: la Universidad de Brown como postdoctorado e Inria como estudiante de doctorado, investigador y científico senior en la sector público; y en el sector privado, Microsoft Research como científico investigador, Technicolor como científico distinguido y Valeo como director científico y vicepresidente de IA.
Durante su carrera, Patrick ha explorado diversos campos de aplicaciones (médico, cine y medios, automoción), procesando y analizando señales de todo tipo de sensores (cámaras, resonancias magnéticas, micrófonos, radares, escáneres láser), y ha desarrollado y respaldado durante mucho tiempo -equipos de investigación a plazo. Algunos de sus proyectos más recientes con el equipo de Valeo.ai lo llevaron a embarcarse en la percepción visual de 360 grados basada en transformadores en automóviles y a generar explicaciones visuales contrafácticas para sistemas de conducción autónoma solo con cámaras.
Neil Zeghidour
Neil se une a Kyutai procedente de Google DeepMind, donde inició y dirigió un equipo que trabajaba en audio generativo, con contribuciones que incluyen la API de texto a música de Google, un sistema de traducción de voz a voz que preserva la voz y el primer códec de audio totalmente basado en en redes neuronales. Anteriormente pasó tres años en Facebook AI Research, trabajando en reconocimiento automático de voz y comprensión de audio.
Se graduó con un doctorado en aprendizaje automático de la Ecole Normale Supérieure (París) y tiene una maestría en aprendizaje automático de la Ecole Normale Supérieure (Saclay) y una maestría en finanzas cuantitativas de la Université Paris Dauphine. Paralelamente a sus actividades de investigación, Neil enseña tecnologías de procesamiento del habla en la École Normale Supérieure (Saclay).
El Comité Científico
El Comité Científico de Kyutai está formado por tres destacados especialistas en IA :
Yejin Choi: Yejin es un científico surcoreano especializado en procesamiento del lenguaje natural y visión por computadora. En 2018, se incorporó al Instituto Allen de IA (AI2) y en 2020 se convirtió en profesora de la Universidad de Washington. Su investigación se centra en las muchas formas en que la inteligencia humana se diferencia de la de los grandes modelos de IA. En 2022, Yejin se convirtió en MacArthur Fellow y recibió la prestigiosa beca «genio» de la Fundación, y en 2023 la revista Time la nombró una de las 100 personas más influyentes en IA.
Yann LeCun: Yann es un investigador francés especializado en inteligencia artificial, aprendizaje automático, visión por computadora y robótica. Es uno de los pioneros del aprendizaje profundo y el inventor de las redes neuronales convolucionales utilizadas especialmente en el análisis de imágenes. Su trabajo le valió el Premio Turing 2018 junto a otros dos investigadores. Yann es profesor en la Universidad de Nueva York y científico jefe de IA en Meta, donde fundó Facebook AI Research (FAIR).
Bernhard Schölkopf: Bernhard es un investigador alemán conocido mundialmente por su trabajo en aprendizaje automático. Después de trabajar para corporaciones, incluidos los laboratorios AT&T Bell y Microsoft Research, se unió como director al Instituto Max Planck para Sistemas Inteligentes en Tubinga, donde dirigió el departamento de inferencia empírica. También es profesor afiliado en ETH Zürich y presidente de ELLIS (Laboratorio Europeo de Aprendizaje y Sistemas Inteligentes). Ha recibido varios premios por su trabajo de investigación, incluido el Premio Leibniz en 2018 y el Premio Milner de la Royal Society en 2014.
Fuente: CGA CGM
Por: Redacción