Aleksandr Timashov Aleksandr es un ingeniero de ML con más de una década de experiencia en IA y aprendizaje automático. Tiene un título en Matemáticas de la Universidad de Indiana y un certificado de posgrado en Inteligencia Artificial de la Universidad de Stanford. La carrera de Aleksandr abarca múltiples industrias, incluido el comercio electrónico, el petróleo y el gas y la tecnología financiera. En esta entrevista, Aleksandr comparte sus experiencias únicas al liderar proyectos innovadores en Visión artificial y Ciencia de datos en el grupo energético global Petronas (Malasia).
Hola Aleksandr. Cuéntanos a nuestros lectores sobre tus antecedentes y cómo te iniciaste en la ciencia de datos y el aprendizaje automático.
Mi pasión por las matemáticas comenzó en la escuela secundaria, cuando participé en olimpiadas a nivel nacional. Este amor por los números y la resolución de problemas continuó en la universidad, donde me atrajeron materias como el álgebra lineal y la teoría de la probabilidad. La transición al aprendizaje automático me resultó natural dada mi formación matemática. Es un campo apasionante que me permite aplicar conceptos abstractos para resolver problemas del mundo real.
Cuando me ofrecieron un puesto en el área de aprendizaje automático en Petronas, una gran corporación de Malasia, lo vi como una oportunidad increíble. La escala de la empresa y el potencial de generar un impacto significativo fueron factores importantes en mi decisión. Trabajar en Petronas no solo me permitió mejorar los procesos de la empresa, sino también influir positivamente en la vida de millones de malayos. Es un puesto que combina mis habilidades técnicas con un impacto significativo a gran escala.
¿Puedes hablarnos de Petronas? ¿Qué tipo de empresa es? ¿Qué te llevó a Petronas? ¿Cuáles eran tus objetivos cuando empezaste allí?
Petronas es una gran empresa estatal de Malasia y, aunque opera principalmente en el sector del petróleo y el gas, hace mucho más que eso. El grupo de empresas Petronas incluye un montón de otras empresas asociadas con Kuala Lumpur y Malasia. Digamos, por ejemplo, que el holding inmobiliario KLCC está directamente relacionado con Petronas. La empresa es responsable de la seguridad y la gestión de las Torres Gemelas del Centro de la Ciudad de Kuala Lumpur, las hermosas torres gemelas de la capital de Malasia. Y la influencia de la empresa no se limita a Malasia: tiene presencia en más de 100 países de todo el mundo.
Petronas participa en diversos sectores, desde petroquímicos hasta servicios de ingeniería y logística. La empresa también es famosa por ser pionera en varios campos de la tecnología digital, como la ciberseguridad, la IoT y, lo que a mí me interesa específicamente, la inteligencia artificial.
Mis principales objetivos al unirme a Petronas como profesional de Machine Learning y Data Science eran adquirir experiencia en una empresa con enormes oportunidades de mejora y compartir mis conocimientos con tantos jóvenes talentos como fuera posible.
¿Y lograste estos objetivos?
Sin duda, ¡era un terreno fértil para mis ambiciones! Cuando me incorporé a la empresa, estaban creando un gran departamento de ciencia de datos y aprendizaje automático; en aquel momento, estas tecnologías no estaban separadas en la empresa. Cuando llegué, ya había varias docenas de personas en el departamento, pero todavía estaban trabajando en la hoja de ruta estratégica para el departamento. Al mismo tiempo, la enorme ventaja de esta situación fue que había muchas oportunidades de mejora y muchas direcciones por las que avanzar. Elegí la visión artificial como uno de mis campos favoritos de la IA. Para continuar con esa época, les daré un ejemplo: un modelo de visión artificial que utilizaba la empresa cuando me incorporé podía «pesar» un gigabyte. El primer día, el día que empecé a trabajar allí, hice sobre la marcha un modelo que era 20 veces más pequeño y mucho más preciso.
El responsable del departamento que trabajaba con este modelo se sorprendió de la rapidez y precisión con la que funcionaba mi modelo. Estaba muy interesado y me preguntó si podía optimizar el trabajo de otros modelos. Acepté con la condición de que, si hacía algo, fuera responsable de ello y me proporcionaran los recursos necesarios. Así que obtuve carta blanca para formar el equipo de Visión artificial, para convertirlo en una unidad eficiente que ayudara a Petronas a alcanzar sus objetivos. Las personas a las que formé siguen siendo una parte fundamental del equipo de Visión artificial de Petronas.
¿Y cómo abordaron el desafío de crear un equipo poderoso de Visión Artificial desde cero?
En realidad, no se trataba de uno, sino de varios desafíos. A diferencia de las empresas más pequeñas y las empresas emergentes, las grandes empresas con estructuras y procesos de negocio establecidos suelen ser reacias a cambiar. Cuando me incorporé a la empresa, Petronas ya contaba con procesos de trabajo y no siempre resultaba evidente que la visión artificial pudiera contribuir a que esos procesos fueran aún más eficientes. Por tanto, tuvimos que convencer, por un lado, a varios departamentos de la empresa para que aceptaran una nueva tecnología y, por el otro, conseguir que la tecnología les resultara útil.
Y esto nos lleva al segundo desafío: formar un equipo que implementara todos estos cambios. El departamento ya estaba en funcionamiento cuando me incorporé y no podía empezar aumentando el personal: necesitaba elegir y formar a gente que ya estuviera allí. ¡Y me entusiasmaba ver el talento que podía tener la gente, incluso si nunca antes había trabajado con Visión Artificial! Pude encontrar personas en la empresa y en el departamento que estaban interesadas en cambiar la forma en que se hacían las cosas, personas con pensamiento crítico y amor por la resolución de problemas matemáticos complejos, ¡y esto no siempre es una tarea fácil! Así que me llevó mucho tiempo y todas mis habilidades de comunicación, pero logré que la gente de la empresa se imbuyera de Visión Artificial.
¿Puedes contarnos sobre tu trabajo en Visión Artificial en Petronas?
Lideré varios proyectos que impulsaron dramáticamente las capacidades tecnológicas de la empresa:
Análisis de vídeo en tiempo real para seguridad:
Desarrollamos un sistema avanzado que integra algoritmos de aprendizaje profundo con la infraestructura de CCTV existente. Este proyecto superó los desafíos de procesar grandes cantidades de datos visuales en tiempo real y adaptarse a diversas condiciones ambientales. El sistema resultante detectó con precisión las amenazas a la seguridad, optimizó las operaciones de seguridad y posicionó a Petronas como líder en seguridad impulsada por IA en el sector energético de Malasia.
Inspecciones automatizadas de plantas industriales:
Combinamos la tecnología de drones con algoritmos avanzados de reconocimiento de imágenes para automatizar las inspecciones de las plantas. Este proyecto sin precedentes en Malasia requirió la creación de modelos robustos para identificar defectos en diversos equipos industriales en condiciones variables. Desarrollamos una canalización de datos personalizada para manejar el inmenso volumen de datos visuales, lo que resultó en un ahorro de costos significativo y una menor exposición humana a entornos peligrosos.
Digitalización de dibujos de ingeniería:
Abordamos la digitalización de la extensa colección de planos de ingeniería de Petronas mediante una combinación de algoritmos de reconocimiento óptico de caracteres (OCR) y de detección de planos. Un desafío clave fue la correspondencia de las detecciones de inspección con drones con mapas del mundo real. Este proyecto mejoró drásticamente la accesibilidad y la utilización de información de ingeniería crítica, mejorando la eficiencia operativa y los procesos de toma de decisiones.
En estos proyectos, fui mentor de numerosos ingenieros de ML y fomenté una cultura de innovación dentro de Petronas. Mi trabajo demostró una amplia experiencia en visión artificial, aprendizaje profundo e IoT industrial, y mostró la capacidad de adaptar tecnologías de vanguardia a las necesidades específicas de la industria del petróleo y el gas y abordar desafíos sin precedentes en el contexto de Malasia.
Nos comentaste que estabas implementando estos proyectos en 2020-2022, por lo que todo comenzó en medio de la época del Covid-19. ¿La pandemia y el aislamiento complicaron tu trabajo?
Por supuesto, la pandemia afectó nuestras operaciones, como en todo el mundo. Básicamente, las prioridades que había establecido mi equipo cambiaron y comenzamos a centrarnos en tareas como la gestión de multitudes, la detección de mascarillas, etc. Verá, como corporación estatal gigante, Petronas es responsable de muchos lugares públicos, incluido el parque KLCC, y es realmente genial que nuestro trabajo en ese momento ayudara a salvar muchas vidas durante la COVID.
Por cierto, no fue solo la COVID lo que complicó nuestro trabajo y lo hizo más desafiante e interesante. Malasia es un país predominantemente musulmán, y esto significa que las personas pueden comportarse de manera diferente e incluso vestirse de manera diferente a las personas de los países en los que se suele entrenar la mayoría de los modelos de ML y Computer Vision. Hubo un cierto sesgo que tuvimos que superar para lograr que los mismos modelos funcionaran en un entorno significativamente diferente.
¡Esto suena intrigante! ¿Podrías contarnos más sobre ello?
Por ejemplo, los modelos preentrenados se originan principalmente en países occidentales, donde no hay muchas mujeres que lleven sombreros que cubran sus cabezas en diversos grados. ¡Fue bastante problemático detectar mujeres que llevaban sombreros cubiertos! Tuvimos que volver a ensamblar el conjunto de datos, volver a entrenar los modelos, etc. Este problema es exclusivo de Malasia.
En segundo lugar, como ya he dicho, está la cultura en sí. En Malasia, la gente es menos propensa a expresar sus opiniones abiertamente. En este sentido, tuve que demostrar a mis compañeros de equipo (a propósito) que yo también podía equivocarme. Y cuando ellos fueron señalando mis errores, eso los animó. De esta manera un tanto indirecta, fui construyendo poco a poco un entorno más colaborativo, tan familiar para las empresas occidentales, pero completamente nuevo para Malasia.
Como persona que armó desde cero un equipo que trabaja en la vanguardia de la tecnología moderna, ¿qué consejo le daría a los aspirantes a especialistas en ciencia de datos y aprendizaje automático que buscan tener un impacto significativo en sus carreras?
Para los aspirantes a especialistas en ciencia de datos y aprendizaje automático, tengo tres consejos clave:
Evalúe críticamente si este campo realmente se alinea con sus pasiones. DS y ML son complejos y altamente competitivos, y exigen no solo habilidad sino entusiasmo genuino para tener éxito.
Si estás seguro de que este es tu camino, comprométete con un aprendizaje intensivo y continuo. Como señaló Andrej Karpathy, se necesitan alrededor de 10.000 horas de trabajo dedicado para convertirse en un verdadero profesional en este campo.
Concéntrese en incorporarse a empresas o laboratorios de investigación de primer nivel donde pueda colaborar con mentes líderes en su campo. Rodearse de colegas brillantes acelerará su crecimiento exponencialmente. Estará expuesto a problemas de vanguardia, soluciones innovadoras y un nivel de experiencia que lo desafiará e inspirará a diario.
Recuerde que si DS y ML son realmente su pasión, estos desafíos serán emocionantes. Este entusiasmo, sumado a la exposición a los mejores talentos, será clave para generar un impacto significativo en su carrera.
¿Cuáles son algunas de las tendencias y avances actuales en Visión Artificial que considera más interesantes y prometedores?
Si bien el procesamiento del lenguaje natural ha experimentado avances significativos recientemente, creo que la visión artificial sigue estando muy subestimada y tiene un inmenso potencial sin explotar. Aún estamos lejos de alcanzar capacidades de nivel humano en la percepción y comprensión visual.
Una de las tendencias más prometedoras en el campo de la visión artificial es el aprendizaje autosupervisado. Este enfoque, que puede compararse con el modo en que los niños aprenden observando el mundo que los rodea, ha demostrado tener un gran potencial para reducir la necesidad de grandes conjuntos de datos etiquetados. Sin embargo, creo que todavía falta un elemento crucial para replicar por completo el aprendizaje y la comprensión visual de los humanos.
Estoy particularmente entusiasmado con la evolución de la IA generativa en CV, especialmente los modelos de difusión y los modelos de consistencia. Estas tecnologías están revolucionando la generación, manipulación y comprensión de imágenes. Los modelos de difusión se destacan en la creación de imágenes diversas y de alta calidad, mientras que los modelos de consistencia mejoran nuestra capacidad para mantener la coherencia en diferentes perspectivas visuales.
A pesar de estos avances, todavía estamos en las primeras etapas para liberar todo el potencial de la visión artificial. El campo está maduro para la innovación, en particular en el desarrollo de modelos más robustos y generalizables que puedan acercarse a la comprensión visual a nivel humano en diversos contextos. Esto hace que sea un momento increíblemente emocionante para trabajar en visión artificial, con amplias oportunidades para investigaciones y aplicaciones innovadoras”.
Esta versión concisa mantiene los puntos clave sobre el estado actual del CV, su perspectiva sobre su potencial y los emocionantes desarrollos en el campo, al mismo tiempo que es más centrada y directa.
Crédito de la imagen destacada: es.rawpixel.com/Freepik