Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the fast-indexing-api domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/buwemyhm/public_html/wp-includes/functions.php on line 6121

Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the health-check domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/buwemyhm/public_html/wp-includes/functions.php on line 6121
Más allá del auge de la IA: por qué la fiebre del oro de los datos recién comienza - Dataconomy ES
Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
No Result
View All Result

Más allá del auge de la IA: por qué la fiebre del oro de los datos recién comienza

byGediminas Rickevičius, Vice President of Global Partnerships at Oxylabs
10 marzo 2025
in Trends
Home Trends

Muchos pensarían que el auge de la IA encendió inmediatamente una gran demanda de datos web públicos. Después de todo, esos modelos están capacitados en datos, y mucho de eso está en Internet. Tiene algo de verdad, pero no es toda la historia.

Cuando herramientas como ChatGPT comenzaron a implementar una tras otra, los modelos de IA en los que se basaban ya estaban entrenados. Los datos ya fueron adquiridos de varias fuentes y se utilizaron para crear las herramientas que se introducen a los consumidores. Por supuesto, estas herramientas siempre estaban mejorando con la ayuda de datos adicionales. Sin embargo, gran parte de estos datos se recopilaron a través de interacciones con los usuarios o los desarrolladores de estas herramientas a través de sus métodos internos. Al principio, esto fue suficiente.

Las cosas comenzaron a cambiar cuando estas soluciones recibieron el poder de los motores de búsqueda para acceder a los datos en tiempo real. La necesidad de datos web se disparó. Incluso eso fue solo el calentamiento en comparación con la demanda de datos web que se aceleran en este momento.

Un puente sobre la brecha de conocimiento

Progreso rápido en la era de la IA. Pero si piensa en cuándo se lanzó las primeras herramientas de IA conversacionales, es posible que recuerde que tenían una debilidad notable en comparación con los motores de búsqueda tradicionales: un límite de conocimiento.

Solo podían saber qué sucedió hasta la fecha en que fueron lanzados o actualizados por última vez. Por lo tanto, había una brecha entre la realidad en la que vivías y esa última actualización. Herramientas como CHATGPT le falló cuando quería explorar eventos recientes o obtener información actualizada y relevante.

Eso cambió con el avance de los motores de búsqueda con IA. Para proporcionar resultados de búsqueda generativos relevantes y confiables, estas herramientas deben tener acceso a datos en línea en tiempo real. Se necesitaba un puente entre los modelos e Internet, sobre el cual la información podría viajar instantáneamente.

Muchas piezas, como grandes redes proxy, API de raspado y otras herramientas para una integración perfecta y acceso abierto a sitios web, se combinan para crear la infraestructura de recopilación de datos web, ese puente necesario.

Y ese es solo el comienzo. El Impacto de la búsqueda generativa Sobre cómo navegamos por Internet seguramente será el mejor desde que Google Search llegó en 1998. A medida que presenciamos su desarrollo, las empresas, desde motores de búsqueda clásicos establecidos hasta nuevas empresas emergentes y hambrientas, están corriendo para forjar su espacio en el futuro de la búsqueda. Esa carrera depende en gran medida de qué tan confiable sea el puente en el que corran.

Ai se vuelve multimodal

Los modelos AI con los que estamos más familiarizados operan en un espacio limitado. Los chatbots pueden leer y responder a las indicaciones basadas en texto. Incluso las herramientas más avanzadas que pueden generar imágenes basadas en indicaciones del lenguaje natural tienen límites bastante estrictos.

Un siguiente paso natural en la evolución de ai, IA multimodal Utiliza múltiples tipos de datos para proporcionar resultados más versátiles, perspicaces y bien basados ​​en bienes. La capacitación de IA multimodal requiere grandes volúmenes de video, audio, texto, habla y otros tipos de datos. Estos modelos también permitirán la generación de videos basada en IA de siguiente nivel, lo que resulta en una mayor calidad y consistencia interna de imágenes generadas.

A medida que la competencia se intensifica con nuevos jugadores como Veterano Surgiendo repentina y aparentemente de la nada, la pregunta es qué compañías están adelante en el desarrollo de herramientas multimodales a puerta cerrada. Cualquiera que sean, esas compañías necesitan capacidades de raspado de datos, que no tienen precedentes incluso en la era de los grandes datos.

Para crear herramientas multimodales efectivas, especialmente generadores de video, los desarrolladores deben raspar muchos datos de video. Scraping Videos no es como raspar el HTML de las páginas web basadas en texto. El tamaño y la complejidad de la tarea son completamente diferentes. En primer lugar, los conjuntos de datos de video son miles de veces más grandes que los conjuntos de datos HTML. En segundo lugar, debe obtener las imágenes, el sonido, las transcripciones, todos los aspectos de un video, para que su herramienta sea competitiva en el mercado explosivo.

Por lo tanto, las empresas necesitan un flujo constante de datos que sea enorme y diverso. Además de la inmensidad, la infraestructura requerida debe poseer capacidades avanzadas de procesamiento de datos para manejar este flujo sin errores. Algunas compañías pueden optar por conjuntos o soluciones de datos preparados para evitar incluso los más mínimos retrasos que pueden ser muy costosos en el mercado de ritmo rápido.

Multimodal se encuentra multilingüe

La demanda de IA multilingüe confiable es enorme. Puede hacer la vida mucho más fácil eliminando las barreras del idioma en situaciones cotidianas, así como racionalizar Operaciones comerciales internacionales. Mayoría modelos de gran idioma fueron entrenados para operar principalmente en inglés, y mientras mejoran, todavía queda un largo camino por recorrer.

Esta es otra área de competencia que podría ser especialmente atractiva para las nuevas empresas de IA que no pueden competir en los mercados dominantes de modelos de IA basados ​​en inglés. Internet habla todos los idiomas y está buscando otra ola de extracción de datos por parte de los desarrolladores que las carreras para construir herramientas de priorización de idiomas multilingües o no ingleses.

Y como esta demanda ya considerable parejas con la demanda de generación de videos en otros idiomas, uno puede ver fácilmente por qué antes era solo un calentamiento para la IA. Mucho en el desarrollo de la IA se pospuso para más tarde, después de que se puedan dominar los conceptos básicos. Que más tarde ha llegado. Ahora, AI quiere crear cualquier cosa en cualquier medio y hablar todos los idiomas. Para lograr esto, aún se deben extraer muchos datos sin explotar.

Datos de hoja perenne

En resumen, incluso en la edad en que el raspado de datos web es crucial para dominar los paisajes tecnológicos del futuro, aún no se han raspado muchos datos. Aquellos con las herramientas para obtener esos datos primero se posicionarán para liderar la siguiente etapa del desarrollo de la IA.

Sin embargo, incluso después de que las herramientas multimodales de próxima generación estén capacitadas y liberadas, y la necesidad de conjuntos de datos de video para la capacitación disminuye, siempre habrá un tipo de datos en la alta demanda: datos en tiempo real. Las mejores herramientas de IA serán aquellas que puedan proporcionar información relevante y comprender el contexto actual.

Por lo tanto, lo que los desarrolladores de IA necesitan incluso más que grandes conjuntos de datos que eventualmente envejecerán es la integración con la web que permite un flujo constante de datos, recientemente generado cada segundo. Construir esa integración y hacerlo confiable es el desafío que definirá el futuro de los mercados de IA.

Tags: AI Boomfiebre del oro

Related Posts

El futuro de SEO: cómo las actualizaciones de IA de Google están cambiando el juego

El futuro de SEO: cómo las actualizaciones de IA de Google están cambiando el juego

25 abril 2025
Implementación de identidad Primera seguridad para un control de acceso más fuerte

Implementación de identidad Primera seguridad para un control de acceso más fuerte

15 abril 2025
Los 10 juegos principales del Showcase de la iniciativa Triple-I

Los 10 juegos principales del Showcase de la iniciativa Triple-I

11 abril 2025
Switch 2 vs Switch Lite: ¿Vale la pena la actualización?

Switch 2 vs Switch Lite: ¿Vale la pena la actualización?

9 abril 2025
Estrategias para escalar centros de datos en la era de la IA

Estrategias para escalar centros de datos en la era de la IA

25 marzo 2025
Cómo ver Instagram sin una cuenta, incluidos los perfiles privados

Cómo ver Instagram sin una cuenta, incluidos los perfiles privados

5 marzo 2025

Recent Posts

  • El impacto de las telas inteligentes en el rendimiento de la ropa táctica
  • Databricks apuesta grande en Postgres sin servidor con su adquisición de neón de $ 1 mil millones
  • Alphaevolve: Cómo la nueva IA de Google apunta a la verdad con la autocorrección
  • Tiktok está implementando textos alternativos generados por AI para una mejor acesibilidad
  • Trump obliga a Apple a repensar su estrategia de iPhone de la India

Recent Comments

No hay comentarios que mostrar.
Dataconomy ES

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.