• Acerca
  • Cláusula
  • Contáctenos
  • Formación
  • Política de Privacidad
  • Publicaciones
  • Tratamiento de Datos
  • Uso de IA
domingo, junio 14, 2026
  • Login
Información Tecnológica en Línea
Información Tecnológica en Línea
  • Inicio
  • TechPulse
    • Economía Digital
    • Industria
    • VehículosTech
  • reviews
  • CES
  • Ciberseguridad
  • Eventos
  • IA
  • Latinoamérica
  • Podcast
  • Todo Móvil
    movilidad eléctrica

    Movilidad eléctrica urbana con ACER

    Xiaomi 17T

    Xiaomi 17T redefine la fotografía móvil con Leica

    Sony 1000X

    Sony 1000X THE COLLEXION con más de 24 horas de autonomía

    Motorola

    Motorola presenta portafolio diseñado para vivir el Mundial al máximo

    realme C100

    realme C100, el smartphone con batería de 8.000 mAh

    crear contenido

    ¿Qué valoras más al elegir un micrófono para crear contenido?

Sin resultados
Ver todos los resultados
  • Inicio
  • TechPulse
    • Economía Digital
    • Industria
    • VehículosTech
  • reviews
  • CES
  • Ciberseguridad
  • Eventos
  • IA
  • Latinoamérica
  • Podcast
  • Todo Móvil
    movilidad eléctrica

    Movilidad eléctrica urbana con ACER

    Xiaomi 17T

    Xiaomi 17T redefine la fotografía móvil con Leica

    Sony 1000X

    Sony 1000X THE COLLEXION con más de 24 horas de autonomía

    Motorola

    Motorola presenta portafolio diseñado para vivir el Mundial al máximo

    realme C100

    realme C100, el smartphone con batería de 8.000 mAh

    crear contenido

    ¿Qué valoras más al elegir un micrófono para crear contenido?

Sin resultados
Ver todos los resultados
Sin resultados
Ver todos los resultados
Inicio IA

Más datos: La clave para liderar la carrera de la IA

Desde el auge de la IA generativa en 2023, los gigantes tecnológicos han intentado no quedarse atrás en esta carrera de innovación.

Redacción Local Por Redacción Local
21/06/2024
in IA
0
datos
0
Compartir
0
Vistas
ComparteComparteComparte

Table of Contents

  • Sin datos nuevos, la IA no puede avanzar
  • ¿Synthetic Data es la solución?
  • Una IA autosuficiente aún está lejos

Hoy la búsqueda de datos para entrenar los modelos de lenguaje extenso – LLM (*) se ha convertido en la clave para liderar la IA.

Y el uso de los modelos de deep learning continuará creciendo, según las predicciones de la consultora Gartner.

Antes de 2020, la internet era vista como un pozo ilimitado de datos con los cuales se podía entrenar dicha tecnología.

Esto ha cambiado, los repositorios públicos como Wikipedia y Reddit, no bastan para alimentar los complejos algoritmos que potencian la IA.

Sin datos nuevos, la IA no puede avanzar

Frente a este problema, las compañías han decidido adoptar diversas prácticas.

A finales de 2021, la industria evidenció la insuficiencia de datos públicamente disponibles para entrenar a los LLM (Modelo Lingüístico Grande) .

Con el fin de recolectar más datos digitales, los investigadores crearon herramientas que pudieran transcribir el audio de videos de YouTube y plataformas de streaming.

Esto se hizo con el fin de que dichas aplicaciones se convirtieran en fuente de información y así nutrieran los modelos de lenguaje.

Un punto importante por resaltar es que lo anterior puede ir en contra de los términos de privacidad de las compañías de streaming.

Ya que está prohibido descargar videos para aplicaciones independientes.

datos

Con esta brecha se abre la oportunidad del debate para fortalecer las regulaciones en la medida que evoluciona la inteligencia artificial.

Otras empresas han llegado a medidas en las que la decisión está en el usuario.

Esto puede ir desde consentir las políticas de manejo de datos de las entidades hasta pagar para mantener la privacidad. Este es un dilema que genera cierta duda entre los usuarios.

Con la misión de dar con soluciones más precisas y que no infrinjan los derechos de los usuarios y autores, la industria ha llegado a opciones más razonables.

Una de ellas, por ejemplo, es la compra de editoriales para hacer uso de las obras de sus autores.

¿Synthetic Data es la solución?

Cuando OpenAI reveló GPT-3 en noviembre de 2020, el modelo había sido entrenado con la mayor cantidad de datos hasta la fecha: cerca de 300.000 millones de tokens.

En 2022, DeepMind —un laboratorio de IA de Google— fue más allá. Tras poner a prueba 400 modelos, descubrieron que los mejores fueron aquellos con la mayor cantidad de tokens.

Por ejemplo, Chinchilla fue entrenado con 1,4 billones. En este orden de ideas, los próximos modelos de IA requerirán incluso más tokens para perfeccionarse.

En medio del debate, Sam Altman —CEO de OpenAI— propuso una solución que no implica ignorar políticas corporativas.

Se trata de aprovechar los datos sintéticos o Synthetic Data. Estos consisten en datos no generados por humanos.

Se trata de información creada por IA para realizar comparaciones, estimaciones o simulaciones.

Una IA autosuficiente aún está lejos

Hoy en día, los modelos de IA que aprenden de sus propios resultados suelen quedar atrapados en bucles que refuerzan sesgos, errores y limitaciones.

Sin embargo, es el primer paso para tener datos digitales ilimitados.

Otra solución ante la imperiosa necesidad de recolectar datos puede ser contratar creadores de contenido que constantemente nutran los LLM con nueva información.

Y, en resumen, de esa forma dicho rol puede seguir siendo relevante en la era de la inteligencia artificial.

datos

Autor: Mateo Riveros, Senior Marketing Analyst para ManageEngine

(*) Un modelo de lenguaje extenso (LLM) es un modelo estadístico de lenguaje entrenado con una gran cantidad de datos.

Los cuales se pueden utilizar para generar y traducir texto y otros tipos de contenido, así como para llevar a cabo otras tareas de procesamiento del lenguaje natural (PLN).

VISITA NUESTRA SECCIÓN LATINOAMÉRICA, Y DÉJANOS TU COMENTARIO

Tags: DatosIAInteligencia ArtificialManageEngine
Anterior Artículo

Peugeot 9X8 conquista Le Mans

Siguiente Artículo

ICT SUMMIT COLOMBIA impulsó la excelencia TIC de la región

Redacción Local

Redacción Local

En ITenLINEA hablamos de innovación, tendencias y soluciones reales que la tecnología pone a tu alcance. Gracias por leernos, comentar y compartir lo que hacemos con tanta pasión. Súmate a nuestra comunidad también en redes sociales y sigamos descubriendo juntos cómo la tecnología puede transformar nuestro día a día. Potenciamos nuestro trabajo con INTELIGENCIA ARTIFICIAL de forma responsable y ética.

Relacionada Posts

AEO
IA

AEO: la clave para aparecer en ChatGPT, Gemini y Perplexity

Por Redacción Local
11/06/2026
IA en Colombia
IA

IA en Colombia: el reto ya no es adoptarla, sino liderarla

Por Jose Rondón
02/06/2026
Fibra
IA

Fibra óptica en Colombia impulsa el cierre de la brecha digital

Por Redacción Local
28/05/2026
Mundial 2026
IA

El Mundial 2026 y Lenovo: así será la Copa más tecnológica de la FIFA

Por Jose Rondón
26/05/2026
IA autónoma
IA

Gemini Spark y la nueva era de la IA autónoma que mostró Google

Por Redacción Local
26/05/2026
Siguiente Artículo
ICT SUMMIT COLOMBIA

ICT SUMMIT COLOMBIA impulsó la excelencia TIC de la región

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Acepto los términos, condiciones y la Política de Privacidad.

Etiquetas

Acer agentes de IA Asus Automatización automatización empresarial Bogotá centros de datos CES CES 2025 Ciberseguridad Colombia Comercio electrónico Conectividad Creadores de contenido criptomonedas Data centers ecoflow eCommerce eCommerce Day Emprendimiento Huawei IA IA Generativa IBM Inclusión financiera Innovación Innovación Tecnológica Inteligencia Artificial Inteligencia Artificial generativa Kaspersky Klip Xtreme Las Vegas Latinoamérica Medellín Motorola Movilidad sostenible PRIMUS Ransomware Samsung Seguridad digital Smartphone sostenibilidad Tecnología Tendencias Transformación digital
Tecnología, noticias de la industria, gadgets, cubrimientos especiales y tutoriales para aprender y estar informados | Periodismo con valor agregado |

© ITenLINEA.com | Media & Consulting [ Desde 2003 ISSN 1900-2777 ] Creative Commons, Reconocimiento 4.0 Internacional | Psalms 32: 8.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Guía de 100 IAs y más

IA

Sin resultados
Ver todos los resultados
  • Inicio
  • TechPulse
    • Economía Digital
    • Industria
    • VehículosTech
  • reviews
  • CES
  • Ciberseguridad
  • Eventos
  • IA
  • Latinoamérica
  • Podcast
  • Todo Móvil

© ITenLINEA.com | Media & Consulting [ Desde 2003 ISSN 1900-2777 ] Creative Commons, Reconocimiento 4.0 Internacional | Psalms 32: 8.

Utilizamos cookies y tecnologías similares para habilitar los servicios y la funcionalidad de nuestro sitio web y para comprender su interacción con nuestros contenidos | We use Cookies and similar technologies to enable the services and functionality of our site and to understad your interaction. Política de Privacidad | Privacy Policy.