17 may 2025
Juegos
Juegos
Newsletter
Newsletters
Tienda La Voz
Tienda
Club La Voz
Club LaVoz
La Voz
Suscribite por $400
  • Suscripción
    Suscripción
    Suscripción
    • Contenido exclusivo
    • Cursos
    • Sorteos
    • Club La Voz
    • Edición impresa
    • Suscribirme
  • Últimas noticias
    Últimas noticias
  • Juegos
    Juegos
  • Noticias
    Noticias
    • Sucesos
    • Ciudadanos
    • Política
    • Mundo
    • Tecnología
    • Opinión
    • Editorial
    • Salud
    • Viral
    • Videos
    • Cultura
    • Diseño
    • Clima
    • Horóscopo
    • Quinielas
    • Agenda
    • Cartelera
    • Agencias
    • Servicios
    • Comer y beber
  • Deportes
    Deportes
    • Portada
    • Fútbol
    • Belgrano
    • Instituto
    • Talleres
    • Racing (C)
    • Agenda
    • Tenis
    • Básquet
    • Rugby
    • Motores
    • Hockey
    • Natación
    • Vóley
    • Ciclismo
    • Estadísticas
    • Extremo
  • Espectáculos
    Espectáculos
    • Portada
    • Mirá
    • Tevé
    • Cine y series
    • Música
    • Escena
    • Cartelera
    • Agenda
  • Agro
    Agro
    • Portada
    • Actualidad
    • Agricultura
    • Ganadería
    • Entrevistas
    • Clima
    • AgroVoz Expertos
  • Negocios
    Negocios
    • Portada
    • Emprendedores
    • Empresas
    • Entrevistas
    • Finanzas
    • Autos
    • Inmuebles
    • Los datos dicen
  • Club La Voz
  • Fúnebres
  • Clasificados
  • Voy de Viaje
  • Especiales
  • Edición Impresa
  • Institucional
    Institucional
    • La empresa
    • ¿Quiénes somos?
    • Manual de estilo
    • Normas éticas
    • Políticas de privacidad
    • Términos y condiciones

En las redes

  • cerrar menu
  • cerrar menu
  • cerrar menu
  • cerrar menu

Descargate la app de La Voz

android
ios
usuario

Hola,

  • cerrar menu
    Mis datos
    chevron
  • cerrar menu
    Mi suscripción
    chevron
  • cerrar menu
    Mis pagos
    chevron
  • cerrar menu
    Mis newsletters
    chevron
  • cerrar menu
    Mis cursos
    chevron
  • cerrar menu
    Club La Voz
    chevron
  • cerrar menu
    Mis credenciales
    chevron
  • cerrar menu
    Edición Impresa
    chevron
  • cerrar menu
    Preguntas frecuentes
    chevron
  • cerrar menu
    Centro de ayuda
    chevron
  • cerrar menu
    Cerrar sesión
    chevron
La Voz
La Voz
usuario
Ingresar
Suscribite por $400
exclusivo
usuario
Tecnología / Chat GPT

Inteligencia Artificial. Chat GPT-4o: combinaciones de texto, audio e imagen a una velocidad casi humana

La nueva versión del modelo de lenguaje admite distintas modalidades de forma nativa con gran rapidez. Cómo acceder a la versión gratis y cuáles son las mejoras.

14 de mayo de 2024,

23:58
Europa Press
Europa Press
Chat GPT-4o: combinaciones de texto, audio e imagen a una velocidad casi humana
Imagen: captura de video.

Lo más leído

1
Hipertensión

Ciudadanos

Nuevo estudio. La forma natural y efectiva para bajar la presión alta que cuenta con aval científico

2

Agro

Clima. Lluvias abundantes y heladas otoñales, lo que se viene la próxima semana en Córdoba

3

Sucesos

Operativo. En un pueblo del interior de Córdoba, un taller mecánico era pantalla para la venta de drogas

4

Ciudadanos

Escándalo. Allanaron el CPC Jardín y la casa de jerárquicos por la presunta emisión de carnés truchos

5

Ciudadanos

Diagnóstico. Cómo saber si tenés presión alta: los 7 síntomas más frecuentes según los médicos

Open AI ha presentado su nuevo modelo de Inteligencia Artificial (IA) GPT-4o, que acepta cualquier combinación de texto, audio e imagen, y que puede responder a una entrada de voz en solo 232 milisegundos, con un promedio de 320 milisegundos, que es similar a un tiempo de respuesta humana.

GPT-4o (cuya “o” significa “omni”) es un modelo de lenguaje que admite distintas modalidades de forma nativa, esto es, que comprende y genera una combinación de entradas de texto, audio e imagen con gran velocidad, según ha explicado en su presentación la CTO de OpenAI, Mira Muratyi.

Para generar una respuesta a una entrada de audio, emplea un tiempo similar al que necesitan los humanos. Esto significa que puede responder en un mínimo 232 milisegundos, aunque registra un promedio de 320 segundos de tiempo de respuesta, según han podido comprobar los desarrolladores.

Para las entradas de texto en inglés, la nueva herramienta iguala el rendimiento de GPT-4 Turbo y ofrece una mejora “significativa” en entradas de texto de idiomas diferentes al inglés, que traduce en tiempo real, “siendo además mucho más rápido y un 50 por ciento más barato en la API”, según ha matizado.

Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN

Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx

— OpenAI (@OpenAI) May 13, 2024
Bunker DB lanzó Text-to-Chart.

Tecnología

Inteligencia Artificial. Revolución en el mundo del marketing: una IA generativa transforma texto en gráficos

Redacción LAVOZ

Cómo es la versión “o” de Chat GPT

Para OpenAI, esta herramienta, que se ha sometido a una serie de pruebas llevadas a cabo por expertos del conocido equipo rojo, “es un paso hacia una interacción persona-ordenador mucho más natural”.

La compañía también ha comentado la evolución de sus anteriores modelos para crear la versión GPT-4o. En primer lugar, ha señalado que hasta ahora era posible utilizar el “Modo voz” para conversar con ChatGPT con latencias de 2,8 segundos de media en el caso de la versión GPT-3.5 y 5,4 segundos en GPT-4.

Canlı çeviri. Mükemmel.
Chat-GPT4o anlık çeviri yapıyor. Heyecan verici. pic.twitter.com/jPWgMINWrM

— Atilla Uslu (@ativittta) May 14, 2024

Esto es posible porque se ejecuta una canalización de tres modelos separados. El primero de ellos transcribe el audio a texto. Después, el modelo GPT-3.5 o GPT-4 recoge el texto y lo emite para que un tercer modelo lo vuelva a convertir en audio.

Según la desarrolladora, en este proceso GPT-4 “pierde mucha información”, porque no puede observar el tono, varios interlocutores o ruidos de fondo. Tampoco puede generar risas, cánticos o expresar emociones.

Por ese motivo, se ha propuesto entrenar “un único modelo de principio a fin”, lo que quiere decir que todas las entradas y las salidas de texto, audio y voz son procesadas por la misma red neuronal, que combina todas estas modalidades para brindar una respuesta más realista.

La seguridad en GPTo

También ha aclarado que GPT-4o está desarrollado bajo el principio de seguridad por diseño mediante técnicas como el filtrado de datos; y que para su lanzamiento ha pasado por una fase de pruebas de las distintas versiones del modelo, que se ha ajustado y personalizado para obtener mejores resultados.

Open AI también ha aclarado que ha contado con la supervisión de más de 70 especialistas en ámbitos como la psicología y la desinformación, a fin de identificar los riesgos que introducen o amplifican las nuevas modalidades añadidas a este modelo.

Inteligencia de amenazas microsoft

Tecnología

Microsoft y OpenAI frenan la actividad de cinco hackers que usaban IA para mejorar ciberataques

Europa Press

Cuándo se publica la versión gratuita de Chat GPT-4o

Debido a que la entrada de voz y audio “presenta diversos riesgos novedosos”, por el momento la tecnológica solo ha habilitado la entrada y salida tanto de texto como de imagen en su nuevo modelo. En las próximas semanas la tecnológica seguirá trabajando en la infraestructura técnica y la seguridad de GPT-4o para lanzar la modalidad restante.

GPT-4o se irá desplegando de forma “iterativa” y gratuita para los usuarios de la modalidad ChatGPT Plus. En las próximas semanas también lanzará la nueva versión alfa de la modalidad de voz con GPT-4o en esta misma suscripción. Por su parte, los desarrolladores ya pueden acceder a este modelo en la API para probar la modalidad de texto e imagen.

Por estas razones, no se publicó una fecha de lanzamiento exacta. Open AI aseguró, sin embargo, que el nuevo modelo estará disponible en pocas semanas.

Todavía no se conoce si la primera versión abierta estará disponible para todo el mundo o si se habilitará en distintas regiones del planeta.

Cuando esté al alcance la nueva versión de la plataforma, los usuarios tendrán que entrar a la página oficial de Open AI. Una vez dentro del sitio, deberán ingresar con el usuario y contraseña correspondientes.

En caso de que sea la primera vez en la plataforma, será necesario que se registre en una nueva cuenta.

Recién una vez completado el acceso, el usuario tendrá que seleccionar la opción “ChatGPT-4o” -cuando ya esté habilitada- y podrá comenzar a interactuar con el modelo de lenguaje.

Temas Relacionados

  • Chat GPT
  • ChatGPT
  • Edición impresa
Más de Tecnología
 Imagen ilustrativa / Web

Tecnología

Juice jacking. El FBI lanza alerta global por los riesgos de cargar el celular en lugares públicos

Redacción LAVOZ
Netflix Ads Suite

Tecnología

IA. Netflix revoluciona la publicidad con IA generativa integrada en sus series

Redacción LAVOZ

Espacio de marca

Estas son las SUVs de Volkswagen con la cuota más baja del mercado

Espacio de marca

Mundo Maipú

Estas son las SUVs de Volkswagen con la cuota más baja del mercado

Mundo Maipú
Se presentó la 3° de la Noche de las Lecturas

Espacio de marca

Agencia Córdoba Cultura

Se presentó la 3° de la Noche de las Lecturas

Agencia Córdoba Cultura
Servicio oficial Ford en el taller de Maipú

Espacio de marca

Mundo Maipú

Servicio oficial Ford en el taller de Maipú

Mundo Maipú
La Agencia Córdoba Joven actualiza su línea de créditos para emprendedores: hasta $2.800.000 sin interés.

Espacio de marca

Agencia Córdoba Joven

La Agencia Córdoba Joven actualiza su línea de créditos para emprendedores: hasta $2.800.000 sin interés.

Agencia Córdoba Joven
Ver más Espacio de marca

Suscripción La Voz

Fabricado en Tierra del Fuego

Negocios

Análisis. 50 años después, la misma tierra, ¿el mismo fuego?

Daniel Alonso
Martín Llaryora

Política

La trastienda. Llaryora evitó gritarle el gol en la cara a Milei

Julián Cañas
El presunto rol de Karina en la vida privada de Javier Milei: “Filtra a...”

Política

Análisis. La ambición política puede dañar los logros en economía

Juan Turello
(Tara Winstead/Pexels.com)

Sucesos

Fraudes. Estafa piramidal: condenaron a los integrantes de la “academia del engaño” en Córdoba

Federico Noguera
Ver más Suscripción La Voz

Videos

  • Franco Colapinto

    Noooooooooooo... Franco Colapinto rompió su Alpine en la clasificación de la Fórmula 1 en Imola: así fue su accidente

  • 00:41

    barrio San Vicente

    Video. Una motociclista resultó herida tras cruzar un semáforo en rojo y ser embestida por un auto en Córdoba

  • Yuki Tsunoda

    Fórmula 1. El durísimo accidente de Yuki Tsunoda: así destruyó a su Red Bull en la clasificación en Imola

  • 00:44

    Más de 300 milímetros cayeron en la zona de Zárate.

    Videos. Zárate bajo el agua: impactantes imágenes de las inundaciones que azotan al norte de Buenos Aires

  • 00:34

    Barcelona

    La Morocha. Barcelona campeón al ritmo de Luck Ra: “No puede hacer todo el campeón...”

  • 00:34

    Peces Raros

    En vivo. Peces Raros, electrónica de alta escuela y una puesta multisensorial: gloriosos desde su balcón

  • 02:10

    Analía Franchín habló sobre una adicción que tiene: "Apenas me levanto..."

    De película. Analía Franchin y una confesión insólita: “Mi papá reencarnó en mi gato”

  • 00:57

    La mujer se sorprendió.

    Diferencias. Una argentina se mudó a Londres y se sorprendió por una costumbre inglesa: “Están pegados a...”

Últimas noticias

Partido de Atenas vs Oberá

Básquet

Liga Nacional. A pesar de la derrota ante Oberá, Atenas está en los playoffs: el análisis de Peirone y Rivata

Gabriela Martín
Franco Colapinto

Motores

A pleno. Así trabajan los mecánicos de Alpine para arreglar el auto de Colapinto para que corra en Imola

Redacción LAVOZ
Reik

Espectáculos

Cambio de fecha. Por el temporal en Buenos Aires, el show de Reik en Córdoba se reprograma: cuándo es

Redacción LAVOZ
Política

Política

Diputados. La oposición reactivó negociaciones para cubrir vacantes en la AGN y quedó en la mira Mario Negri

Carolina Ramos
Ver más Últimas noticias
adZocalo
La Voz

    Nuestros sitios

  • La Voz
  • Clasificados
  • Voy de Viaje
  • Club La Voz

    Publicidad

  • La Voz Comercial
  • Clasificados

    Edición Impresa

  • Edición Impresa
  • Edición PDF

    Institucional

  • Directo al editor
  • La empresa
  • Redacción
  • Manual de estilo
  • Normas éticas

    Miembros del Grupo Clarín

  • Clarín
  • Olé
  • EntreMujeres
  • Vía País
  • TyC Sports
  • TN
  • Ciudad
  • El Trece TV
  • Mitre
  • La 100
  • Cienradios
  • facebook
  • twitter
  • instagram
  • youtube

La Voz del Interior. Fundado el 15 de marzo de 1904. LaVoz.com.ar. Lanzada el 21 de septiembre de 1996. Año 28. Edición N° 10466. Registro intelectual 56057581.

Domicilio legal: La Voz del Interior 6080 – CP: X5008HKJ – Córdoba, Argentina. Propietario: La Voz del Interior SA. Gerente General: Juan Tillard. Director: Carlos Hugo Jornet. Editor: Carlos Hugo Jornet.

© 1996 - 2025 Todos los derechos reservados. Aviso legal | Política de privacidad – Por consultas comunicate al 0800 555 2869, de lunes a viernes, de 9 a 17, o escribinos por WhatsApp al +54 9 351 884 2000

La Voz - Product Design