Criptotendencias - Noticias de bitcoin, criptomonedas y blockchain
viernes, mayo 9, 2025
  • Actualidad
  • Bitcoin
  • Análisis Criptofinanciero
  • Altcoins
  • Blockchain
  • Tecnología
  • Base de conocimiento
Sin resultado
Ver todos los resultados
Criptotendencias - Noticias de bitcoin, criptomonedas y blockchain
  • Actualidad
  • Bitcoin
  • Análisis Criptofinanciero
  • Altcoins
  • Blockchain
  • Tecnología
  • Base de conocimiento
Sin resultado
Ver todos los resultados
Criptotendencias - Noticias de bitcoin, criptomonedas y blockchain
Sin resultado
Ver todos los resultados
Inicio Tecnología

OpenAI integra funciones de imagen y voz en ChatGPT: el chatbot podrá ver, escuchar y hablar

La compañía sigue impulsando mejoras para su popular chatbot de inteligencia artificial

Dennys Gónzalez por Dennys Gónzalez
septiembre 26, 2023
en Tecnología
Tiempo de lectura: 4 mins lectura
0
OpenAI integra funciones de imagen y voz en ChatGPT: el chatbot podrá ver, escuchar y hablar

OpenAI integra funciones de imagen y voz en ChatGPT: el chatbot podrá ver, escuchar y hablar

75
Compartido
1.3k
Vistas
Compartir en TwitterCompartir en LinkedInCompartir en WhatsApp

En un salto hacia la multimodalidad, la compañía de inteligencia artificial OpenAI anunció la integración de capacidades de voz e imagen para ChatGPT, su popular chatbot de IA, el cual contará con funciones que le permitirán ver, escuchar y hablar a través de las consultas de los usuarios.

Te puede interesar: OpenAI anuncia DALL-E 3, su modelo IA de generación de imágenes más avanzado y que estará integrado de forma nativa en ChatGPT

ChatGPT ahora podrá ver, escuchar y hablar

ChatGPT seguirá evolucionando como modelo de inteligencia artificial, ahora con la integración de características que le permitirán procesar y recibir solicitudes en imágenes, así como también procesar contenido de audio enviadas por los usuarios y responder también con su propia voz.

Entérate de todo del acontecer cripto! 🚀 Síguenos en X: @cripto_t

Esto significa un paso adelante por parte de OpenAI rumbo a la multimodalidad de ChatGPT.

La multimodalidad dentro de la inteligencia artificial se refiere a la capacidad de los sistemas basados en IA para comprender y procesar información proveniente de diversas fuentes o modalidades, como imágenes, texto, audio, entre otros.

¡Únete a nuestro grupo de Telegram en CriptoTendencias.com y mantente al tanto de las últimas noticias y tendencias en el mundo de las criptomonedas!

En las próximas semanas, ChatGPT podrá procesar imágenes enviadas por los usuarios con consultas complementadas con texto.

Te puede interesar: Google, OpenAI, Microsoft y Anthropic crean un organismo para vigilar el desarrollo responsable de los modelos de inteligencia artificial más poderosos

Por ejemplo, los usuarios podrán pedir a ChatGPT que les ayude a realizar tareas, analizar documento, aprender a configurar o arreglar algún dispositivo físico o entender un gráfico complejo de datos, sólo enviando imágenes al chatbot.

Los usuarios podrán enviar diferentes tipos de imágenes, tanto fotografías, como capturas de pantalla o documentos con texto e imágenes. Además, se podrán enviar varias imágenes a la vez, y será posible realizar modificaciones o especificaciones a las mismas con un editor interno.

Por otro lado, con respecto a la parte de audio, OpenAI está dotando a ChatGPT de «voz y oídos» que activarán la opción de charlar con el asistente de IA.

Te puede interesar: OpenAI presenta una versión de ChatGPT para empresas

El chatbot podrá procesar solicitudes de audio enviadas por los usuarios, quienes contarán con un botón de audio para enviar sus consultas, que luego ChatGPT podrá comprender a través de un nuevo modelo de conversión de texto a voz y la integración de su modelo de reconocimiento de voz, Whisper.

Tras hacerlo, ChatGPT responderá en formato de voz, a través de voces creadas de forma sintética utilizando voces reales, proceso en el cual OpenAI trabajó con actores de doblaje. Existirán cinco voces que los usuarios podrán elegir como «la voz de ChatGPT».

Estas nuevas características de voz e imágenes del chatbot estarán disponibles para usuarios de ChatGPT Plus y Enterprise, dentro de dos semanas, según explicó la compañía en un anuncio.

La función de voz estará disponible en la aplicación móvil del chatbot tanto en iOS como Android, mientras que la función de imágenes contará con soporte para todas las plataformas.

ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb

— OpenAI (@OpenAI) September 25, 2023

Los movimientos de OpenAI parecen responder a un posible salto a la multimodalidad de otras compañías como Google, que desde hace meses está trabajando en el desarrollo de su gran modelo de lenguaje (LLM), Gemini, el cual han asegurado cuenta con un desarrollo desde cero para ser multimodal y que apunta a ser competidor directo de ChatGPT.

Días atrás, Google también expandió la función de imágenes de su chatbot Bard a escala mundial.

Imagen cortesía: Arbaz Khan en Vecteezy

¿Más temas de interés?

Extienden por 6 meses el plazo para la reestructuración de la Sunacrip en Venezuela

MicroStrategy compra 5.445 bitcoins más para sus balances corporativos

Binance Academy registra un aumento del 62% en criptoeducación, con los mercados emergentes a la cabeza

SEED Latam Presenta “Aula Abierta”: Un Ciclo de Formación en Gobernanza Blockchain

Para minería en solitario: Minero SOLO SATOSHI de 1.2TH/s y busca esa recompensa por solo USD 199... hecho en Estados Unidos

¡Únete GRATIS a Binance ahora! 💥 Ahorra en comisiones para siempre y maximiza tus ganancias en criptomonedas. 🌟 ¡Regístrate hoy y lleva tus inversiones al siguiente nivel!.

Tags: ChatGPTinteligencia artificialOpenAI
Entrada anterior

SEED Latam Presenta «Aula Abierta»: Un Ciclo de Formación en Gobernanza Blockchain

Próxima publicación

Circle simplifica el nombre de sus stablecoins USD Coin y Euro Coin: ahora serán USDC y EURC

Próxima publicación
Circle simplifica el nombre de sus stablecoins USD Coin y Euro Coin: ahora serán USDC y EURC

Circle simplifica el nombre de sus stablecoins USD Coin y Euro Coin: ahora serán USDC y EURC

Publicidad

Publicidad

Entradas recientes

  • BlackRock redefine el riesgo financiero: ahora es más arriesgado no tener Bitcoin que poseerlo
  • Bitcoin DeFi sigue ganando tracción en el primer trimestre de 2025, según el último informe de Messari
  • Coinbase apuesta fuerte por los derivados cripto con la compra de Deribit por 2.900 millones de dólares
  • La Reserva Federal mantiene tasas en pausa: equilibrio inestable entre inflación, empleo y tensiones políticas
  • Sei redefine su camino: apuesta total por la compatibilidad EVM y deja atrás el ecosistema Cosmos

Suscríbete a nuestro Podcast

Síguenos en X

Zebec Marca el Camino: Innovación en Pagos Instantáneos y el Futuro de las Finanzas Digitales 🔥https://t.co/20ABFDMIZs pic.twitter.com/W3kTUyvVKo

— Criptotendencias (@cripto_t) January 19, 2024

Publicidad

  • Contáctanos
  • Publicidad

© 2022 Criptotendencias.com - SEO & Web Consultor SEO.

Sin resultado
Ver todos los resultados
  • Home
  • Actualidad
  • Bitcoin
  • Blockchain
  • Base de conocimiento
  • Podcast
  • Publicidad
  • Opinión
  • Contáctanos
  • Autor invitado

© 2022 Criptotendencias.com - SEO & Web Consultor SEO.