Le consultant rédige les documents fonctionnels et fait du support applicatif

ChatGPT peut désormais vous parler

OPENAI, la société spécialisée dans l'intelligence artificielle qui a lancé ChatGPT, vient d'annoncer une mise à jour de ses applications mobiles ChatGPT pour iOS et Android permettant à une personne de formuler ses questions au chatbot et de l'entendre répondre avec sa propre voix de synthèse.

La nouvelle version de ChatGPT ajoute également des fonctions visuelles intelligentes : si vous téléchargez ou prenez une photo à partir de ChatGPT, l'application répondra avec une description de l'image et offrira plus de contexte, similaire à la fonction Lens de Google pour ceux qui connaissent.

Les nouvelles fonctionnalités de ChatGPT montrent qu'OpenAI traite ses modèles d'intelligence artificielle, qui sont en cours d'élaboration depuis des années, comme des produits avec des mises à jour régulières et itératives. Le succès surprise de l'entreprise, ChatGPT, ressemble davantage à une application grand public qui rivalise avec Siri d'Apple ou Alexa d'Amazon.

Rendre l'application ChatGPT plus attrayante pourrait aider OpenAI dans sa course contre d'autres entreprises d'IA, comme Google, Anthropic, InflectionAI et Midjourney, en fournissant un flux plus riche de données provenant des utilisateurs pour aider à former ses puissants moteurs d'IA. L'introduction de données audio et visuelles dans les modèles d'apprentissage automatique de ChatGPT peut également contribuer à la vision à long terme d'OpenAI, qui consiste à créer une intelligence plus proche de l'humain.

✎ Pour aller plus loin dans votre approche de l'intelligence artificielle

L'intelligence artificielle (IA), une opportunité ? (Posté le jeudi 21 novembre): On sait que l'intelligence artificielle prend des formes différentes, qui vont des plateformes aux outils en passant par les applications. Cette technologie devient de plus en plus abordable et ses utilisations se multiplient. L'intelligence artificielle présente aujourd'hui un intérêt particulier pour beaucoup de domaines, pourquoi pas le monde de l'ERP ?

Les modèles de langage d'OpenAI qui alimentent son chatbot, y compris le plus récent, GPT-4, ont été créés à l'aide de grandes quantités de textes collectés à partir de diverses sources sur le web. De nombreux experts en IA pensent que, tout comme l'intelligence animale et humaine utilise différents types de données sensorielles, la création d'une IA plus avancée pourrait nécessiter d'alimenter les algorithmes avec des informations audio et visuelles, ainsi qu'avec du texte.

La rumeur veut que le prochain grand modèle d'IA de Google, Gemini, soit "multimodal", ce qui signifie qu'il sera capable de traiter plus que du texte, et qu'il autorisera peut-être la vidéo, les images et les entrées vocales. "Du point de vue des performances du modèle, on s'attend intuitivement à ce que les modèles multimodaux soient plus performants que les modèles formés sur une seule modalité", explique Trevor Darrell, professeur à l'université de Berkeley et cofondateur de Prompt AI, une startup qui travaille sur la combinaison du langage naturel et de la génération et de la manipulation d'images. "Si nous construisons un modèle qui n'utilise que le langage, quelle que soit sa puissance, il n'apprendra que le langage.

La nouvelle technologie de génération vocale de ChatGPT - développée en interne par l'entreprise - ouvre également de nouvelles opportunités pour l'entreprise de céder sa technologie sous licence à d'autres. Spotify, par exemple, prévoit d'utiliser les algorithmes de synthèse vocale d'OpenAI pour piloter une fonction qui traduit les podcasts dans d'autres langues, avec une imitation de la voix originale générée par l'IA. 😉

👉 ( ◍•㉦•◍ ) Michel Campillo consultant chef de projet IT écrit et publie régulièrement depuis 2004 des articles sur son blog dédié aux outils d'entreprise, aux questions du numérique et des nouvelles technologies. Comme tout blogueur il écrit aussi sur des sujets divers, voir le blog pour un aperçu.

👀 Vous pouvez aussi consulter les articles suivants : Méthode de l'Inbox Zéro pour gérer ses emails, Accès au portail Zimbra de Pierre-Bénite, ChatGPT peut désormais vous parler, Le groupe de hackers RansomedVC a piraté Sony, MalasLocker, un cryptobloqueur qui s'attaque aux serveurs Zimbra, La « grève » des modérateurs de Reddit, GFI devient Inetum, Viva Technology 2023, visiter le salon tech de Paris, Quelles sont les limites de stockage pour Google Drive?, Avoir l'IP de quelqu'un avec un lien, Redémarrer un blog après une pause.

TeamsOutre l'email, mobile, téléphone, Linkedin, réseaux sociaux, vous pouvez me retrouver également sur Teams. Installé sur mon poste de travail, je reçois instantanément vos messages. Envoyez-moi votre identifiant par SMS ou email.

Aix en Provence, le 26 septembre 2023

Michel Campillo

Michel Campillo Michel Campillo
Consultant chef de projet IT
06 89 56 58 18  contact par email, voir plus bas

➽ Les articles d'actualité sur les problématiques d'entreprise sont repris chronologiquement sur la page d'accueil du blog. J'aime cet article et vous invite à le lire: « Rejoindre une communauté de NFT ».

Ce billet vous a intéressé? Alors partagez-le en cliquant sur les boutons ci-dessous:

Facebook Twitter Mastodon LinkedIn

Merci de vos partages! 👷🏻‍



🎯 Autres options: Mentions légales, La comptabilisation du compte prorata, Dernière heure: l'actualité du BTP, La grille de salaires BTP en 2024, Délais de paiement, le BTP est exemplaire, La révolution de l'IA dans le BTP, Elections américaines : quels sondages pour Harris et Trump ?, Redémarrer un blog après une pause, Tell Me Lies, le film de Peter Brook, le village des Pennes-Mirabeau, Logiciel de gestion de projet, comment s'y retrouver?, Encore la conversion vidéo.
⛅ L'automne est arrivé, un temps propice au travail non? ☂️

Copyright © 2004-2024 Michel Campillo, tous droits réservés

eXTReMe Tracker