dimanche, décembre 7, 2025
  • Connexion
Enerzine.com
  • Accueil
  • Energie
    • Electricité
    • Marché Energie
    • Nucléaire
    • Pétrole
    • Gaz
    • Charbon
  • Renouvelable
    • Biogaz
    • Biomasse
    • Eolien
    • Géothermie
    • Hydro
    • Hydrogène
    • Solaire
  • Technologie
    • Batterie
    • Intelligence artificielle
    • Matériaux
    • Quantique
    • Recherche
    • Robotique
    • Autres
      • Chaleur
      • Communication
      • Fusion
      • Graphène
      • Impression
      • Industrie énergie
      • Industrie technologie
      • Laser
      • Nanotechnologie
      • Optique
  • Environnement
    • Carbone
    • Circulaire
    • Climat
    • Déchets
    • Durable
    • Risques
    • Santé
  • Mobilité
    • Aérien
    • Infrastructure
    • Logistique
    • Maritime
    • Spatial
    • Terrestre
  • Habitat
  • Insolite
  • GuideElectro
    • Sommaire
    • Maison
    • Chauffage
    • Bricolage
    • Jardin
    • Domotique
    • Autres
      • Isolations
      • Eclairage
      • Nomade
      • Loisir
      • Compostage
      • Médical
  • LaboFUN
    • Science
    • Lévitation
    • Globe
Aucun résultat
Voir tous les résultats
  • Accueil
  • Energie
    • Electricité
    • Marché Energie
    • Nucléaire
    • Pétrole
    • Gaz
    • Charbon
  • Renouvelable
    • Biogaz
    • Biomasse
    • Eolien
    • Géothermie
    • Hydro
    • Hydrogène
    • Solaire
  • Technologie
    • Batterie
    • Intelligence artificielle
    • Matériaux
    • Quantique
    • Recherche
    • Robotique
    • Autres
      • Chaleur
      • Communication
      • Fusion
      • Graphène
      • Impression
      • Industrie énergie
      • Industrie technologie
      • Laser
      • Nanotechnologie
      • Optique
  • Environnement
    • Carbone
    • Circulaire
    • Climat
    • Déchets
    • Durable
    • Risques
    • Santé
  • Mobilité
    • Aérien
    • Infrastructure
    • Logistique
    • Maritime
    • Spatial
    • Terrestre
  • Habitat
  • Insolite
  • GuideElectro
    • Sommaire
    • Maison
    • Chauffage
    • Bricolage
    • Jardin
    • Domotique
    • Autres
      • Isolations
      • Eclairage
      • Nomade
      • Loisir
      • Compostage
      • Médical
  • LaboFUN
    • Science
    • Lévitation
    • Globe
Aucun résultat
Voir tous les résultats
Enerzine.com
Aucun résultat
Voir tous les résultats
Une nouvelle approche pour aider les grands modèles de langage à apprendre de la parole

Une nouvelle approche pour aider les grands modèles de langage à apprendre de la parole

par La rédaction
6 décembre 2025
en Intelligence artificielle, Technologie

Les grands modèles de langage (LLM) comme ChatGPT et Gemini ont été conçus à l’origine pour fonctionner uniquement avec du texte. Aujourd’hui, ils ont évolué en systèmes capables de traiter simultanément de nombreux types d’informations (systèmes multimodaux), ainsi que de comprendre et de générer des images, de l’audio, de la parole et de la musique.

La méthode la plus courante pour ajouter la parole aux modèles multimodaux consiste à la convertir en petites unités de base appelées jetons audio, qui fonctionnent pour l’audio un peu comme les caractères pour le texte. Cependant, les jetons audio véhiculent encore beaucoup d’informations, ce qui rend la parole plus difficile à traiter que le texte. Malgré les progrès récents, l’intégration de la parole dans les grands modèles de langage reste un défi majeur.

« La parole est un signal extrêmement riche et complexe« , explique Luca Della Libera, doctorant à l’École d’ingénierie et d’informatique Gina Cody. « Au-delà des mots que nous prononçons, elle transporte des informations sur nos émotions, notre accent, notre identité et de nombreux autres indices.« 

« En raison de cette complexité, les jetons audio standards ont souvent un débit binaire élevé (la quantité d’information contenue dans chaque seconde d’audio). Ils condensent une énorme quantité d’information par seconde d’audio, ce qui rend difficile pour les grands modèles de langage d’apprendre efficacement de la parole.« 

Se concentrer sur le sens de la parole

Della Libera et ses collaborateurs ont développé FocalCodec, une nouvelle méthode de tokenisation audio qui comprime la parole bien plus efficacement que les approches précédentes. Elle préserve à la fois le son et le sens des mots avec un débit binaire ultra-faible.

Plutôt que de s’appuyer sur des étapes de traitement lourdes, le système utilise une méthode simple pour transformer l’audio en unités compactes (quantification sphérique binaire) et une technique qui aide le modèle à se concentrer sur les parties les plus significatives de la parole (modulation focale). Cela rend l’analyse plus rapide et conserve intactes les qualités essentielles de la voix.

Pour tester FocalCodec, l’équipe a mené une étude d’écoute avec 33 participants qui ont comparé différents échantillons audio. Les participants ont souvent jugé la parole reconstruite comme quasi identique aux enregistrements originaux. Cela montre que le système peut réduire considérablement la parole sans la faire paraître robotique ou déformée.

Reconnu lors d’une conférence majeure en IA

Ce travail a été accepté à la Trente-neuvième conférence annuelle sur les systèmes de traitement de l’information neuronale, l’une des conférences les plus sélectives en apprentissage automatique et intelligence artificielle.

Articles à explorer

Face à une pénurie de chirurgiens de plus en plus grave, l'intelligence artificielle pourrait contribuer à combler ce manque en formant les étudiants en médecine.

Une nouvelle IA pourrait former la prochaine génération de chirurgiens

7 décembre 2025
Des chercheurs travaillant sur l'étude de cas

Ruches : un système de surveillance prédit à distance les périodes de floraison

5 décembre 2025

« Ce travail est particulièrement important, car il introduit une approche novatrice qui peut être très précieuse pour construire des LLM multimodaux modernes« , souligne Mirco Ravanelli, professeur adjoint et superviseur de Della Libera. « En rendant la parole plus légère et plus facile à intégrer, nous nous rapprochons de systèmes d’IA qui comprennent le son avec la même confiance qu’ils apportent au texte.« 

L’article comprend également les contributions de Francesco Paissan, chercheur invité au Mila et étudiant de premier cycle à l’Université de Trente, et de Cem Subakan, professeur adjoint affilié à Concordia.

Partager l'article avec :
  WhatsApp   LinkedIn   Facebook   Telegram   Email
Tags: compressionintelligence artificiellemodeleparole
Article précédent

Les rayons X rendent la cartographie cérébrale haute résolution accessible

Article suivant

Les grillons grignotent les microplastiques, surtout s’ils ont une grande bouche

La rédaction

La rédaction

Enerzine.com propose une couverture approfondie des innovations technologiques et scientifiques, avec un accent particulier sur : - Les énergies renouvelables et le stockage énergétique - Les avancées en matière de mobilité et transport - Les découvertes scientifiques environnementales - Les innovations technologiques - Les solutions pour l'habitat Les articles sont rédigés avec un souci du détail technique tout en restant accessibles, couvrant aussi bien l'actualité immédiate que des analyses. La ligne éditoriale se concentre particulièrement sur les innovations et les avancées technologiques qui façonnent notre futur énergétique et environnemental, avec une attention particulière portée aux solutions durables et aux développements scientifiques majeurs.

A lire également

Les chercheurs du KIT souhaitent améliorer la fiabilité des ordinateurs quantiques. Ils étudient actuellement comment les mesures interfèrent avec les qubits.
Quantique

Comment rendre les ordinateurs quantiques encore plus fiables

il y a 17 minutes
Face à une pénurie de chirurgiens de plus en plus grave, l'intelligence artificielle pourrait contribuer à combler ce manque en formant les étudiants en médecine.
Intelligence artificielle

Une nouvelle IA pourrait former la prochaine génération de chirurgiens

il y a 6 heures
Les rayons X rendent la cartographie cérébrale haute résolution accessible
Recherche

Les rayons X rendent la cartographie cérébrale haute résolution accessible

il y a 1 jour
Des chercheurs travaillant sur l'étude de cas
Intelligence artificielle

Ruches : un système de surveillance prédit à distance les périodes de floraison

il y a 2 jours
Des ingénieurs rendent l'IA plus rapide et réduisent sa consommation d'énergie
Intelligence artificielle

Des ingénieurs rendent l’IA plus rapide et réduisent sa consommation d’énergie

il y a 2 jours
Un chercheur français trouve une loi universelle pour prédire la fragmentation des objets
Recherche

Un français trouve une loi universelle pour prédire la fragmentation des objets

il y a 2 jours
Plus d'articles
Article suivant
Les grillons domestiques tropicaux ont consommé davantage d'aliments contaminés par le plastique au fil du temps, même en présence d'aliments non contaminés.

Les grillons grignotent les microplastiques, surtout s'ils ont une grande bouche

Près du trou noir (au centre), un flux d'accrétion forme un disque thermique dense et mince intégré dans un champ magnétique.

Des simulations révolutionnaires révèlent comment les trous noirs brillent intensément

Face à une pénurie de chirurgiens de plus en plus grave, l'intelligence artificielle pourrait contribuer à combler ce manque en formant les étudiants en médecine.

Une nouvelle IA pourrait former la prochaine génération de chirurgiens

Laisser un commentaire Annuler la réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bibliothèque photos préférée : Depositphotos.com
depositphotos
Enerzine est rémunéré pour les achats éligibles à la plateforme AMAZON

Articles récents

Les chercheurs du KIT souhaitent améliorer la fiabilité des ordinateurs quantiques. Ils étudient actuellement comment les mesures interfèrent avec les qubits.

Comment rendre les ordinateurs quantiques encore plus fiables

7 décembre 2025
Face à une pénurie de chirurgiens de plus en plus grave, l'intelligence artificielle pourrait contribuer à combler ce manque en formant les étudiants en médecine.

Une nouvelle IA pourrait former la prochaine génération de chirurgiens

7 décembre 2025
  • A propos
  • Newsletter
  • Publicité – Digital advertising
  • Mentions légales
  • Confidentialité
  • Contact

© 2025 Enerzine.com

Bienvenue !

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Aucun résultat
Voir tous les résultats
  • Accueil
  • Energie
  • Renouvelable
  • Technologie
  • Environnement
  • Mobilité
  • Habitat
  • Insolite
  • Guide
  • Labo

© 2025 Enerzine.com