samedi, décembre 6, 2025
  • Connexion
Enerzine.com
  • Accueil
  • Energie
    • Electricité
    • Marché Energie
    • Nucléaire
    • Pétrole
    • Gaz
    • Charbon
  • Renouvelable
    • Biogaz
    • Biomasse
    • Eolien
    • Géothermie
    • Hydro
    • Hydrogène
    • Solaire
  • Technologie
    • Batterie
    • Intelligence artificielle
    • Matériaux
    • Quantique
    • Recherche
    • Robotique
    • Autres
      • Chaleur
      • Communication
      • Fusion
      • Graphène
      • Impression
      • Industrie énergie
      • Industrie technologie
      • Laser
      • Nanotechnologie
      • Optique
  • Environnement
    • Carbone
    • Circulaire
    • Climat
    • Déchets
    • Durable
    • Risques
    • Santé
  • Mobilité
    • Aérien
    • Infrastructure
    • Logistique
    • Maritime
    • Spatial
    • Terrestre
  • Habitat
  • Insolite
  • GuideElectro
    • Sommaire
    • Maison
    • Chauffage
    • Bricolage
    • Jardin
    • Domotique
    • Autres
      • Isolations
      • Eclairage
      • Nomade
      • Loisir
      • Compostage
      • Médical
  • LaboFUN
    • Science
    • Lévitation
    • Globe
Aucun résultat
Voir tous les résultats
  • Accueil
  • Energie
    • Electricité
    • Marché Energie
    • Nucléaire
    • Pétrole
    • Gaz
    • Charbon
  • Renouvelable
    • Biogaz
    • Biomasse
    • Eolien
    • Géothermie
    • Hydro
    • Hydrogène
    • Solaire
  • Technologie
    • Batterie
    • Intelligence artificielle
    • Matériaux
    • Quantique
    • Recherche
    • Robotique
    • Autres
      • Chaleur
      • Communication
      • Fusion
      • Graphène
      • Impression
      • Industrie énergie
      • Industrie technologie
      • Laser
      • Nanotechnologie
      • Optique
  • Environnement
    • Carbone
    • Circulaire
    • Climat
    • Déchets
    • Durable
    • Risques
    • Santé
  • Mobilité
    • Aérien
    • Infrastructure
    • Logistique
    • Maritime
    • Spatial
    • Terrestre
  • Habitat
  • Insolite
  • GuideElectro
    • Sommaire
    • Maison
    • Chauffage
    • Bricolage
    • Jardin
    • Domotique
    • Autres
      • Isolations
      • Eclairage
      • Nomade
      • Loisir
      • Compostage
      • Médical
  • LaboFUN
    • Science
    • Lévitation
    • Globe
Aucun résultat
Voir tous les résultats
Enerzine.com
Aucun résultat
Voir tous les résultats
Une nouvelle approche pour aider les grands modèles de langage à apprendre de la parole

Une nouvelle approche pour aider les grands modèles de langage à apprendre de la parole

par La rédaction
6 décembre 2025
en Intelligence artificielle, Technologie

Les grands modèles de langage (LLM) comme ChatGPT et Gemini ont été conçus à l’origine pour fonctionner uniquement avec du texte. Aujourd’hui, ils ont évolué en systèmes capables de traiter simultanément de nombreux types d’informations (systèmes multimodaux), ainsi que de comprendre et de générer des images, de l’audio, de la parole et de la musique.

La méthode la plus courante pour ajouter la parole aux modèles multimodaux consiste à la convertir en petites unités de base appelées jetons audio, qui fonctionnent pour l’audio un peu comme les caractères pour le texte. Cependant, les jetons audio véhiculent encore beaucoup d’informations, ce qui rend la parole plus difficile à traiter que le texte. Malgré les progrès récents, l’intégration de la parole dans les grands modèles de langage reste un défi majeur.

« La parole est un signal extrêmement riche et complexe« , explique Luca Della Libera, doctorant à l’École d’ingénierie et d’informatique Gina Cody. « Au-delà des mots que nous prononçons, elle transporte des informations sur nos émotions, notre accent, notre identité et de nombreux autres indices.« 

« En raison de cette complexité, les jetons audio standards ont souvent un débit binaire élevé (la quantité d’information contenue dans chaque seconde d’audio). Ils condensent une énorme quantité d’information par seconde d’audio, ce qui rend difficile pour les grands modèles de langage d’apprendre efficacement de la parole.« 

Se concentrer sur le sens de la parole

Della Libera et ses collaborateurs ont développé FocalCodec, une nouvelle méthode de tokenisation audio qui comprime la parole bien plus efficacement que les approches précédentes. Elle préserve à la fois le son et le sens des mots avec un débit binaire ultra-faible.

Plutôt que de s’appuyer sur des étapes de traitement lourdes, le système utilise une méthode simple pour transformer l’audio en unités compactes (quantification sphérique binaire) et une technique qui aide le modèle à se concentrer sur les parties les plus significatives de la parole (modulation focale). Cela rend l’analyse plus rapide et conserve intactes les qualités essentielles de la voix.

Pour tester FocalCodec, l’équipe a mené une étude d’écoute avec 33 participants qui ont comparé différents échantillons audio. Les participants ont souvent jugé la parole reconstruite comme quasi identique aux enregistrements originaux. Cela montre que le système peut réduire considérablement la parole sans la faire paraître robotique ou déformée.

Reconnu lors d’une conférence majeure en IA

Ce travail a été accepté à la Trente-neuvième conférence annuelle sur les systèmes de traitement de l’information neuronale, l’une des conférences les plus sélectives en apprentissage automatique et intelligence artificielle.

Articles à explorer

Des chercheurs travaillant sur l'étude de cas

Ruches : un système de surveillance prédit à distance les périodes de floraison

5 décembre 2025
Des ingénieurs rendent l'IA plus rapide et réduisent sa consommation d'énergie

Des ingénieurs rendent l’IA plus rapide et réduisent sa consommation d’énergie

5 décembre 2025

« Ce travail est particulièrement important, car il introduit une approche novatrice qui peut être très précieuse pour construire des LLM multimodaux modernes« , souligne Mirco Ravanelli, professeur adjoint et superviseur de Della Libera. « En rendant la parole plus légère et plus facile à intégrer, nous nous rapprochons de systèmes d’IA qui comprennent le son avec la même confiance qu’ils apportent au texte.« 

L’article comprend également les contributions de Francesco Paissan, chercheur invité au Mila et étudiant de premier cycle à l’Université de Trente, et de Cem Subakan, professeur adjoint affilié à Concordia.

Partager l'article avec :
  WhatsApp   LinkedIn   Facebook   Telegram   Email
Tags: compressionintelligence artificiellemodeleparole
Article précédent

Les rayons X rendent la cartographie cérébrale haute résolution accessible

La rédaction

La rédaction

Enerzine.com propose une couverture approfondie des innovations technologiques et scientifiques, avec un accent particulier sur : - Les énergies renouvelables et le stockage énergétique - Les avancées en matière de mobilité et transport - Les découvertes scientifiques environnementales - Les innovations technologiques - Les solutions pour l'habitat Les articles sont rédigés avec un souci du détail technique tout en restant accessibles, couvrant aussi bien l'actualité immédiate que des analyses. La ligne éditoriale se concentre particulièrement sur les innovations et les avancées technologiques qui façonnent notre futur énergétique et environnemental, avec une attention particulière portée aux solutions durables et aux développements scientifiques majeurs.

A lire également

Les rayons X rendent la cartographie cérébrale haute résolution accessible
Recherche

Les rayons X rendent la cartographie cérébrale haute résolution accessible

il y a 6 heures
Des chercheurs travaillant sur l'étude de cas
Intelligence artificielle

Ruches : un système de surveillance prédit à distance les périodes de floraison

il y a 22 heures
Des ingénieurs rendent l'IA plus rapide et réduisent sa consommation d'énergie
Intelligence artificielle

Des ingénieurs rendent l’IA plus rapide et réduisent sa consommation d’énergie

il y a 23 heures
Un chercheur français trouve une loi universelle pour prédire la fragmentation des objets
Recherche

Un français trouve une loi universelle pour prédire la fragmentation des objets

il y a 1 jour
Quand Elon Musk envisage des robots auto-réplicants pour transformer l'économie mondiale
Robotique

Quand Elon Musk envisage des robots auto-réplicants pour transformer l’économie mondiale

il y a 1 jour
Researchers have developed artificial tendons for muscle-powered robots. They attached the rubber band-like tendons (blu
Robotique

Des tendons artificiels dopent les robots musclés

il y a 2 jours
Plus d'articles

Laisser un commentaire Annuler la réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bibliothèque photos préférée : Depositphotos.com
depositphotos
Enerzine est rémunéré pour les achats éligibles à la plateforme AMAZON

Articles récents

Une nouvelle approche pour aider les grands modèles de langage à apprendre de la parole

Une nouvelle approche pour aider les grands modèles de langage à apprendre de la parole

6 décembre 2025
Les rayons X rendent la cartographie cérébrale haute résolution accessible

Les rayons X rendent la cartographie cérébrale haute résolution accessible

6 décembre 2025
  • A propos
  • Newsletter
  • Publicité – Digital advertising
  • Mentions légales
  • Confidentialité
  • Contact

© 2025 Enerzine.com

Bienvenue !

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Aucun résultat
Voir tous les résultats
  • Accueil
  • Energie
  • Renouvelable
  • Technologie
  • Environnement
  • Mobilité
  • Habitat
  • Insolite
  • Guide
  • Labo

© 2025 Enerzine.com