samedi, mars 7, 2026
  • Connexion
Enerzine.com
  • Accueil
  • Energie
    • Electricité
    • Marché Energie
    • Nucléaire
    • Pétrole
    • Gaz
    • Charbon
  • Renouvelable
    • Biogaz
    • Biomasse
    • Eolien
    • Géothermie
    • Hydro
    • Hydrogène
    • Solaire
  • Technologie
    • Batterie
    • Intelligence artificielle
    • Matériaux
    • Quantique
    • Recherche
    • Robotique
    • Autres
      • Chaleur
      • Communication
      • Fusion
      • Graphène
      • Impression
      • Industrie énergie
      • Industrie technologie
      • Laser
      • Nanotechnologie
      • Optique
  • Environnement
    • Carbone
    • Circulaire
    • Climat
    • Déchets
    • Durable
    • Risques
    • Santé
  • Mobilité
    • Aérien
    • Infrastructure
    • Logistique
    • Maritime
    • Spatial
    • Terrestre
  • Habitat
  • Insolite
  • GuideElectro
    • Sommaire
    • Maison
    • Chauffage
    • Bricolage
    • Jardin
    • Domotique
    • Autres
      • Isolations
      • Eclairage
      • Nomade
      • Loisir
      • Compostage
      • Médical
  • LaboFUN
    • Science
    • Lévitation
    • Globe
Aucun résultat
Voir tous les résultats
  • Accueil
  • Energie
    • Electricité
    • Marché Energie
    • Nucléaire
    • Pétrole
    • Gaz
    • Charbon
  • Renouvelable
    • Biogaz
    • Biomasse
    • Eolien
    • Géothermie
    • Hydro
    • Hydrogène
    • Solaire
  • Technologie
    • Batterie
    • Intelligence artificielle
    • Matériaux
    • Quantique
    • Recherche
    • Robotique
    • Autres
      • Chaleur
      • Communication
      • Fusion
      • Graphène
      • Impression
      • Industrie énergie
      • Industrie technologie
      • Laser
      • Nanotechnologie
      • Optique
  • Environnement
    • Carbone
    • Circulaire
    • Climat
    • Déchets
    • Durable
    • Risques
    • Santé
  • Mobilité
    • Aérien
    • Infrastructure
    • Logistique
    • Maritime
    • Spatial
    • Terrestre
  • Habitat
  • Insolite
  • GuideElectro
    • Sommaire
    • Maison
    • Chauffage
    • Bricolage
    • Jardin
    • Domotique
    • Autres
      • Isolations
      • Eclairage
      • Nomade
      • Loisir
      • Compostage
      • Médical
  • LaboFUN
    • Science
    • Lévitation
    • Globe
Aucun résultat
Voir tous les résultats
Enerzine.com
Aucun résultat
Voir tous les résultats
Une nouvelle approche pour aider les grands modèles de langage à apprendre de la parole

Une nouvelle approche pour aider les grands modèles de langage à apprendre de la parole

par La rédaction
6 décembre 2025
en Intelligence artificielle, Technologie

Les grands modèles de langage (LLM) comme ChatGPT et Gemini ont été conçus à l’origine pour fonctionner uniquement avec du texte. Aujourd’hui, ils ont évolué en systèmes capables de traiter simultanément de nombreux types d’informations (systèmes multimodaux), ainsi que de comprendre et de générer des images, de l’audio, de la parole et de la musique.

La méthode la plus courante pour ajouter la parole aux modèles multimodaux consiste à la convertir en petites unités de base appelées jetons audio, qui fonctionnent pour l’audio un peu comme les caractères pour le texte. Cependant, les jetons audio véhiculent encore beaucoup d’informations, ce qui rend la parole plus difficile à traiter que le texte. Malgré les progrès récents, l’intégration de la parole dans les grands modèles de langage reste un défi majeur.

« La parole est un signal extrêmement riche et complexe« , explique Luca Della Libera, doctorant à l’École d’ingénierie et d’informatique Gina Cody. « Au-delà des mots que nous prononçons, elle transporte des informations sur nos émotions, notre accent, notre identité et de nombreux autres indices.« 

« En raison de cette complexité, les jetons audio standards ont souvent un débit binaire élevé (la quantité d’information contenue dans chaque seconde d’audio). Ils condensent une énorme quantité d’information par seconde d’audio, ce qui rend difficile pour les grands modèles de langage d’apprendre efficacement de la parole.« 

Se concentrer sur le sens de la parole

Della Libera et ses collaborateurs ont développé FocalCodec, une nouvelle méthode de tokenisation audio qui comprime la parole bien plus efficacement que les approches précédentes. Elle préserve à la fois le son et le sens des mots avec un débit binaire ultra-faible.

Plutôt que de s’appuyer sur des étapes de traitement lourdes, le système utilise une méthode simple pour transformer l’audio en unités compactes (quantification sphérique binaire) et une technique qui aide le modèle à se concentrer sur les parties les plus significatives de la parole (modulation focale). Cela rend l’analyse plus rapide et conserve intactes les qualités essentielles de la voix.

Pour tester FocalCodec, l’équipe a mené une étude d’écoute avec 33 participants qui ont comparé différents échantillons audio. Les participants ont souvent jugé la parole reconstruite comme quasi identique aux enregistrements originaux. Cela montre que le système peut réduire considérablement la parole sans la faire paraître robotique ou déformée.

Articles à explorer

PhD researcher Robert Komljenovic holding the flexible nylon‑film energy‑harvesting device developed at RMIT University.

Un dispositif en nylon « incroyablement résistant » génère de l’électricité sous des tonnes de pression

23 février 2026
Pangenomique compressive: une avancée pour l'analyse génétique à grande échelle

Pangenomique compressive: une avancée pour l’analyse génétique à grande échelle

27 janvier 2026

Reconnu lors d’une conférence majeure en IA

Ce travail a été accepté à la Trente-neuvième conférence annuelle sur les systèmes de traitement de l’information neuronale, l’une des conférences les plus sélectives en apprentissage automatique et intelligence artificielle.

« Ce travail est particulièrement important, car il introduit une approche novatrice qui peut être très précieuse pour construire des LLM multimodaux modernes« , souligne Mirco Ravanelli, professeur adjoint et superviseur de Della Libera. « En rendant la parole plus légère et plus facile à intégrer, nous nous rapprochons de systèmes d’IA qui comprennent le son avec la même confiance qu’ils apportent au texte.« 

L’article comprend également les contributions de Francesco Paissan, chercheur invité au Mila et étudiant de premier cycle à l’Université de Trente, et de Cem Subakan, professeur adjoint affilié à Concordia.

Partager l'article avec :
  WhatsApp   LinkedIn   Facebook   Telegram   Email
Tags: compressionintelligence artificiellemodeleparole
Article précédent

Les rayons X rendent la cartographie cérébrale haute résolution accessible

Article suivant

Les grillons grignotent les microplastiques, surtout s’ils ont une grande bouche

La rédaction

La rédaction

Enerzine.com propose une couverture approfondie des innovations technologiques et scientifiques, avec un accent particulier sur : - Les énergies renouvelables et le stockage énergétique - Les avancées en matière de mobilité et transport - Les découvertes scientifiques environnementales - Les innovations technologiques - Les solutions pour l'habitat Les articles sont rédigés avec un souci du détail technique tout en restant accessibles, couvrant aussi bien l'actualité immédiate que des analyses. La ligne éditoriale se concentre particulièrement sur les innovations et les avancées technologiques qui façonnent notre futur énergétique et environnemental, avec une attention particulière portée aux solutions durables et aux développements scientifiques majeurs.

A lire également

Le retour en grâce des pompes à chaleur en Europe
Chaleur

Le retour en grâce des pompes à chaleur en Europe

il y a 16 heures
Les centres de données IA deviennent des acteurs flexibles du réseau électrique
Industrie technologie

Les centres de données IA deviennent des acteurs flexibles du réseau électrique

il y a 17 heures
Le Dr Ivan Kojouharov (à droite) a co-découvert 143 isomères nucléaires, soit plus que quiconque. Les statistiques ont été compilées par le professeur Michael Thoennessen (à gauche). (Crédit : © L. Weitz, GSI/FAIR)
Recherche

Record mondial au GSI/FAIR, Darmstadt en tête pour la découverte de nouveaux isomères nucléaires

il y a 23 heures
Les champs fluctuants dans le nitrure de bore hexagonal affectent la densité superfluide dans un supraconducteur situé à proximité immédiate. Crédit : Ella Maru Studio
Nanotechnologie

Des vibrations synchronisées suffisent à modifier les matériaux

il y a 2 jours
Le monde des électrons, où les électrons (nains) explorent leur bande d'énergie (plage), peut être manipulé à l'aide de champs externes ou de lumière dans des isolants fortement corrélés. Cette capacité permet de créer de nouveaux dispositifs électroniques dotés de fonctionnalités avancées. (Crédit : MANA, NIMS et Science Graphics. Co., Ltd.)
Matériaux

Principes théoriques de la manipulation de la structure de bandes dans les isolants fortement corrélés

il y a 2 jours
Le Groupe BMW déploie pour la première fois des robots humanoïdes en production en Allemagne
Robotique

Le Groupe BMW déploie pour la première fois des robots humanoïdes en production en Allemagne

il y a 2 jours
Selon une nouvelle étude de l'université du Michigan, les améliorations apportées à la technologie des batteries des véhicules électriques compenseront leur dégradation prévue liée à la chaleur due au changement climatique. Crédit : HKUST
Batterie

La technologie améliorée des batteries de VE surpassera la dégradation due au changement climatique

il y a 3 jours
Des scientifiques créent des catalyseurs durables et moins coûteux à partir d'aluminium
Matériaux

Des scientifiques créent des catalyseurs durables et moins coûteux à partir d’aluminium

il y a 3 jours
Plus d'articles
Article suivant
Les grillons domestiques tropicaux ont consommé davantage d'aliments contaminés par le plastique au fil du temps, même en présence d'aliments non contaminés.

Les grillons grignotent les microplastiques, surtout s'ils ont une grande bouche

Près du trou noir (au centre), un flux d'accrétion forme un disque thermique dense et mince intégré dans un champ magnétique.

Des simulations révolutionnaires révèlent comment les trous noirs brillent intensément

Face à une pénurie de chirurgiens de plus en plus grave, l'intelligence artificielle pourrait contribuer à combler ce manque en formant les étudiants en médecine.

Une nouvelle IA pourrait former la prochaine génération de chirurgiens

Laisser un commentaire Annuler la réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Inscription newsletter

Tendance

Le retour en grâce des pompes à chaleur en Europe
Chaleur

Le retour en grâce des pompes à chaleur en Europe

par La rédaction
7 mars 2026
0

Les ventes de pompes à chaleur résidentielles ont rebondi en 2025 dans seize pays européens, avec 2,63...

Les centres de données IA deviennent des acteurs flexibles du réseau électrique

Les centres de données IA deviennent des acteurs flexibles du réseau électrique

7 mars 2026
Le Dr Ivan Kojouharov (à droite) a co-découvert 143 isomères nucléaires, soit plus que quiconque. Les statistiques ont été compilées par le professeur Michael Thoennessen (à gauche). (Crédit : © L. Weitz, GSI/FAIR)

Record mondial au GSI/FAIR, Darmstadt en tête pour la découverte de nouveaux isomères nucléaires

7 mars 2026
Hausse soudaine des carburants : la flambée des prix à la pompe inquiète les automobilistes

Hausse soudaine des carburants : la flambée des prix à la pompe inquiète les automobilistes

6 mars 2026
Journée des droits des femmes : un 8 mars placé sous le signe de l'action et de la justice

Journée de la femme 2026 : un 8 mars placé sous le signe du droit et de la justice

6 mars 2026

Points forts

Hausse soudaine des carburants : la flambée des prix à la pompe inquiète les automobilistes

Journée de la femme 2026 : un 8 mars placé sous le signe du droit et de la justice

Microsoft officialise « Project Helix », le nom de code de sa future console Xbox hybride

Des vibrations synchronisées suffisent à modifier les matériaux

Un nouveau système de traitement de l’eau élimine l’azote et le phosphore des eaux de drainage agricole

Des chercheurs développent une nouvelle stratégie pour améliorer les cellules solaires à pérovskite inversées

Bibliothèque photos préférée : Depositphotos.com
depositphotos
Enerzine est rémunéré pour les achats éligibles à la plateforme AMAZON

Articles récents

Le retour en grâce des pompes à chaleur en Europe

Le retour en grâce des pompes à chaleur en Europe

7 mars 2026
Les centres de données IA deviennent des acteurs flexibles du réseau électrique

Les centres de données IA deviennent des acteurs flexibles du réseau électrique

7 mars 2026
  • A propos
  • Newsletter
  • Publicité – Digital advertising
  • Mentions légales
  • Confidentialité
  • Contact

© 2025 Enerzine.com

Bienvenue !

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Aucun résultat
Voir tous les résultats
  • Accueil
  • Energie
  • Renouvelable
  • Technologie
  • Environnement
  • Mobilité
  • Habitat
  • Insolite
  • Guide
  • Labo

© 2025 Enerzine.com