Skip to main content

Home/ HyperVoix/ Group items tagged reconnaissance vocale

Rss Feed Group items tagged

Cécile Christodoulou

#4 - Un assistant vocal à la maison : une bonne idée ? (Joseph Dureau, CTO Sn... - 1 views

  •  
    Passionnant décryptage du CTO de Snips... depuis Siri à aujourd'hui... décryptage de la technologie autour des assistants vocaux, cas d'usages, fantasmes... Interface vocale, la technologie existe depuis 30 ans (médecins, call center...), "interface" remplacée par "assistant" (promesse de l'IA) + promesse d'un dialogue naturel... Limites : la voix ne sert pas à tout, besoin d'un écran quand on a une recherche plus précise à faire... ex: est-ce à l'usager de s'adapter à l'interface ? = > formulation de l'intention... Briques techniques d'un assistant vocal : - banc de micros (détection de la source, triangulation pour mieux capter la source de son) - wakeword pour réveiller l'assistant (machine learning = écoute le signal en permanence mais entre en écoute active à partir du "wakeword", la reconnaissance vocale est alors lancée qui a pour objectif de transcrire ce que l'utilisateur a dit) - NLU : natural language understanding https://en.wikipedia.org/wiki/Natural-language_understanding prend le texte en entrée ("la météo demain à Bordeaux ?") et sort un objet structuré : intention : météo, quand : demain soir, où : bordeaux même fonctionnement qu'un chatbot - Logique d'action (comment réagir à la demande de l'utilisateur ?) :ce sont les développeurs qui travaillent cette dernière partie + synthèse vocale pour donner la réponse Snips travaille les étapes "wakeword" + "NLU" logique d'action (cf. modèle app store) avec 16000 développeurs + synthèse vocale : sous-traitance secteurs : bureau, habitat, véhicule, industrie Privacy / snips : le son ne sort pas du "salon" - sortie prévue fin 2019 petit réseau de neurones pour le "wakeword" tourne en embarqué pour toutes les solutions (amazon, google...)... mais il y a un taux d'erreur (de une fois par heure à une fois par jour)... donc
Cécile Christodoulou

Reconnaissance vocale: comment Google compense son manque de données - 0 views

  •  
    "Google Assistant a beau se doter de l'une des technologies de reconnaissance vocal les plus performantes et abouties au monde, il peine à répondre aux personnes qui connaissent des difficultés au niveau de leur élocution. Conscient de l'enjeu, le géant technologique a donc décidé de mettre en orbite un projet répondant au nom d'« Euphoria » avec une ambition : celle de pallier cet enjeu et rendre sa technologie accessible au plus grand nombre."
Cécile Christodoulou

En Chine, la vie sous l'oeil inquisiteur des caméras - 0 views

  •  
    "Dans l'empire du Milieu, les caméras de reconnaissance faciale sont partout. L'intelligence artificielle permet ainsi de retrouver des criminels en fuite ou de payer ses achats en un clin d'oeil. Mais aussi d'étouffer toute dissidence." "Le gouvernement chinois s'évertue aussi à promouvoir cette technologie, qu'il perçoit comme l'une des innovations clefs qui vont lui permettre de réduire sa dépendance face aux Etats-Unis. En 2017, il a nommé cinq champions nationaux de l'intelligence artificielle : Baidu pour les voitures autonomes, Alibaba pour les villes intelligentes, Tencent pour les diagnostics médicaux, iFlytek pour la reconnaissance vocale et SenseTime pour la reconnaissance faciale."[...] "Les autorités de Pékin ont annoncé que les caméras qu'elles s'apprêtent à installer à l'entrée de tous les logements sociaux de la ville auront notamment pour but de surveiller les allées et venues des résidents. Ceux qui ne sortent pas de chez eux durant plusieurs jours ou qui invitent un étranger chez eux déclencheront une alerte. De même, l'assureur Ping An se sert de la reconnaissance faciale pour repérer les employés qui sèchent une réunion et une école de Hangzhou a installé des caméras à l'avant des salles de classe pour repérer les élèves qui ne suivent pas en cours." "Au xviiie siècle, le philosophe utilitariste Jeremy Bentham imagine une architecture carcérale, le panoptique, dans lequel les geôliers, installés dans une tour centrale, sont en mesure de surveiller tous les faits et gestes des prisonniers sans être visibles eux-mêmes (photo : la prison de Crest Hill, en Illinois, en 1928). Les détenus, qui ne peuvent savoir s'ils sont observés ou non, se trouvent contraints à une permanente docilité. Pour Bentham, on peut étendre le principe aux usines, aux écoles ou aux hôpitaux. Michel Foucault, deux cents ans plus tard, considère dans Surveiller et punir que « cette visibilité organisée entièrement autour d'un
Cécile Christodoulou

CES 2019, la maison intelligente : le robot qui plie les vêtements, des drone... - 1 views

  •  
    > HyperIntrusion ? "Un interrupteur Alexa et un miroir connecté chez Legrand Le groupe français Legrand est venu au CES avec deux nouveautés pour les particuliers. Tout d'abord, un interrupteur intégrant l'assistant vocal Alexa d'Amazon avec lequel les utilisateurs pourront commander des systèmes domotiques (thermostat, éclairage, volets roulants…) mais aussi lancer l'écoute de musique sur une enceinte, consulter la météo ou les actualités. L'interrupteur sera disponible à partir du mois de juin à 150 euros. Par ailleurs, Legrand s'est associé à CareOS pour développer un miroir connecté à partir duquel on peut, avec des gestes ou la voix, gérer l'éclairage et son intensité, contrôler la température de la pièce grâce à un thermostat connecté et accéder à une panoplie d'applications dédiées à la beauté et au bien-être, basées sur la reconnaissance faciale."
Cécile Christodoulou

Comment Orange imagine l'assistant vocal du futur - 0 views

  •  
    "Demain, lorsque vous arriverez de bon matin dans la salle de bain, votre assistant vocal comprendra immédiatement que vous êtes particulièrement fatigué grâce à une caméra dissimulée dans le miroir et un algorithme qui analysera votre expression. Alors, il adoucira le ton de sa voix et ne vous proposera pas forcément de lancer la radio comme d'habitude. Ce type de scénario est actuellement testé par Orange à Rennes via une plate-forme de recherche baptisée Home'in."
Cécile Christodoulou

Le Pixel 4 deviendra un véritable assistant vocal qui reconnait votre voix - 0 views

  •  
    "Google utilisera la reconnaissance vocale pour permettre de déverrouiller l'assistant uniquement lorsqu'il s'agira d'une requête provenant du propriétaire du smartphone." "Par ailleurs, cette nouvelle fonctionnalité viendra une nouvelle fois montrer que Google Assistant est perpétuellement activé en arrière-plan sur le smartphone, et que son micro ne se désactive pas. "
Cécile Christodoulou

Google I/O 2019 : tout ce qu'il faut retenir (Pixel 3a, Nest Hub Max, etc.) - 0 views

  •  
    "Selon Google, la nouvelle version de Google Assistant pourra répondre 10 fois plus vite à une commande vocale. Il sera même possible d'interagir avec l'assistant personnel tout en naviguant entre plusieurs applications, sans dire à chaque fois "OK Google". L'algorithme pourra plus facilement faire la différence entre l'action et le message que vous voulez dicter. [...] Les autres appareils Android munis de Google Assistant pourront, eux, attendre l'arrivée d'un Mode Conduite ainsi que des Références Personnelles. Cette dernière fonctionnalité permet à l'algorithme de mieux comprendre les requêtes du type "Que se passe là où habite maman ?". À noter que ces fonctionnalités seront prise en charge directement sur l'appareil et non les serveurs de Google." "Google utilise désormais sa marque Nest pour ses appareils domotiques. [...] Google a mis en place des mesures pour garantir votre vie privée. Selon les intervenants du Google I/O, une LED indique quand la caméra fonctionne. Aucun flux vidéo ne sera par ailleurs mis en ligne ou enregistré sans le consentement de l'utilisateur. Comme les autres produits connectés à Google Assistant, celui-ci proposera Voice Match : l'assistant vocal distingue les différentes personnes de votre maison selon leur voix. Avec la caméra embarquée, Google Assistant pourra également vous différencier selon vos visages. Google appelle cette nouvelle fonction Face Match. " "Pour améliorer l'accessibilité de ses produits, Google lance donc le projet Euphonia. Il vise à faciliter l'interaction des personnes sourdes, muettes ou souffrant d'un trouble du langage avec leurs smartphones ou enceintes connectées."
Veronique Routin

Assistants vocaux : la France tente de faire entendre sa voix face aux Gafam ... - 0 views

  •  Le B2B (de professionnels à professionnels, NDLR), c’est un boulevard« , estime auprès de l’AFP Yann Lechelle, ancien directeur des opérations de Snips,
  •  Il y a un vrai marché pour les sociétés proposant des briques de technologie de reconnaissance vocale, cela peut intéresser des acteurs qui ont besoin d’une relation client et ne veulent pas la confier aux géants américains«
  • Or les startups françaises font face à un obstacle. « Nous n’avons pas suffisamment de données pour entraîner des modèles« , explique à l’AFP Karel Bourgois, fondateur de Voxist, qui propose un répondeur intelligent, capable de personnaliser l’annonce d’accueil et de retranscrire les messages vocaux. Pour pallier ce manque, Karel Bourgois et d’autres entrepreneurs ont récemment fondé Le Voice Lab qui compte constituer un corpus vocal de 100 000 heures, comprenant des voix de personnes de tout âge et aux accents différents. À terme, cette association rassemblant une trentaine de startups et de laboratoires a vocation à devenir une place de marché où un industriel pourra trouver les différentes « briques » pour monter son assistant vocal en français.
  •  
    Face aux Gafam, que peut la France sur le marché des Assistants vocaux? Des briques technologiques mais limité par la question de l'entraînement des modèles.
Cécile Christodoulou

Nouveau monde. Une intelligence artificielle pour répondre au téléphone dans ... - 0 views

  •  
    Interview du cofondateur d'x-brain - Grégory Renard "Sa société, xBrain, a mis au point un système conversationnel à reconnaissance vocale capable de répondre aux appels des clients des banques ou des assurances." - interactions homme-machine - machine learning - revisiter la relation client 24h/24h - IA éthique : besoin de régulation
Cécile Christodoulou

[Avis d'expert] Deux minutes pour comprendre l'avènement des assistants vocau... - 0 views

  •  
    "Nous estimons aujourd'hui n'être qu'à 2% du potentiel maximal de l'utilisation de la voix. Une chose est sûre, la reconnaissance vocale intégrée à nos différents appareils est en passe de devenir le standard de l'interaction Homme-Machine, apportant par la même occasion de nombreux usages et fonctionnalités."
Cécile Christodoulou

Un guide virtuel pour les aveugles - Sciences et Avenir - 1 views

  •  
    "Un laboratoire du Caltech aux États-Unis développe un assistant vocal mêlant reconnaissance des objets et spatialisation du son pour assister les non-voyants dans leurs déplacements. "
Cécile Christodoulou

Comment puis-je vous aider à découvrir la ville ? - ZDNet - 1 views

  •  
    "Après la première vague des applications mobiles qui offrent des services pour mieux interagir avec sa ville (mobilité, loisirs...), les années qui arrivent vont voir se développer dans les villes des interfaces conversationnelles beaucoup plus intelligentes. Les simples chatbots qui émergent sur les smartphones pour personnaliser et contextualiser les services de la ville n'en sont qu'un début. Ce sont bien des interfaces vocales sophistiquées que l'on pourra trouver au coin de la rue. Et pour ce qui est des pays où filmer sur la voie publique n'est pas interdit, ce sera également la reconnaissance visuelle."
Cécile Christodoulou

La stratégie d'innovation d'Orange patine - 1 views

  •  
    "Mais où est Djingo ? L'enceinte connectée d'Orange, codéveloppée avec l'opérateur allemand Deutsche Telekom, n'en finit plus de se faire attendre. " "Les équipes chargées de l'élaboration de l'enceinte se heurtent notamment à des difficultés techniques sur la mise en œuvre du système de reconnaissance vocale, développé en plusieurs langues et qui doit permettre aux futurs utilisateurs de piloter leur télévision (changement de chaînes, recherche de programmes...), d'écouter de la musique, de passer des appels ou de gérer les objets connectés de leur maison par la voix. « La période d'apprentissage, longue et complexe, de l'intelligence artificielle implique que nous prenions le temps nécessaire pour assurer un service de haute qualité », explique Orange."
Cécile Christodoulou

Cisco enhances Webex Assistant with AI meeting, call controls - 0 views

  •  
    "Cisco has added new features to its AI voice assistant for Webex that will make it easier for users to start meetings and place calls. The vendor also revealed plans this week at the Enterprise Connect conference to update Webex Meetings with facial recognition and other AI features in the coming months."
Cécile Christodoulou

Google AI Blog: SpecAugment: A New Data Augmentation Method for Automatic Speech Recogn... - 0 views

  •  
    "Automatic Speech Recognition (ASR) struggles in the absence of an extensive volume of training data. We present SpecAugment, a new approach to augmenting audio data that treats it as a visual problem rather than an audio one."
Cécile Christodoulou

[#CESAsia19ech] L'Echangeur au coeur des innovations chinoises ! - Echangeur by BNP Par... - 1 views

  •  
    récap du CES Asia 12'08 Baidu smart speaker avec voix + caméra + écran + paiement via reconnaissance faciale + détection émotions + télé-médecine
Cécile Christodoulou

From Your Mouth to Your Screen, Transcribing Takes the Next Step - 0 views

  •  
    "Improvements in software technology have made automatic speech transcription possible. By capturing vast quantities of human speech, neural network programs can be trained to recognize spoken language with accuracy rates that in the best circumstances approach 95 percent. Coupled with the plunging cost of storing data, it is now possible to use human language in ways that were unthinkable just a few years ago." "Mr. Liang, a Stanford-educated electrical engineer who was a member of the original team that designed Google Maps, said that data compression had made it possible to capture the speech conversation of a person's entire life in just two terabytes of information - compact enough to fit on storage devices that cost less than $50."
Cécile Christodoulou

How Amazon's facial recognition ambition could stunt Alexa's development - 0 views

  •  
    "[...] fears of a dystopian AI future are also swirling around Amazon's facial recognition software system Rekognition, which the company reportedly attempted to sell to U.S Immigration and Customs Enforcement (ICE) and which has been tested by law enforcement in Washington and Oregon. While the public is currently focused on the use of Rekognition by law enforcement and government agencies, there is another issue to consider. If the technology becomes a standard part of the smart display experience, people may balk at the idea of installing Amazon's technology in their homes."
1 - 19 of 19
Showing 20 items per page