"Ce produit 100 % normand est certes en pourparlers avec de grosses firmes comme Carrefour et Leclerc, mais ambitionne « de travailler sur du très local : les Amap (agriculture de proximité), les circuits courts, le boucher du coin », détaille Jérôme Caudrelier (Casus Belli), en charge de l'expérimentation du projet.
Mais la grande différence avec les mastodontes américains, c'est « l'aide au maintien à domicile en supplément des services d'aide traditionnels à domicile ». "
Interview du cofondateur d'x-brain - Grégory Renard
"Sa société, xBrain, a mis au point un système conversationnel à reconnaissance vocale capable de répondre aux appels des clients des banques ou des assurances."
- interactions homme-machine
- machine learning
- revisiter la relation client 24h/24h
- IA éthique : besoin de régulation
"Unless there is a strong enough economic argument, don't expect big companies to rush into producing Welsh, Gaelic or Cornish speech systems. Even tech giant Samsung hasn't yet managed to produce a UK-English speaking version of their Bixby assistant (international English speakers need to speak to it in fake American accents to get it to work). "
"Research on brain-like learning algorithms may just hold the key here. This is technology that can continually learn during use, just like humans learn to speak a new language. It is unlike most current AI systems that are trained in the lab, before being let loose in the wild - apart from a few exceptions some, like Microsoft's Tay, notable for their spectacular failures. Future systems will be able to gradually acquire skills in a second language just by having users gradually introduce more and more of that language in their daily interactions. Rather than funding research into Welsh speech AI, the Welsh government may well do better by backing research into this new kind of adaptive learning technology."
"The perfect environments for a voice assistant are settings where users want to perform a variety of tasks while keeping their attention on their surroundings, like augmented and virtual reality applications."
"En 2018, 29% des internautes interrogés dans cette enquête ont utilisé un assistant vocal intelligent sur ordinateur, smartphone ou enceinte connectée au cours des 12 derniers mois.
Apparues récemment sur le marché, les enceintes connectées intelligentes sont utilisées par seulement 5% des internautes interrogés. Seuls 40 % des utilisateurs de ces dispositifs ont déjà paramétré leur assistant vocal au cours des 12 derniers mois, contre par exemple 69% des utilisateurs de smartphone qui ont réglé au moins un paramètre de confidentialité de leurs smartphones. Dans le détail, on constate que 23% ont vérifié les paramètres de confidentialité, 19% ont supprimé l'historique. Ils sont encore moins à avoir désactivé le micro (15%) ou à avoir débranché leur enceinte (6%) lorsque ceux-ci ne sont pas utilisés. La CNIL avait publié en décembre 2017 un petit guide sur les bonnes pratiques à adopter pour les possesseurs d'assistants vocaux et d'enceintes connectés. Ces chiffres, sur un marché encore balbutiant, tendent à démontrer que les premiers utilisateurs sont encore peu sensibles à la protection de leur intimité, ou n'ont pas encore pris conscience des risques posés par ces interfaces."
"Some companies are already working to develop more individualized software. Voiceitt, a startup, is currently beta-testing a speech-recognition app that translates nonstandard speech to standard speech in real time using a closed dictionary. "
"Le marché compte quatre acteurs principaux : Apple (Siri), Google (Google Assistant) ), Microsoft (Cortana) et Amazon (Alexa). D'autres initiatives existent et de nombreux assistants se développent avec Facebook (M), Orange et Deustche Telekom (Djingo) ou encore Samsung (Bixby). Le marché pourrait représenter plus de 10 milliards de dollars dès 2020." "Ce nouveau type d'interaction entre l'utilisateur et son équipement terminal apparaît comme plus pratique dans de nombreux cas : en voiture, en déplacement, ou lorsque l'utilisateur est occupé par une autre activité. Néanmoins, l'usage de la voix en public , au travail ou dans les transports en commun semble toujours délicat pour une grande partie des utilisateurs qui ne souhaitent pas voir leurs recherches sur internet exposées en public. Ainsi les assistants, pour convaincre l'ensemble des utilisateurs, pourraient évoluer ou se diversifier plus largement vers des interfaces écrites de type chatbots." "Des assistants vocaux sont aujourd'hui développés sur tous types de supports (ordinateur, smartphones, télévision, véhicule connecté, etc.). La particularité des enceintes connectées est qu'elles reposent uniquement sur de telles interfaces, et ne peuvent donc, par nature, donner accès aux contenus d'internet prenant une forme visible (textes, images, vidéos, jeux vidéo) que sur des écrans déportés (télévision connectée, écran d'ordinateur, smartphone). Lorsqu'elles sont contraintes à une restitution orale, les enceintes connectées ne fournissent souvent qu'un seul résultat pour une requête, choisi par l'algorithme de classement. Si les développeurs d'algorithmes ont tout intérêt à ce que les résultats retournés par leurs outils soient pertinents, il reste que la nécessité d'une réponse unique constitue une restriction structurelle à l'ouverture d'internet." [...]
Passionnant décryptage du CTO de Snips...
depuis Siri à aujourd'hui... décryptage de la technologie autour des assistants vocaux, cas d'usages, fantasmes... Interface vocale, la technologie existe depuis 30 ans (médecins, call center...), "interface" remplacée par "assistant" (promesse de l'IA) + promesse d'un dialogue naturel...
Limites :
la voix ne sert pas à tout, besoin d'un écran quand on a une recherche plus précise à faire...
ex: est-ce à l'usager de s'adapter à l'interface ? = > formulation de l'intention...
Briques techniques d'un assistant vocal :
- banc de micros (détection de la source, triangulation pour mieux capter la source de son)
- wakeword pour réveiller l'assistant (machine learning = écoute le signal en permanence mais entre en écoute active à partir du "wakeword", la reconnaissance vocale est alors lancée qui a pour objectif de transcrire ce que l'utilisateur a dit)
- NLU : natural language understanding https://en.wikipedia.org/wiki/Natural-language_understanding
prend le texte en entrée ("la météo demain à Bordeaux ?") et sort un objet structuré : intention : météo, quand : demain soir, où : bordeaux
même fonctionnement qu'un chatbot
- Logique d'action (comment réagir à la demande de l'utilisateur ?) :ce sont les développeurs qui travaillent cette dernière partie + synthèse vocale pour donner la réponse
Snips travaille les étapes "wakeword" + "NLU"
logique d'action (cf. modèle app store) avec 16000 développeurs + synthèse vocale : sous-traitance
secteurs : bureau, habitat, véhicule, industrie
Privacy / snips : le son ne sort pas du "salon" - sortie prévue fin 2019
petit réseau de neurones pour le "wakeword" tourne en embarqué pour toutes les solutions (amazon, google...)... mais il y a un taux d'erreur (de une fois par heure à une fois par jour)... donc
"[...]If you don't happen to work in the tech sector, you probably can't think about all the untapped potential in your Amazon Echo or Google Home without experiencing some misgivings. By now, most of us have grasped the dangers of allowing our most private information to be harvested, stored, and sold. We know how facial-recognition technologies have allowed authoritarian governments to spy on their own citizens; how companies disseminate and monetize our browsing habits, whereabouts, social-media interactions; how hackers can break into our home-security systems and nanny cams and steal their data or reprogram them for nefarious ends. Virtual assistants and ever smarter homes able to understand our physical and emotional states will open up new frontiers for mischief making. Despite the optimism of most of the engineers I've talked with, I must admit that I now keep the microphone on my iPhone turned off and my smart speakers unplugged when I don't plan to use them for a while.[...]"