Charentes 

Le Crédit Agricole 17 donne la parole àses clients


La reconnaissance vocale permet, au moins dans le principe, d’authentifier le client et comprendre les demandes qu’il vocalise. Plus confortables que les services à base de DTMF qui ne sont plus appréciés, ces technologies ne sont pas encore très utilisées dans les banques, encore un peu frileuses surtout en ce qui concerne l’authentification.
Depuis fin 2003, le Crédit Agricole propose à ses client un tel service vocal, hébergé chez Prosodie et accessible par le numéro 0821 010 011. Il permet à l’appelant de préciser non seulement le nom de l’agence à laquelle il est rattaché mais également de choisir parmi une liste de service préétablie. « Notre portail vocal offre 5 branches de services accessibles à partir de mots promus » indique Françoise Arnaud responsable de l’assistance au pilotage de la banque à distance, « Mais pour des raisons de stratégie commerciale nous proposons également des mots cachés. Par exemple ‘Assistance’ ou ‘Bourse’, qui sont communiqués uniquement sur le web ». Ces services de la banque verte débouchent toujours vers un contact humain en agence ou au centre d’appels, et sans que le client n’ait été formellement identifié. La banque dispose pourtant d’un serveur d’authentification par code PIN, mais il a été décidé lors de la réorganisation de 2003/2004 de ne pas l’utiliser pour les opérations nécessitant l’intervention d’un conseiller. « Nous avons décidé dans ce cas de lever les contraintes. C’est à l’opérateur de sécuriser l’échange en posant des questions auxquelles seul le titulaire du compte peut répondre » précise F. Arnaud qui ajoute « Le canal téléphonique est largement plébiscité par les clients qui le préfèrent au DTMF et nous le promouvons pour l’accès aux services à fortes valeur ajoutée. Pour les opérations nécessitant une authentification forte, un groupe travaille sur des solutions d’empreinte vocale. Une décision sera prise au niveau national, après des tests auprès de panels ».

2009, année d’investissements
L’exemple du Crédit Agricole n’est pas unique et de nombreuses banques réfléchissent à la mise en place de serveur d’authentification en mode vocal, comme l’indique une étude récente du Gartner. Sur 92% des établissements interrogés (50 établissements US) 54% considèrent que leurs procédures d’authentification en centres d’appels ne sont pas assez fortes. Et 26% d’entre eux, soit 11 banques, vont mettre en œuvre des solutions à base d’identification vocale… même si c’est surtout la sécurisation des transactions via Internet qui va drainer les budgets.
L’espagnol Bankinter vient juste d’installer un tel système en interne. « La reconnaissance vocale nous permettrait d’augmenter le sentiment de proximité pour nos clients » indique Javier Roldan, Senior Manager, Technological Innovation, qui ajoute « Mais nous attendons que la technologie soit plus mature avant de la déployer à l’extérieur de l’entreprise ». De fait, la solution Agnitio mise en place pour régénérer des mots de passe oubliés ne concerne pour l’instant que 800 employés sur 4500. « Nous demandons aux collaborateurs de s’enregistrer dans le système et de prononcer des ensembles de chiffres. Cela ne prend que 4 minutes. Ensuite, en cas de perte du mot de leur passe, ils répètent 2 séries de numéros pour être reconnus et quel leur accès soit rétablit » détaille J. Roldan qui ajoute « Nous traitons environ 200 demandes par mois, depuis avril, et l’investissement sera amorti sur une année ».

L’exemple irlandais
L’exemple le plus abouti concerne le projet Buywayz initié par la National Farmer Association dès 2002. Interconnecté avec l’Irish Bank, il permet aux adhérents de s’identifier vocalement depuis un téléphone (fixe ou mobile) et de signer, toujours vocalement, des ordres de transfert de fonds aux bénéfices de leurs fournisseurs. Les avantages sont clairement exprimés par Pat Smith, directeur du projet, lorsqu’il indique « Alors que nos membres étaient débordés par la paperasse et la bureaucratie, ils peuvent maintenant s’approvisionner et régler leurs achats rapidement ». Le système actuel, auxquels ne sont associées que les entreprises irlandaises du secteur, est tellement satisfaisant qu’il devrait être étendu vers d’autres secteurs d’activité et outre-mer. Coté budgets, les chiffres annoncés sont compris entre quelques dizaines de milliers d’euros pour un système traitant peu de mots ou peu d’utilisateurs, et jusqu’à des centaines de milliers pour les installations les plus complexes ou les plus puissantes. L’exemple du Crédit Agricole se situe au milieu, entre 25 et 35 K€ soit dans la même tranche de coût que Buywayz. Mais il ressort des entretiens que nous avons eus avec les constructeurs que les premiers à se décider pourront largement négocier les tarifs s’ils acceptent d’être cités dans les actions de communications. Une sorte de prime réservée aux early adopters.

La reconnaissance vocale se divise en 2 grands groupes d’application : la reconnaissance du locuteur et la reconnaissance du sens contenu dans son énoncé. Chacune des ces opérations pouvant se faire soit par comparaison avec un référentiel personnalisé restreint, soit par recherche du plus grand nombre de similitudes cohérentes entre le motif prononcé et un dictionnaire plus ou moins étendu. Dans les deux cas, les technologies et techniques misent en œuvre sont assez proches. Très schématiquement, elles consistent à transformer, à l’aide d’un microphone et d’électronique de conversion, la voix en une suite d’informations numériques puis à découper cette suite en petits morceaux très brefs de l’ordre de 10 à 50 millisecondes. Le système applique à ces petits échantillons différents calculs afin de déterminer des points remarquables qui seront ensuite comparés avec ceux des dictionnaires de référence.
On aura compris qu’une bonne partie succès de tout processus de reconnaissance passe par la constitution et la qualité dudit dictionnaire. Différentes approches sont possibles dont les 2 principaux paramètres sont que les termes (sons) mémorisés dans le référentiel sont nombreux ou pas mais également qu’ils sont associés et personnels à un utilisateur ou génériques et partagés pour une communauté. Pour poser une échelle de complexité, et donc de coût, on pourra résumer en disant qu’il est plus facile d’identifier très peu de sons prononcés par une personne qui s’est déjà soumise à un apprentissage afin que le système mémorise les particularités de sa phonation ; tandis que la reconnaissance d’un nombre indéterminé de mots prononcés par des locuteurs inconnus est aujourd’hui presque encore de la science fiction.