La reconnaissance vocale était horriblement inexacte. Il a seulement travaillé pour une poignée de personnes une poignée de fois. Mais maintenant c'est en fait plutôt bon, grâce aux efforts combinés de Nuance, Microsoft, Apple et Google, qui ont jeté d'innombrables ressources pour l'améliorer.
De toutes ces entreprises, peu ont répondu à l'engagement de reconnaissance vocale de Google, qui en a fait un pilier fondamental de sa stratégie de téléphonie mobile et de services.
L'une des premières incursions de Google fut l'éphémère GOOG-411 (ou Google Voice Local Search). Il a été lancé en 2008 et a permis aux gens de rechercher des numéros de téléphone professionnels en utilisant leur voix. Technologie de reconnaissance vocale a également été une pièce maîtresse d'Android, et avec le lancement de JellyBean Quelles sont les plus grandes améliorations dans Android 4.2 et 4.3? Quelles sont les plus grandes améliorations dans Android 4.2 et 4.3? Si vous êtes coincé sur 4.0 Ice Cream Sandwich ou 4.1 Jelly Bean, devriez-vous améliorer? Lire la suite, il est finalement devenu disponible hors ligne.
Plus tôt cette semaine, Google a enfin introduit la reconnaissance vocale dans Google Docs.
Les utilisateurs peuvent littéralement dicter leurs documents (tout comme je le fais avec cet article) sans avoir besoin d'installer des logiciels ou des plug-ins supplémentaires. C'est un bond en avant significatif pour la suite de bureau en ligne, mais est-ce bon?
Commencer
Avant de commencer à plonger dans ses fonctionnalités, je veux aborder la façon dont vous obtenez Google Voice Typing. Si vous avez un compte Google, vous l'avez déjà. Ouvrez simplement Google Docs et ouvrez un document nouveau ou existant. Ensuite, une fenêtre apparaîtra qui vous demandera si vous souhaitez essayer la dictée vocale. Cliquez sur Essayer .
Ensuite, vous devez autoriser Google Documents à utiliser votre microphone. C'est juste une question de cliquer sur Autoriser dans une fenêtre pop-up.
Ensuite, vous devez sélectionner la langue que vous souhaitez utiliser avec Google Voice Typing. La gamme de langues et de dialectes proposés va de l'anglais et de l'espagnol à l'afrikaans et à l'arabe.
Ensuite, cliquez sur l'icône du microphone et commencez à parler.
À quel point est-ce exact?
L'un des plus grands obstacles à la reconnaissance vocale frappe le courant dominant, c'est que souvent ce n'est pas assez précis . Auparavant, si vous utilisez la reconnaissance vocale, vous devrez passer quelques heures à éditer et à corriger votre texte. Alors, comment est l'offre de Google à cet égard?
Assez favorablement, en fait . Pour l'essentiel, Google Voice Typing a compris ce que je disais, même si j'ai un accent anglais régional ( nous parlerons plus tard des accents ).
J'ai été particulièrement impressionné par la manière dont la reconnaissance vocale de Google traitait le bruit de fond. En écrivant cet article, un Yorkshire Terrier aboyait dans mon salon et ma fenêtre était partiellement ouverte. Je vis sur une route très fréquentée où les voitures passent constamment. Mais malgré cela, Google a pu filtrer cela et se concentrer sur ce que je disais.
Le plus gros problème était Google Voice Typing souvent lutté avec la ponctuation. Je dirais "virgule", "période" et "arrêt complet", et cela interpréterait cela comme voulant écrire "virgule", "point" et "point final". C'était frustrant pour deux raisons.
Premièrement, parce que cela me raillerait, en utilisant d'abord la ponctuation correcte, avant de revenir immédiatement à la version épelée du mot. Il n'y avait aucun moyen d'arrêter cela, et je devrais éditer manuellement le document pour le réparer.
Mais, peut-être pire, je ne pouvais pas empêcher cela. Il n'y a pas de dictionnaire où vous pouvez remplacer l'orthographe. Cela arrive juste, et vous devez y faire face.
Je ne veux pas minimiser à quel point c'est frustrant. C'est vraiment ennuyeux . Mais je suis confiant que cela sera amélioré car de plus en plus de gens utilisent cette fonctionnalité et que Google consacre plus de ressources à l'amélioration de sa reconnaissance vocale.
Outre cet ennui particulier, j'étais assez satisfait de l'exactitude de la reconnaissance vocale de Google.
Comment il gère les accents
J'ai été étonné par le nombre de langues et de dialectes pris en charge par Google Voice Typing. En anglais seulement, il soutient les dialectes néo-zélandais, australiens, indiens, sud-africains, américains et britanniques, pour n'en nommer que quelques-uns. Le problème est qu'il n'y a pas vraiment d'accent américain, un peu comme s'il n'y avait pas d'accent britannique. Au contraire, il existe une gamme d'accents et de dialectes qui diffèrent d'un endroit à l'autre.
C'est un truisme que le Royaume-Uni a un accent pour chaque code postal. L'équipe MakeUseOf dispose d'une gamme d'accents différents parmi le personnel britannique. Christian Cawley parle avec un large accent Middlesbrough. Rob Nightingale, qui est originaire de Southport, a un accent plus nordique. Alors que Mark O'Neil a un twang écossais.
Je vis à Liverpool, j'ai donc un accent Scouse qui dérive légèrement dans l'Atlantique, en grande partie grâce à ma fiancée américaine et le temps que j'ai passé à vivre en Suisse.
Et il est juste de dire que les programmes de reconnaissance vocale ont souvent du mal à comprendre les dialectes anglais régionaux. Quand Siri est sorti, par exemple, son incapacité à comprendre les utilisateurs écossais est devenue une blague courante.
Mais l'offre de Google était exceptionnelle. Croyez-moi quand je dis que vous n'aurez pas à pratiquer avec un accent différent Quelles applications et sites Web aideront à améliorer mon accent en parlant une autre langue? Quelles applications et sites Web aideront à améliorer mon accent en parlant une autre langue? Je veux vraiment que ma prononciation corresponde à celle d'un locuteur natif. Y a-t-il des applications ou des sites Web qui peuvent m'aider? Lire la suite . J'ai parlé à une poignée d'amis qui ont aussi des accents régionaux anglais, et ils ont eu des expériences positives similaires avec elle. Même si j'admets que c'est un petit échantillon complètement non scientifique, c'est certainement prometteur.
Vitesse de dictée vocale
Les programmes de reconnaissance vocale ont traditionnellement été entravés par une incapacité à suivre la vitesse à laquelle l'utilisateur dicte. Certes, j'étais un peu inquiet que l'offre de Google ne soit pas différente, d'autant plus que c'est un service en ligne, plutôt qu'un programme fonctionnant sur mon MacBook Pro gonflé.
Mais j'ai été impressionné. Google a été en mesure de suivre mon rythme de conversation hautement caféiné et n'a pas agi comme un goulot d'étranglement pour ma productivité. C'était le contraire complet de mes expériences avec d'autres outils de dictée vocale.
Je ne sais pas si c'était parce que j'ai un FTTC rapide (fibre au Cabinet) Quelle est la différence entre FTTC et FTTP, et pourquoi devriez-vous vous soucier? Quelle est la différence entre FTTC et FTTP, et pourquoi devriez-vous vous en soucier? Nous avons tous été là à un moment ou un autre. Malade de notre service Internet, à la recherche d'une nouvelle façon de se connecter à Internet, mais confus par les nombreuses options différentes. En savoir plus accueil connexion Internet, ou le fait que Google dispose d'une offre illimitée de serveurs rapides à sa disposition. D'une manière ou d'une autre, j'ai été capable de faire des choses.
Une note sur les microphones
Les microphones intégrés ont tendance à être aléatoire. Dans mon expérience, ils sont soit excellents, comme ils sont sur les ordinateurs portables d'Apple, ou ils ne sont pas. Il y a très rarement un terrain d'entente.
En règle générale, les ordinateurs portables les moins chers Best Laptops Moins de 300 $: Tout ce que vous devez savoir Ordinateurs portables moins de 300 $: Tout ce que vous devez savoir Trouver un bon ordinateur portable pour moins de 300 $ est presque impossible de nos jours chercher. Voici tout ce que vous devez savoir pour faire un achat ... Lire la suite aura les pires microphones internes. C'est juste une de ces caractéristiques qui ont tendance à être négligée par les fabricants d'appareils.
J'ai commencé à dicter cet article en utilisant le microphone interne de mon MacBook Pro. Bien que Google Docs ait souvent dit qu'il avait du mal à m'entendre, cela ne se traduisait pas par une dictée plus lente ou inexacte. Tout a bien fonctionné.
J'ai également essayé Google Voice Typing avec un microphone externe Blue Yeti cher. Ce sont des microphones de qualité podcast qui sont vendus sur Amazon pour plus de 100 $.
Blue Yeti USB Microphone - Argent Bleu Yeti USB Microphone - Argent Acheter maintenant Chez Amazon $ 110.00
Certes, je n'ai pas remarqué de différences en ce qui concerne l'exactitude ou la rapidité de la dictée. Cependant, le plus grand avantage de l'utilisation de ce microphone était que je pouvais insérer une paire d'écouteurs AKG et les utiliser comme un moniteur. Cela m'a permis d'être plus conscient du bruit de fond et de m'auto-ajuster si j'étais trop bruyant ou trop silencieux.
Dernières pensées
La reconnaissance vocale de Google n'est pas parfaite. Mais ce n'est pas une surprise, car la reconnaissance vocale solide est un exploit difficile à réaliser. Je pense que beaucoup de choses pourraient être améliorées.
Cela concerne principalement la manière dont le logiciel traite la ponctuation et la structure des phrases. Dans un monde idéal, Google insère automatiquement la ponctuation en fonction du rythme et de la cadence de votre voix, mais nous sommes loin de cela.
Il est également dommage que ce logiciel n'ait pas encore trouvé sa place dans les autres offres de Google, comme Gmail. Idéalement, j'aimerais pouvoir télécharger Google Voice Typing en tant qu'application et l'utiliser avec d'autres logiciels, comme Pages Pages 5.0 pour Mac et Smart Inspector Panel d'iWork, mais avec moins de fonctionnalités Pages 5.0 pour Mac. Mais moins de fonctionnalités Il existe de nombreux éditeurs de texte légers et faciles à utiliser pour les utilisateurs de Mac, mais pour les projets nécessitant des fonctionnalités de publication assistée par ordinateur, les Pages récemment remaniées d'Apple restent une bonne solution. Lire la suite ou l'éditeur de démarques IA Writer iA Writer pour Mac et iOS: le meilleur traitement de texte que vous n'avez jamais utilisé iA Writer pour Mac et iOS: le meilleur traitement de texte que vous n'avez jamais utilisé Qu'il s'agisse d'un article scolaire ou d'un blog À un moment donné, nous nous trouvons tous dans la situation d'avoir à jeter un tas de caractères dans un fichier texte. Alors que le téléphone portable ... Lire la suite.
Mais ce sont deux ennuis mineurs, Google Voice Typing est aussi bon qu'il obtient. Pour le contraste, j'ai écrit cette section de l'article en utilisant la reconnaissance vocale intégrée de OS X, et il était loin d'être aussi précis, ni aussi rapide.
Si cela ne convainc pas les utilisateurs de passer à Google Drive, je ne sais pas ce que je vais faire.
Maintenant à vous! Avez-vous été tenté par la reconnaissance vocale de Google Drive? Avez-vous essayé, encore? Dites-moi tout à ce sujet dans les commentaires ci-dessous.