4 outils OCR en ligne gratuits mis à l'essai ultime

Avec les progrès de la technologie OCR, la conversion du texte et des images de votre document PDF numérisé dans les formats de texte éditables est plus facile. Nous avons testé quelques outils de reconnaissance optique de caractères en ligne gratuits, ce qui vous évite d'avoir à le faire.

Avec les progrès de la technologie OCR, la conversion du texte et des images de votre document PDF numérisé dans les formats de texte éditables est plus facile.  Nous avons testé quelques outils de reconnaissance optique de caractères en ligne gratuits, ce qui vous évite d'avoir à le faire.
Publicité

Si vous souhaitez convertir un texte imprimé en texte numérique que vous pouvez copier, coller, modifier et rechercher, vous devez utiliser des scanners à reconnaissance optique de caractères (OCR).

Lorsque vous choisissez de numériser ou de prendre une photo d'un document, celle-ci sera enregistrée dans un format tel que JPEG ou PDF. Le logiciel OCR peut alors reconnaître les lettres et les nombres dans ces documents, et les convertir en PDF interrogeable. 4 Méthodes pour créer et éditer des fichiers PDF pour Free 4 Méthodes pour créer et éditer des fichiers PDF gratuitement Sur tous les types de fichiers courants trouvés dans notre monde informatique, PDF est probablement l'un des plus restrictifs, tout en étant disponible pour tout le monde à utiliser (principalement pour lire) .... Lire la suite, ou dans un fichier que vous pouvez modifier dans des programmes comme Microsoft Word.

Le problème est, certains scanners OCR fonctionnent beaucoup mieux que d'autres, avec le meilleur étant assez lourd sur le portefeuille.

Omnipage18 par exemple, coûte 150 $, mais est particulièrement bon pour reconnaître différentes langues. Adobe Acrobat Pro DC coûte 400 $, mais sa précision est incroyable. ABBYY FineReader coûte 150 $, mais c'est fantastique de convertir des documents tels que des magazines et des brochures en texte consultable. Nous testerons l'offre en ligne d'ABBYY plus loin dans cet article.

Cependant, si vous recherchez des alternatives gratuites que vous pouvez télécharger et utiliser sur Windows ou OS X, vous devriez essayer ces outils OCR. Les 5 meilleurs outils OCR pour extraire le texte des images Les 5 meilleurs outils OCR pour extraire le texte des images Lorsque vous Avez-vous des tonnes de papier, comment obtenez-vous tout ce texte imprimé converti en quelque chose qu'un programme numérique sera en mesure de reconnaître et d'indexer? Gardez un bon logiciel OCR à proximité. Lire la suite . Mais si vous préférez utiliser un outil de reconnaissance optique de caractères en ligne gratuit, continuez à lire, car nous en avons essayé quelques-uns, avec les résultats ci-dessous.

Le test

Il semble que la plupart des gens utilisent maintenant leur téléphone intelligent pour numériser et gérer vos reçus, économiser de l'espace, du papier et du temps Scanner et gérer vos reçus, économiser de l'espace, du papier et du temps Les reçus papier sont facilement perdus et difficiles à trouver. plus. Heureusement, passer au numérique résout ces deux problèmes. En savoir plus, j'ai décidé d'utiliser l'application Scannable d'Evernote (gratuite sur iOS et Android). J'ai scanné la première page de Climbing Mount Improbable de Richard Dawkin, pour voir quels résultats nous pourrions obtenir avec un formatage très basique. J'ai également scanné une page de The 4-Hour Chef de Tim Ferriss pour essayer les scanners avec un formatage légèrement plus compliqué. J'ai enregistré chacun de ces fichiers au format PDF.

Tester les OCR en ligne

Ces documents ont ensuite été exécutés à travers certains des outils OCR en ligne soi-disant meilleurs pour voir à quel point ils se sont bien débrouillés.

OCR en ligne gratuit

Heureusement, il n'y a aucune inscription requise pour utiliser OCR en ligne gratuit. Et j'ai été doublement impressionné quand j'ai vu leur revendication de garder le formatage et la mise en page de mon document.

OCR en ligne gratuit

Le site prétend pouvoir prendre en charge PDF, GIF, BMP, JPEG, TIFF et PNG en entrée. Les sorties peuvent être DOC, un document texte PDF, RTF et TXT. Malheureusement, je n'ai pas pu savoir s'ils avaient une limite de taille de fichier.

Document de base au format PDF
Converti absolument parfaitement. Il n'y a pas beaucoup plus à dire! Nous partons pour un très bon départ.

Document de base à DOC
Les mots réels semblent avoir converti parfaitement, en dehors du "ount" de "Mount Rushmore" en quelque sorte aller AWOL. Le formatage est une histoire différente, cependant. Beaucoup de virgules ont été remplacées par des traits de soulignement, et des espaces aléatoires ont été insérés à des points tout au long du document. Quand vous verrez plus tard comment le logiciel de qualité s'est comporté dans ce test, ce n'est pas un mauvais effort du tout .

Document complexe au format PDF
La conversion du document a pris un énorme 120 secondes! Une fois terminé, tout le texte avait été converti avec une précision d'environ 95%, bien que le texte dans la boîte séparée en haut à droite de la page ne pouvait pas être recherché. Quelques autres caractères dans le PDF étaient également incorrects.

Document complexe au DOC
Cette fois-ci, la conversion ne prenait que 10 secondes, le texte étant à nouveau converti avec une précision d'environ 95%. Il y avait quelques problèmes d'espacement étranges, et le logiciel a eu du mal à convertir la police en haut à droite du document, et a manqué quelques caractères ici et là.

Verdict
Si vous voulez convertir des documents simplement formatés en PDF, c'est un outil fantastique. En ce qui concerne la conversion au DOC, les résultats n'ont rien d'étonnant.

i2OCR

i2OCR fait des revendications impressionnantes. L'outil reconnaît plus de 60 langues, peut gérer les mises en page multi-colonnes (en supprimant le formatage), n'a pas de limite de taille de fichier, peut convertir les fichiers téléchargés et les URL. Et vous n'avez pas besoin de vous inscrire pour utiliser cet outil non plus.

Le service fonctionne en extrayant simplement le texte de votre image, puis en produisant un texte non formaté. Vous pouvez corriger rapidement les erreurs dans la vue côte à côte, avant de copier le texte dans d'autres programmes ou de télécharger au format DOC, PDF ou HTML.

Remarque: lorsque j'ai essayé de télécharger mes documents PDF, ceux-ci ont été rejetés par i2OCR, j'ai donc dû les convertir en JPEG (en prenant une capture d'écran d'eux, puis en téléchargeant les fichiers).

Document de base au texte brut Capture d'écran 2016-02-11 à 12.30.28
En raison de la façon dont cet outil fonctionne, tout le formatage est perdu, bien que la conversion de l'image au texte soit presque parfaite. Il y a eu quelques petites erreurs telles que l'espacement des paragraphes, et certaines virgules ont été remplacées par des points, mais ce sont de petits défauts.

Document complexe au texte brut Capture d'écran 2016-02-11 à 12.39.48
La majorité du texte a été convertie sans trop d'erreurs, à part le titre et la recette en haut à droite, ce qui était illisible pour cet outil. La façon dont les colonnes ont été converties en texte brut était loin d'être idéale. Si vous voulez que cette conversion soit réalisable, il faudra beaucoup de temps pour réorganiser les lignes en phrases cohérentes.

Verdict
Pour les documents de base, i2OCR fonctionne très bien. La possibilité de modifier le texte avant de le télécharger est également très agréable. Cependant, pour les documents plus complexes, la conversion est encore assez précise, mais la façon dont le texte est publié ne vous facilitera pas la vie.

OCR en ligne

La ROC en ligne prend actuellement en charge 46 langues différentes et peut convertir des fichiers PDF, JPG, BMP, TIFF et GIF au format Word, Excel ou texte brut. Le site affirme que "les documents convertis ressemblent exactement à l'original - tables, colonnes et graphiques".

La version que vous pouvez utiliser sans vous enregistrer vous permet de convertir jusqu'à 15 images par heure (limite de 5 Mo). Si vous vous inscrivez pour un compte, vous pouvez acheter plus de pages en plus de cette limite, tout en étant capable de convertir des documents multi-pages et des archives ZIP.

Résultats OCR en ligne

Document de base à DOC
Le document de base converti parfaitement sans compter le chiffre romain je ne suis pas ramassé. Comme le site l'avait promis, la mise en forme était exactement ce qu'elle était dans le livre. Bravo à cet outil.

Document complexe au DOC
Après avoir été déçu par les outils OCR précédents dans la conversion du document complexe, j'ai été massivement impressionné par Online OCR. La disposition était presque parfaite, comme vous pouvez le voir ci-dessus. Encore une fois, la recette n'a pas été très bien reprise, mais toutes les autres erreurs mineures ont été négligeables.

Verdict

Résultats absolument fantastiques de Online OCR. Le seul inconvénient que je vois est qu'il n'y a aucun moyen de télécharger les documents convertis en PDF, car les formats de sortie mentionnés comprennent DOCX, XLSX et TXT seulement.

ABBYY FineReader Online (essai de 10 pages)

Comme mentionné précédemment, ABBYY est l'un des leaders du marché des logiciels de reconnaissance optique de caractères, avec un coût d'environ 150 dollars pour leur programme téléchargeable complet. Cependant, ils offrent un essai gratuit de 10 pages pour leur outil en ligne (inscription requise). Pour un abonnement de 5 $, leur outil en ligne vous permettra de convertir 200 pages par mois.

ABBYY FineReader en ligne

Les fichiers acceptés peuvent atteindre 100 Mo, dans l'un des formats suivants: PDF, JPG, JPEG, TIFF, TIFF, PCX, DCX, BMP et PNG. ABBYY reconnaît également près de 200 langues. Les sorties sont particulièrement impressionnantes, avec un choix entre DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 et EPUB.

Vous pouvez même essayer quelques fonctionnalités BETA pendant votre essai. Le premier est la possibilité de traduire votre document dans une autre langue. L'autre consiste à exporter votre document converti vers votre compte de stockage en cloud, que ce soit Dropbox, Google Drive, Evernote, Microsoft OneDrive ou Box.

Document de base à DOCX
Les résultats globaux étaient bons, mais pas étonnants considérant ceci est un produit de la meilleure qualité. Plusieurs virgules et points ont été échangés, plusieurs guillemets ont été remplacés par un astérisque, quelques lettres majuscules manquaient et un mot (littéraliste) a été mal orthographié.

Document complexe à DOCX
Une fois converti, il y avait très peu de failles dans le texte dans le document (à l'exception de l'OCR aux prises avec la police de cette recette à nouveau!), Mais le formatage laissait beaucoup à désirer.

Résultat ABBYY

Les trois colonnes ont en quelque sorte pris deux pages, la colonne centrale n'apparaissant que sur la deuxième page. Si vous vouliez réellement faire quelque chose avec ce document converti, vous finiriez par arracher vos cheveux.

Document de base au format PDF
Lors de l'examen du PDF converti, je n'ai pas trouvé de faute du tout. Peut-être avons-nous trouvé où excellait ABBYY. Des résultats fantastiques.

Document complexe au format PDF
Encore une fois, je n'ai trouvé aucune erreur dans ce fichier converti. ABBYY sait évidemment comment convertir en PDF exceptionnellement bien.

Verdict
Si vous êtes content de payer quelques dollars, la conversion au format PDF semble fonctionner très bien avec ce service, et la possibilité de synchroniser les fichiers convertis sur votre stockage dans le cloud est particulièrement utile si vous numérisez un grand nombre de documents. Cependant, comme pour les autres options, ABBYY n'a toujours pas trouvé comment convertir parfaitement les documents en DOC pour une édition facile.

Le résultat final

Si, comme la plupart des gens, vous cherchez simplement à scanner quelques articles de magazines et certaines factures du ménage, vous n'aurez pas besoin d'éditer ces documents. Par conséquent, la conversion directe en PDF vous conviendra, car vous serez toujours en mesure de rechercher ces documents. Pour cela, OCR en ligne gratuit était définitivement le meilleur outil gratuit que nous avons testé. Cela étant dit, si vous êtes prêt à payer 5 $ par mois pour presque parfait, FineReader Online d'ABBYY était légèrement plus précis.

Quand il s'agit de convertir des documents en DOC, nous n'avons pas réussi à trouver une solution parfaite, mais de loin les meilleurs résultats sont venus de Online OCR. La conversion n'était pas parfaite, mais l'intégrité de la mise en forme était largement conservée et les erreurs négligeables. Lorsque nous comparons ces résultats à l'offre «premium» d'ABBYY, vous ne pouvez qu'être impressionné massivement.

Nous n'avons pas inclus les fonctionnalités OCR de Google Drive dans cet article. Un petit peu pour la simplicité de Google, mais plus encore pour le fait que nous voulions tester quelques autres services OCR gratuits en ligne.

À vous: Quels autres outils de ROC en ligne recommanderiez-vous à nos lecteurs? Et qu'avez-vous essayé de ne plus jamais utiliser?

In this article