23/06/2010

Google lança serviço que transforma imagem em texto



Recurso lançado junto ao Google Docs reconhece caracteres presentes em imagens e arquivos de PDF por meio da tecnologia OCR.
Nova funcionalidade disponibilizada pelo Google permite o reconhecimento de caracteres em imagens e arquivos em formato PDF. A tecnologia usada é conhecida como OCR, sigla que pode ser traduzida como reconhecimento óptico de caracteres. A ferramenta está atualmente disponível dentro do serviço de códigos do Google.

Para executar o reconhecimento é preciso efetuar o upload do arquivo PDF ou da imagem com o texto que se deseja recolher as informações. Depois disso, o próprio sistema faz seu trabalho automaticamente e cria um novo documento em texto no Google Docs com as palavras contidas nos arquivos que foram enviados.

As palavras que não foram identificadas pelo serviço são destacadas com marcação amarela para facilitar a correção. Alguns caracteres, no entanto, ainda escapam da ferramenta de destaque de erros.

Ao utilizar o novo serviço alguns detalhes podem ser perdidos, como formatação de texto e tabelas.

Experimente em: http://googlecodesamples.com/docs/php/ocr.php

Nenhum comentário:

Postar um comentário