Índice:
- Definição - O que significa reconhecimento óptico de caracteres (OCR)?
- Techopedia explica o reconhecimento óptico de caracteres (OCR)
Definição - O que significa reconhecimento óptico de caracteres (OCR)?
O reconhecimento óptico de caracteres (OCR) refere-se à tecnologia e ao processo de leitura e conversão de caracteres digitados, impressos ou manuscritos em texto codificado por máquina ou algo que o computador possa manipular. É um subconjunto de reconhecimento de imagem e é amplamente utilizado como uma forma de entrada de dados, com a entrada sendo algum tipo de documento ou registro de dados impresso, como extratos bancários, faturas de vendas, passaportes, currículos e cartões de visita. O documento é digitalizado ou uma foto é tirada e cabe ao programa reconhecer os caracteres e fornecer uma saída na forma de um documento de texto.
Techopedia explica o reconhecimento óptico de caracteres (OCR)
O reconhecimento óptico de caracteres é o reconhecimento de caracteres específicos do idioma por um computador, analisando uma imagem que já é legível por computador. Isso geralmente é feito tirando uma imagem do documento primeiro, digitalizando-o ou tirando uma foto digital. Isso cria uma imagem rasterizada composta de dados que o computador entende e, por meio de algoritmos especificamente programados, a maioria dos quais são usados no campo da inteligência artificial, o computador reconhece os padrões na imagem e, nesse caso, os padrões são caracteres. O programa cria ou gera códigos de caracteres, geralmente ASCII, que são equivalentes aos caracteres reconhecidos da imagem de entrada. A maioria dos programas de OCR deve ser treinada para melhorar o reconhecimento de caracteres.