domingo, 8 de junio de 2008

EL OCR


Si pensamos un poco en el proceso de escaneado descripto, nos daremos cuenta de que al escanear un texto no se escanean letras, palabras y frases, sino sencillamente los puntos que las forman, una especie de fotografía del texto. Evidentemente, esto puede ser útil para archivar textos, pero sería deseable que pudiéramos coger todas esas referencias tan interesantes pero tan pesadas e incorporarlas al procesador de texto no como una imagen, sino como texto editable.El OCR es un programa que lee esas imágenes digitales y busca conjuntos de puntos que se asemejen a letras, a caracteres. Dependiendo de la complejidad de dicho programa entenderá más o menos tipos de letra, llegando en algunos casos a interpretar la escritura manual, mantener el formato original (columnas, fotos entre el texto...) o a aplicar reglas gramaticales para aumentar la exactitud del proceso de reconocimiento.Para que el programa pueda realizar estas tareas con una cierta fiabilidad, sin confundir "t" con "1", por ejemplo, la imagen debe cumplir unas ciertas características. Fundamentalmente debe tener una gran resolución, unos 300 ppp para textos con tipos de letra claros o 600 ppp si se trata de tipos de letra pequeños u originales de poca calidad como periódicos. Por contra, podemos ahorrar en el aspecto del color: casi siempre bastará con blanco y negro (1 bit de color), o a lo sumo una escala de 256 grises (8 bits). Por este motivo algunos escáners de rodillo (muy apropiados para este tipo de tareas) carecen de soporte para color.
El proceso de captación de una imagen resulta casi idéntico para cualquier escáner: se ilumina la imagen con un foco de
luz, se conduce mediante espejos la luz reflejada hacia un dispositivo denominado CCD que transforma la luz en señales eléctricas, se transforma dichas señales eléctricas a formato digital en un DAC (conversor analógico-digital) y se transmite el caudal de bits resultante al ordenador.
Cómo digitalizar textos Clikeando sobre el icono llamado OmniPage (u otro que caracterice a la marca y modelo des escáner que tengas) que se encuentra en el escritorio, se accede al programa de digitalización de textos.Una vez dentro del programa, hay que buscar la opción obtener imagen dentro del menú
archivo o bien clikear sobre el icono del scanner que aparece en la parte superior izquierda de la pantalla. Aparecerá entonces una pequeña pantalla con varias opciones. Clikeando sobre digitalizar el scanner empezará a trabajar.Las hojas se pueden poner de dos formas diferentes en el scanner. - Hay que colocar la hoja boca abajo en la parte superior derecha del scanner y después bajar la tapa. - Se puede utilizar el alimentador automático. Una vez que el programa ha obtenido la información de la hoja de texto, hay que pasarle el reconocedor de textos OCR. Para ello hay que buscar un icono con dichos caracteres OCR en la pantalla o bien en el menú archivo OCR, esta página. Si el reconocimiento ha sido correcto, el programa mostrará un nuevo menú para agregar más páginas o parar el digitalizado.Clikeando sobre parar digitalizado, aparece un menú en el que hay que indicarle al programa el nombre con el que queremos guardar el programa así como el formato.

2 comentarios:

Anónimo dijo...

Inés :
En internet busqué dos artículos en español sobre el OCR:

http://es.wikipedia.org/wiki/Reconocimiento_%C3%B3ptico_de_caracteres
(para ampliar informacion).

http://www.softonic.com/s/ocr
( para descrgar este programa)

Lopez Alegrette julieta.

Anónimo dijo...

Inés:
En esta pagina encontré un despertador con el cual podes amanecer sin problema y muy tranquilo.
Esta es la página:
http://www.tuexperto.com/2008/06/12/progression-wake-up-clock-un-despertador-aromatico-y-luminoso/#more-3273

Pd: estos también son muy interesantes:
http://www.tuexperto.com/2008/03/23/despertador-alfombrilla/

http://www.tuexperto.com/2007/12/27/directors-edition-digital-alarm-clock-un-despertador-de-cine/

(Estos son otros tipos de despertadores)

Virginia Suarez.