Error de codificación

He convertido un texto de PDF que se encontraba en formato imagen.
Cuando lo veo en el ordenador, se ve correctamente, sin embargo cuando lo veo en otros dispositivos aparecen caracteres cambiados: el Æ por el acento de la 'a' y el carácter Ø por el acento de la 'e', la i acentuada y la o acentuada las respeta. Con respecto a la u acentuada, no he podido verla.
¿Alguien podría decirme cómo podría ver la codificación a la que ha sido convertido?
Muchas gracias.

1 Respuesta

Respuesta
1
El problema que tu comentas no tiene solución, ya que hay varias, como unas 100 o más codificaciones, entre las que digura UTF8, ASCII, etc...
El pc si lo puede leer sin probmeas ya que el pc tiene todas las codificaciones e interpreta sin problemas el texto, pero en otros dispositivos como los ipads, ipods, y celulares se ve mal, te lo digo por experiencia propia.
Esto sucede por la codificion como te mencione, cuando pasas un texto de pdf que se encontraba en una imagen, cuando escaneas un libro por ejemplo, tienes o varias imágenes, o varios pdfs, si tienes varios pdfs, los scanners modernos te convierten a texto la escaneada, y por eso que se ve bien en la pc, por los protocolos de comunicación entre el scanner y la pc, obviamente no ocurrirá lo mismo en mini dispositivos.
El texto que estaba en imagen, lo he convertido a texto, es algo que no ha quedado claro en mi pregunta; o sea, que se ha pasado a texto.
Sin embargo el texto se ha quedado con ciertos caracteres que no parece sean de codificación UTF, ni ASCII.
Lo que preguntaba es si se puede ver la codificación del texto en un formato PDF.
Aun no entiendo bien la parte de "el texto lo he pasado a texto" pero bueno, si ud tiene un texto con codificación rara, no se si en el pdf se van a ver, ¿no ha probado pegar ese texto en word y exportarlo a pdf?
Bien. Vamos a ver, cuando tu tienes un PDF, tienes tres tipos:
1.- Un texto escaneado (imagen), una imagen del libro que no puedes copiar y pegar.
2.- Un texto escaneado (imagen) junto con otra capa que está por debajo con texto que puedes copiar y pegar.
3.- Un texto que puedes copiar y pegar que no es una imagen, sino texto vectorial.
Yo tenía (una finca en áfrica, ... no esto es de otra película) un texto en imagen (opción 1) que pudo convertir a un archivo de imagen con texto (opción 2).
La cuestión es que el mismo programa no tiene la opción de que se pueda configurar la codificación de salida para el texto.
He recurrido al servicio de soporte del programa, y ni siquiera ellos saben cómo lo codifica, por eso estoy buscando en qué codificación puede haberles salido.
¿Me he explicado ahora?
Reconozco que en ocasiones soy demasiado directo y dejo detalles que pueden ser útiles.
Si, se ha explicado perfecto, creo que esa codificiacion se llama ISO-LATIN-1, que la misma que tiene los html raros que a veces cuando traduces páginas y salen cosas raras.
Mandame el pdf a mi correo a ver como sale y ver si lo puedo pasar a texto normal
[email protected]

Añade tu respuesta

Haz clic para o

Más respuestas relacionadas