Extraer texto de un PDF... Ordenado!

He buscado mucho pero no encuentro solución a mi problema. Trabajo confeccionando documentos a partir de declaraciones que me envían los clientes. Determinado cliente me los envía en PDF, pero es un pdf que al copiar el texto y pegarlo (es en un programa, pero en word pasa lo mismo), me altera el orden de algunas líneas. Por lo cual debo re chequear y volverlo a ordenar cortando y pegando, lo cual me da mucho trabajo, ya que son varios documentos.
Incluso probé guardar el pdf como texto, y sigue pasando lo mismo.
Ahora instalé una versión más nueva del acrobat reader... Y se me suma el problema que no me permite elegir una sección de texto, solo puedo seleccionar línea a línea. Me servía elegir una sección porque a veces me interesan solo los datos más a la izquierda o a la derecha del PDF (solo texto necesito extraer).
1

1 respuesta

Respuesta
1
El problema de elos PDF es que según como se guarden, restringen ciertas cosas, como por ejemplo que al copiarlo y pegarlo te respete las lineas.
Te recomiendo que te hagas con el Acrobat Distiller, que te va a poder abrir los PDF y podrás incluso editarlos

Añade tu respuesta

Haz clic para o

Más respuestas relacionadas