Hola a todos.
Resulta que el texto que sale de un pdf no esta formateado correctamente, pero si que se pueden hacer algunas cosas para mejorarlo.
Si por ejemplo una cadena termina en ".\n" (punto+nueva-linea) estamos casi con seguridad en el final de un párrafo.
Pero luego hay situaciones en las que se trata de un título y que la linea de texto no termina en "." pero por suerte sucede que luego la siguiente linea comienza por una mayúscula.
Bien ahora la pregunta ¿Cual es la expresión regular, u otra forma para reemplazar \n# por \n[::jump::]#? donde # es cualquier letra mayúscula.
- Reemplazar \n# por \n[::jump::]#
Saludos.