Parsear una página

Question

el 14 mar. 07

Parsear una página

Hola necesito tomar un contenido especifico dentro de una página en un dominio y colocarla en otro dominio, en especifico se trata de una página XHTML y lo que quiero capturar viene encerrado entre etiquetas <div id="contenido"> ... </div> ... Creo que debo poder resolverlo con expresiones regulares o sacando los nodos como xml pero no tengo idea de como hacerlo o si es mejor hacerlo en JavaScript

ftovalle, Tengo una amplia experiencia en lenguajes de programación como... · Accepted Answer · 2007-03-14T23:00:01.0000000Z

Respuesta de ftovalle

1

Creo que este código PHP te puede ayudar:
<?
$data = file_get_contents('http://sports.yahoo.com/');
list(, $data_split) = explode('<div id="contenido">', $data,
2);
list($data2, ) = explode('</div>', $data_split, 2);
$data2 = strip_tags($data2);
echo $data2;
?>
Siendo "'http://sports.yahoo.com/" un ejemplo de la página que quieres tomar los datos.

el 14 mar. 07

Bueno esta seria una solución perfecta si se incluyeran en el código que quiero capturar solo esas dos etiquetas ... <div>...</div> pero es que dentro hay muchas más entradas <div>...</div> y su cantidad es variable por lo que no puedo usar el explode con un limite de elementos a cortar, claro yo podría antes que eso contar primero en la cadena cuantos "<div></div>" hay y a partir de eso saber cual es exactamente el que corresponde al que me sirve de inicio y cortar ahí pero pensé que podría usar el ID de la etiqueta para sacarla de una sola vez con todo su contenido. ... ¿Se te ocurre alguna idea?

el 14 mar. 07

Sinceramente, no se me ocurre otra alternativa que la que mencionas, la de contar los divs y hacer un explode por esta cantidad.

el 15 mar. 07

Parsear una página

Añade tu respuesta

Más respuestas relacionadas

PHP Development Services in USA

Software ERP para gestión de clientes GRATUITO

Https no funciona en navegador movil pero si en desktop?

Juego piedra, papel y tijera

Procesar Correo Recibido con PHP

Botón de descarga y enviar al correo

Cómo hacer un informe que se genere y envíe automáticamente a partir de un formulario online

Cómo puedo hacer para que me imprima 4 formularios en diferentes ficheros php en un solo botón imprimir

.htacess no redirecciona ni quita www

Aumentar el valor del campo upload_max_filesize en servidor de pago

¿Se nota mucho la diferencia de un portátil con procesador de 2 núcleos a uno de 4 núcleos?

¿Qué anchura y resolución de pantalla son adecuadas para ver TV a 2 metros?

¿Cómo se organiza una videoconferencia?

¿Estoy infringiendo derechos de copyright al poner imágenes de carteles de películas en mi web?