Bajar html

Me gustaría saber, como podría bajar una página web(solo html), sin una conexión aparente, es decir transparente al usuario, para después adquirir datos de la página, una vez filtrado (quitado todas las etiquetas, y dejando solo el texto que nos interesa). ¿Mediante Winsock? ¿FtP?

1 respuesta

Respuesta
1
Primero debes establecer una conexión, con winsock o con cualquier componente que te lo permita. Una vez establecida la conexión debes saber cuales son los comandos que hay que usar. Porque solo conectándote no vale.
Mira en http://www.redes.upv.es/~mperez/rc2/transpa/tema9_archivos/frame.htm
Hay un breve resumen de los comandos HTTP. Tu deberás usar GET, para obtener la página. Ejemplo
GET /index.html HTTP/1.0
Obtiene del servidor el archivo index.html.

Añade tu respuesta

Haz clic para o

Más respuestas relacionadas