Página principal » cómo » PHP Obtenga el contenido de una página web, fuente RSS o archivo XML en una variable de cadena

    PHP Obtenga el contenido de una página web, fuente RSS o archivo XML en una variable de cadena

    A menudo tendrá la necesidad de acceder a los datos que residen en otro servidor, ya sea que esté escribiendo un agregador de RSS en línea o haciendo un raspado de pantalla para un mecanismo de búsqueda. PHP hace que la extracción de estos datos en una variable de cadena sea un proceso extremadamente simple.

    Puedes ir con el método realmente corto:

    $ url = "https://www.howtogeek.com";

    $ str = file_get_contents ($ url);

     

    El único problema con ese método es que algunos hosts web tienen acceso a url bloqueado en los métodos de archivo, por razones de seguridad. Es posible que pueda utilizar este método alternativo en su lugar:

    función get_url_contents ($ url) $ crl = curl_init (); $ timeout = 5; curl_setopt ($ crl, CURLOPT_URL, $ url); curl_setopt ($ crl, CURLOPT_RETURNTRANSFER, 1); curl_setopt ($ crl, CURLOPT_CONNECTTIMEOUT, $ timeout); $ ret = curl_exec ($ crl); curl_close ($ crl); devuelve $ ret; 

    Ahora debería tener los contenidos del sitio web en una variable de cadena. Tenga en cuenta que esto no muestra los archivos auxiliares como javascript o CSS. Tendrá que seguir analizando la página y recuperarlos por separado si necesita todo..