羊皮纸论坛目录 / 程式设计 / 网页/网站程式 / PHP /

PHP 如何获取网页内容

发表新主题
随机主题
上个主题
下个主题
|
PHP 如何获取网页内容

1、fopen的使用

代码如下:

程式项目名称
  1. /* 原始程式码 */
  2. <?php
  3. $handle = fopen ("http://example.com/", "rb");
  4. $contents = "";
  5. while (!feof($handle)) {
  6. $contents .= fread($handle, 8192);
  7. }
  8. fclose($handle);
  9. echo $contents; //输出获取到得内容。
  10. ?>

对 PHP 5 及更高版本可以使用下面的代码

程式项目名称
  1. /* 原始程式码 */
  2. <?php
  3. $handle = fopen("http://example.com", "rb");
  4. $contents = stream_get_contents($handle);
  5. fclose($handle);
  6. echo $contents;
  7. ?>

但上面的代码容易出现 failed to open stream: HTTP request failed!错误,解决方法

有人说在php.ini中,有这样两个选项:allow_url_fopen =on(表示可以通过url打开远程文件),user_agent="PHP"(表示通过哪种脚本访问网络,默认前面有个 " ; " 去掉即可。)重启服务器。

但是有些还是会有这个警告信息,想用完美的解决还差一步,还得设置php.ini里面的user_agent,php默认的user_agent是PHP,我们把它改成Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)来模拟浏览器就可以了

php.ini
  1. user_agent="Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"

在工作中遇到这个问题,後完美解决,故分享给大家。

2、通过curl来实现

代码如下:

程式项目名称
  1. /* 原始程式码 */
  2. <?php
  3. $url = "http://example.com";
  4. $ch = curl_init();
  5. curl_setopt ($ch, CURLOPT_URL, $url);
  6. curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
  7. curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT,10);
  8. $dxycontent = curl_exec($ch);
  9. echo $dxycontent;
  10. ?>

linux下可以使用下面的代码下载
exec("wget {$url}");

PHP抓取外部资源函数fopen / file_get_contents / curl 的区别

fopen / file_get_contents 每次请求都会重新做DNS查询,并不对DNS信息进行缓存。
但是CURL会自动对DNS信息进行缓存。对同一域名下的网页或者图片的请求只需要一次DNS查询。
这大大减少了DNS查询的次数。
所以CURL的性能比fopen / file_get_contents 好很多。

  • 关键字 : handle, fopen, contents, user_agent, 原始程式码, example, curl_setopt, 代码如下, fclose, failed, dxycontent, compatible, Windows, DNS查询, 默认, 错误, 重启服务器, 这大大减少, 还得设置php, 请求只
0 0
2012-04-25T07:28:00+0000


  • 当您未登入羊皮纸时,可以利用脸书 Facebook 登入来发表回响。若使用羊皮纸会员身份发表回响则可获得经验值及虚拟金币,用来参加羊皮纸推出的活动。
发表回响
 
验证字串