咱们来采集一个页面,一般状况下,咱们会使用file_get_contents()函数来获取:
像这样:php
<?php $str = file_get_contents('http://bbs.lampbrother.net'); //或者是: $str = file("http://bbs.lampbrother.net"); //或者是: readfile("http://bbs.lampbrother.net"); ?>
这样咱们会发现,咱们没有办法有效地进行错误处理,更重要的是咱们没有办法完成一些高难度的任务:
如:处理cookies,验证,表单提交,文件上传等等。
好,如今咱们来用代码完成上述cURL的四步:浏览器
<?php //1.初始化,建立一个新cURL资源 $ch = curl_init(); //2.设置URL和相应的选项 curl_setopt($ch, CURLOPT_URL, "http://www.lampbrother.net/"); curl_setopt($ch, CURLOPT_HEADER, 0); //3.抓取URL并把它传递给浏览器 curl_exec($ch); //4.关闭cURL资源,而且释放系统资源 curl_close($ch); ?>