curl应用总结

curl应用总结(一)html

最近开发中用到curl库,虽然都是很简单的应用,但对这个库仍是产生了兴趣,想学习总结一下。curl库功能很是强大,这里主要针对http应用,尤为是http文件下载作一个总结。固然了,仍是主要针对Windows系统来说。浏览器

本文是第一篇,固然要简单介绍一下curl,而后说一下Windows系统下的编译安装,以及对curl工具的简单应用。安全

curl 是一个基于命令行的应用工具,提供利用URL标准进行文件传输的功能。目前已经支持很是多的流行的互联网协议,如:FTP, FTPS, HTTP, HTTPS, SCP, SFTP, TFTP, TELNET, DICT, LDAP, LDAPS and FILE等。curl支持SSL认证,HTTP POST/PUT,FTP上传,HTTP上传、代理、cookies、用户+密码认证、文件续传、代理管道等一系列强大功能。curl是用C语言写的,但 是绑定了不少开发语言。大致上能够把curl分红命令行工具和libcurl库两个部分,命令行工具能够直接输入指令完成相应功能,libcurl则是一 个客户端URL传输库,是线程安全且兼容IPv6,能够很是方便地用来作相关开发。服务器

更多关于curl的信息能够参考官网http://curl.haxx.se/。curl的相关文档很是全,不得不赞一下。其实查阅原文文档是一个很好的习惯,并且仍是一件很惬意的事情,对提升英文阅读能力帮助也很大。cookie

从 curl官方网站上能够直接下载到编译好的lib,dll和exe文件,可是本身由源码编译安装curl,也是一件有意思的事情。从网站上下载源码包,解 压缩后会看到根文件目录下面有不少文件及文件夹。其中的文件是有关curl项目的介绍、版本变动状况、以及一些有关配置和编译的文件;文件夹中比较重要的 有3个:docs、lib和src,docs中包括项目的全部相关文档,lib中为libcurl库的源码,src为curl命令行工具的源码。
如 果你熟悉MSVS开发环境的话,那么编译过程再简单不过了,由于最新的curl源码包中已经自带了vc6的工程文件,只要高于6.0版本的环境均可以直接 打开工程进行编译连接,生成二进制文件。整个solution中包含两个project,一个是libcurl库,一个是curl的命令行工具。其 中,curl.exe运行是要加载libcurl.dll动态库的。另外,自带的工程设置中没有用到OpenSSL或Zlib这些第三方库,若是须要用到 相关扩展功能的话,须要配置引用这些库文件进行编译。
还有一种方式是经过MSVS命令行的方式进行编译。步骤以下:
一、首先要清楚本身安装的是msvc哪一个版本,目前常见的vc6,vc2003(vc7),vc2005(vc8)和vc2008(vc9),curl源码包中都已经写好了相应的makefile文件,我机器上装的是vc2005;
二、 将vc的安装目录的bin文件目录加到PATH环境变量中,我机器上bin的路径为C:\Program Files\Microsoft Visual Studio 8\VC\bin,这一步主要是为了使咱们可以在任何路径下运行bin路径下的工具,如后面要用到的编译工具cl.exe和make工具 nmake.exe;
三、在运行中启动cmd.exe,在其中运行bin目录下的vcvars32.bat这个批处理文件,这个文件中定义了不少vc库文件及相关资源工具的访问变量,指明了响应资源的访问路径,跟环境变量的做用类似,可是只做用于当前命令行窗口;
四、 在cmd中进入到你要编译的curl源码的根文件目录下,输入命令“nmake vc”回车,应该就会看到一长串的编译信息输出。结束后,在lib子目录下会生成release文件夹,里面即为编译后生成的目标文件以及静态连接库文件 libcurl.lib,在src子目录下生成curl.exe可执行文件。这一步中须要注意的是根文件目录下的makefile文件中将vc编译工具定 义为了vc6,咱们应该把其中的“VC=vc6”这句改成本身机器上对应的vc版本。
另外,“nmake vc”命令也是没有引用任何第三方库来进行编译的,默认编译静态连接的release版本文件。若是要编译其余版本或者引用第三方库来进行编译,则要添加make参数,具体能够参考makefile文件中的配置。
以上主要介绍的是在Windows平台下用msvc工具编译curl代码,其实curl库几乎能够支持全部常见的操做系统,并且支持的编译工具也不少,如MingW3二、Cygwin、Borland C++等。curl的文档中写得都很是清楚,这里就不详细说了。

以上简单介绍了curl库和在Windows平台下用msvc环境编译curl执行文件的步骤,下一篇中将总结一些应用curl库的知识。多线程

curl应用总结(二)curl

curl的应用方式,一是能够直接经过命令行工具,另外一种是利用libcurl库作上层的开发。本篇主要总结一下命令行工具的http相关的应用,尤为是http下载方面的;下一篇再讲基于libcurl库的开发。


curl的命令行工具功能很是强大,这些数据交互的功能基本上都是经过URL方式进行的,咱们先来看看curl对多个URL的灵活操做,这些规则使咱们的批处理需求应用起来很是方便。

一、用{}表示多个URL
如 ,只要在{}中写上不一样的部分,就能够表示3个URL了。

二、用[]表示多个URL
如 ,,,[]中表示按数字或字母的顺序排列。
还能表示不连续的排列,如 http://www.numericals.com/file[1-100:10].txthttp://www.letters.com/file[a-z:2].txt,":"后面的数字表示等差排列的阶跃数。

三、结合起来使用
如 。


curl命令行工具的基本语句为:curl [options] [URL...],即 curl [选项] [下载地址]。所以,若是你想下载百度的首页,最简单的方法启动cmd,进入curl安装目录,输入命令:curl http://www.baidu.com,回车,你的输出窗口将当即出现百度首页的html数据。
对于全部的布尔型option,基本上--option表示支持这个选项,--no-option表示禁用这个选项。下面总结几个比较有用的options。

一、-o/--output <file>
这个基本上要算最经常使用的选项了,用于将下载的数据保存到某个文件中。如 curl -o baidu.html http://www.baidu.com则将百度首页保存到baidu.html文件中了。下载过程当中标准输出还会显示下载的统计信息,好比进度、下载字节数、下载速度等。若是指定输出为"-",则下载数据会输出到标准输出。
若是输出的文件是一个多级目录的话,则要配合--create-dirs选项,--create-dirs将自动建立设置的输出目录。
若是但愿保存到本地的文件名和服务器上的相同,就能够直接用-O选项(大写O),而省去指定本地文件名。
如 果下载多个数据文件,可使用上面提到的多URL规则。下载文件名也能够批量自定义,就是使用"#"。能够将"#"加到文件名当中,这样实际文件名中的# 将被多个URL中的当前字符串代替,如 curl -o "#1_#2",#1将被"site"或"host"代替,#2将被1-5之间的数字代替,也就是被当前被处理的URL中的字符串代替。
另外下载数据的时候,能够加个"-#"选项,用一个进度条来代替文本表示进度。

二、-c/--cookie-jar <file name> 和 -b/--cookie <name=data>
这 是两个操做cookie的选项,不少服务器是须要cookie信息的。用前一个选项能够指定一个文件,将其余文件中的cookie或者从服务器获得的 cookie写到文件中;后一个选项则用来向服务器发送cookie信息,能够用"name=data"的形式,也能够直接跟一个保存cookie的文件 名。

三、-x/--proxy <proxyhost[:port]>
该选项为http指定代理及端口,若是不指定端口,默认为1080。如 curl -x 201.36.208.19:3128 http://curl.haxx.se/

四、-u/--user <user:password> 和 -U/--proxy-user <user:password>
登陆某些页面或ftp须要先进行认证,输入用户名和密码。curl的这个选项能够直接处理这类操做,用指定的帐号和密码进行登陆认证。
后面的选项指定代理的用户名和密码,这样即可以直接用这个代理访问网页了,如 curl -U user:password -x 201.36.208.19:3128 http://curl.haxx.se/

五、-A/--user-agent <agent string>
该选项能够指定客户端类型,服务器经过该选项判断用户应用的平台及浏览器信息。如 curl -A "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)" http://www.clientinfo.com
表示告诉服务器,客户端是运行在Windows 2000系统上的IE6.0。异步

六、-d/--data <data>
该选项用来以POST方式向http服务器发送特定数据,最经常使用的就是提交表单。如 curl -d "user=username&password=111" http://www.login.com,表示用帐号username和密码111向站点发送登陆申请。其中多个数据段能够用"&"进行链接一块儿发送;若是数据前面加上符号"@",则数据来源为后面指定的文件,如 curl -d http://www.login.comide

七、-C/--continue-at <offset>
改选项提供断点续传功能,与-o选项配合使用。如 curl -c -O http://vfile.home.news.cn/music/public/vd05/200905/31/a8/MUfs052009053117155750a8be70.mp3。若是指定offset,则从offset的位置开始续传。若是未指定offset,或者直接用"-C -",则curl会本身分析该从什么位置开始续传。函数

八、-r/--range <range>
该 选项指定下载字节的范围,常应用于分块下载文件。range的表示方式有多种,如100-500,则指定从100开始的400个字节数据;-500表示最 后的500个字节;5000-表示从第5000个字节开始的全部字节;另外还能够同时指定多个字节块,中间用","分开。如
curl -r 0-1024000 -o new_divide_1.mp3 http://vfile.home.news.cn/music/public/vd05/200905/31/a8/MUfs052009053117155750a8be70.mp3 &
curl -r 1024001-2048000 -o new_divide_2.mp3 http://vfile.home.news.cn/music/public/vd05/200905/31/a8/MUfs052009053117155750a8be70.mp3 &
curl -r 2048001- -o new_divide_3.mp3 http://vfile.home.news.cn/music/public/vd05/200905/31/a8/MUfs052009053117155750a8be70.mp3
这 样就会将目标mp3文件分块下载为3个文件,而后能够用dos的copy命令:copy new_divide_1.mp3/b + new_divide_2.mp3/b + new_divide_3.mp3/b new_divide.mp3便可将3个分块文件合并为一个完整的mp3文件。

九、-w/--write-out <format>
该 选项格式化输出一些用户操做的数据信息,用到的格式化输出符除了"\n","\r","\t"这些常见转义符外,还包括"@"和"表示输出 filename文件中的数据,"@-"表示输出用户写入标准输入的数据;"%"标识符后面跟上定义的关键字,则能够输出对应的curl数据,经常使用的关键 字有:
http_code —— 上次操做返回的响应码;
time_total —— 上次操做耗时,单位为秒;
time_connect —— TCP链接远程主机的耗时,单位为秒;
time_pretransfer —— 文件真正开始传输以前交互耗时,单位为秒,可能主要包括一些命令处理和协议分析的耗时;
time_starttransfer —— 文件的第一个字节开始传输以前的耗时,单位为秒,包括time_pretransfer和服务器计算结果的时间;
size_download —— 下载的总字节数;
size_upload —— 上传的总字节数;
size_request —— 发送http请求的总字节数;
speed_download —— curl成功下载的平均下载速度;
speed_upload —— curl成功上传的平均上传速度;
举例:curl -o page.html -s -w %{time_connect}:%{time_starttransfer}:%{time_total} http://curl.haxx.se/,其中-s表示安静模式,即略去全部状态信息。

十、--connect-timeout <seconds> 和 -m/--max-time <seconds>
前者表示容许的链接的最长耗时,单位为秒;后者表示容许的整个操做的最长耗时,单位为秒,这个选项对于控制一个批处理操做的时长很是有用。

十一、--limit-rate <speed> 、 -Y/--speed-limit <speed> 和 -y/--speed-time <time>
--limit-rate <speed>指定最大的数据传输率,单位为bytes/s,也能够用'k'或'K'表示kb/s,'m'或'M'表示mb/s,'g'或'G'表示gb/s,所给的speed为平均传输率,短期峰值可能会超过此值;
-Y/--speed-limit <speed>指定最小传输率,单位为bytes/s,若是小于speed值,则传输停止,如此时-y选项没有被设置,默认time为 30;-y/--speed-time <time>指定-Y选项的有效时间段,若是-Y选项没有被设置,默认为1。

十二、--max-filesize <bytes>
该选项指定所要下载的文件的最大长度,若是超过bytes值,则下载并不开始,curl返回退出码63。

1三、--retry <num> 、 --retry-delay <seconds> 和 --retry-max-time <seconds>
当 传输过程当中出现错误,如超时、FTP 5xx返回码或者HTTP 5xx返回码,curl会进行按照设置进行重试,这几个选项都与重试有关。--retry <num>设置重试次数,--retry-delay <seconds>设置两次重试的间隔时间,--retry-max-time <seconds>设置两次重试间隔的最长时间。默认状况下,curl不进行重试;若是重试,第一次间隔1秒,以后每次都间隔上一次的2倍时 间,直到间隔时间达到10分钟,以后的重试都将采用10分钟间隔。若是这3个选项的值被从新设置,则执行设置值。

1四、-T/--upload-file <file>
该选项是上传命令,如向http服务器上传一个文件:curl -T D:\new_divide.mp3 http://www.uploadserver.com/path/;向一个ftp服务器上传文件:curl -T D:\new_divide.mp3 -u user:password 。


curl定义了一组"EXIT CODES",用来标识在出现错误时的相关信息,目前范围从1-83,具体信息能够查阅curl库自带的文档。这些退出码对于咱们分析错误及缘由有很大帮助。


以上简单介绍了一下利用curl命令行工具进行一些简单的http和ftp应用,你们能够试着多用一下,会慢慢发现curl的强大功能,有不少独特的功能用起来很是简单方便。

curl应用总结(三)

这篇讲一下基于libcurl库的开发(Windows平台,MSVC2005开发环境)。
libcurl是一个简单易用的基于URL传输的客户端开发库,支持多种平台以及三十多种开发语言绑定。libcurl是线程安全的,兼容IPv6,功能强大且运行效率高,不少知名公司如Google、Adobe的产品都应用过libcurl。
在05环境中作libcurl开发,须要将静态库文件加到编译连接环境中,而且要dll动态运行库支持。


libcurl 提供了一组C语言API函数直接调用。首先须要提到的两个函数就是curl_global_init()和curl_global_cleanup()。 libcurl要用到一系列的全局常量,curl_global_init()函数就是初始化这些变量,并分配一些全局资 源;curl_global_cleanup()则负责释放这些资源。所以通常状况下,在调用libcurl函数以前,先用 curl_global_init(CURL_GLOBAL_ALL)作初始化,在调用完毕后,用curl_global_cleanup()
退出。须要注意的是,这些全局变量和资源并非线程安全的,所以,在多线程应用的环境中,最好不要屡次调用curl_global_init()和curl_global_cleanup(),调用其余函数并不会改变这些全局变量和资源。
libcurl 支持3种不一样的接口调用方式,分别是"easy"、"multi"和"share"模式。libcurl-easy是一组同步接口,函数都是 curl_easy_*形式,这种模式调用curl_easy_perform()函数进行URL数据传输,直到传输完成函数才返回;libcurl- multi是一组异步接口,函数都是curl_multi_*形式,调用curl_multi_perform()函数进行传输,可是每次调用只传一片数 据,咱们能够用select()函数控制多个下载任务进行同步下载,来实如今一个线程中同时下载多个文件;libcurl-share容许在多线程中操做 共享数据。下面以libcurl-easy为例讲一下libcurl的函数。

一、CURL *curl_easy_init()
此函数须要最早被调用,返回CRUL easy句柄;后续其余函数调用都要用到这个句柄。若是没有调用curl_global_init(),该函数自动调用,可是考虑到线程安全的问题,最好本身调用curl_global_init()。

二、CURLcode curl_easy_setopt(CURL *handle, CURLoption option, parameter)
所 有参数和选项设置都是经过这个函数完成的,它告诉libcurl怎样去进行传输。参数handle即为curl_easy_init()返回的句柄,后面 根据option的类型,设置相应的parameter值,该函数每次调用只能设置一个选项。具体的option讲解在这两篇博文中有较全面的介绍:
http://blog.163.com/wangsen_315/blog/static/9461414200882384555217/
http://blog.sina.com.cn/s/blog_4f9fc6e10100einf.html
这里只总结一下与下载有关的经常使用选项设置。

CURLOPT_URL
字符串类型,该选项设置要处理的URL地址,该选项是进行curl_easy_perform以前惟一必需要设置的选项。

CURLOPT_COOKIE
字符串类型,设置http头中的cookie信息。

CURLOPT_COOKIEFILE
字符串类型,同CURLOPT_COOKIE,不过cookie信息从文件中读取。

CURLOPT_FOLLOWLOCATION
布尔值类型,该参数设置为非零值表示follow服务器返回的重定向信息。

CURLOPT_POSTFIELDS
字符串类型,提交http的post操做字符串数据。

CURLOPT_TIMEOUT
long数值类型,设置函数执行的最长时间,时间单位为s。

CURLOPT_CONNECTTIMEOUT
long数值类型,设置链接服务器最长时间,时间单位为s;当置为0时表示无限长。

CURLOPT_MAX_RECV_SPEED_LARGE
curl_off_t类型数据,指定下载过程当中最大速度,单位bytes/s。

CURLOPT_HEADERFUNCTION
函数指针类型,该选项设置一个处理接收到的header数据的回调函数,函数原型为:
size_t function( void *ptr, size_t size, size_t nmemb, void *stream);
其中,ptr指向接收到的header头数据,数据大小为size*nmemb,stream指向调用CURLOPT_WRITEHEADER选项设置的参数。该回调函数应返回实际处理的数据量大小,或者出错返回-1。

CURLOPT_WRITEFUNCTION
函数指针类型,该选项设置一个处理接收到的下载数据的回调函数,函数原型为:
size_t function( void *ptr, size_t size, size_t nmemb, void *stream);
其中,ptr指向接收到的数据,数据大小为size*nmemb,stream指向调用CURLOPT_WRITEDATA选项设置的参数。
若是函数指针置为NULL,则会调用默认的函数,将数据写入到由CURLOPT_WRITEDATA指定的FILE*中。 CURLOPT_HTTPHEADER curl_slist结构体类型,该选项自定义请求头信息。 CURLOPT_NOPROGRESS 布尔值类型,设置该值为非零值关闭PHP为CRUL传输显示的进度条。 三、void curl_easy_reset(CURL *handle ) 从新初始化CURL句柄的选项设置。 四、CURLcode curl_easy_getinfo(CURL *curl, CURLINFO info, ... ) 查询CRUL会话的内部信息,具体说明请参考curl自带文档。 五、void curl_easy_cleanup(CURL * handle ) 该函数与curl_easy_init函数成对出现,handle即为调用curl_easy_init返回的句柄。该函数在CURL会话结束退出时调用,以后handle无效。 libcurl库开发就简单总结这些,只是一个很粗略的介绍,具体的细节请参考curl自带的文档手册。本文没有给出示例代码,由于curl的源码包中已经自带了不少例子,你们能够仔细研究一下。
相关文章
相关标签/搜索