电子邮件收发原理和实现(POP3, SMTP)

电子邮件的收发流程示意图: html

电子邮件收发原理和实现(POP3, SMTP)

电子邮件收发原理和实现(POP3, SMTP)

相对于邮件客户端的流程就是: java

电子邮件收发原理和实现(POP3, SMTP)

邮件接收——POP3协议
POP3(Post Office Protocol 3,邮局协议版本3)主要用于支持使用客户端远程管理在服务器上的电子邮件。该协议是在RFC-1939中定义的,是Internet上的大多数人用来接收邮件的机制。POP3采用Client/Server工做模式,默认使用TCP 110端口。浏览器

  • 在使用POP协议时,人们熟悉的不少功能,如查看收到了多少新邮件消息的功能,POP根本不支持。这些功能都内置到诸如Eudora或 Microsoft Outlook之类的邮件程序中,能为您记住接收的上一封邮件,以及计算有多少新邮件这类信息。所以,若是想获取这类信息,将须要由本身进行计算。
    [详细请参考wiki的解析:http://zh.wikipedia.org/wiki/POP3 ]

<POP3状态图>
电子邮件收发原理和实现(POP3, SMTP)安全

<POP3经常使用命令表>
电子邮件收发原理和实现(POP3, SMTP)服务器

命令可能的返回值 dom

  • OK <描述> 成功
  • ERR <描述> 失败

<POP3工做原理>
1) 客户端使用TCP协议链接邮件服务器的110端口;
2) 客户端使用USER命令将邮箱的帐号传给POP3服务器;
3) 客户端使用PASS命令将邮箱的帐号传给POP3服务器;
4) 完成用户认证后,客户端使用STAT命令请求服务器返回邮箱的统计资料;
5) 客户端使用LIST命令列出服务器里邮件数量;
6) 客户端使用RETR命令接收邮件,接收一封后便使用DELE命令将邮件服务器中的邮件置为删除状态;
7) 客户端发送QUIT命令,邮件服务器将将置为删除标志的邮件删除,链接结束。
(注:客户端UA能够设定将邮件在邮件服务器上保留备份,而不将其删除。)ide

一个基本实现(Java):
Pop3Test.java (见附件)测试

邮件发送——SMTP协议
SMTP(Simple Message Transfer Protocol,简单邮件传输协议)是用于传送电子邮件的机制。该协议是在RFC-821中定义的。采用Client/Server工做模式,默认使用TCP 25端口。
[详细请参考wiki的解析:http://zh.wikipedia.org/wiki/SMTP ]spa

<SMTP状态图>
电子邮件收发原理和实现(POP3, SMTP).net

<SMTP经常使用命令表>
电子邮件收发原理和实现(POP3, SMTP)

命令可能的返回值
500 格式错误,命令不可识别(此错误也包括命令行过长)
501 参数格式错误
502 命令不可实现
503 错误的命令序列
504 命令参数不可实现
211 系统状态或系统帮助响应
214 帮助信息
220 <domain> 服务就绪
221 <domain> 服务关闭传输信道
421 <domain> 服务未就绪,关闭传输信道(当必须关闭时,此应答能够做为对任何命令的响应)
250 要求的邮件操做完成
251 用户非本地,将转发向<forward-path>
450 要求的邮件操做未完成,邮箱不可用(例如,邮箱忙)
550 要求的邮件操做未完成,邮箱不可用(例如,邮箱未找到,或不可访问)
451 放弃要求的操做;处理过程当中出错
551 用户非本地,请尝试<forward-path>
452 系统存储不足,要求的操做未执行
552 过量的存储分配,要求的操做未执行
553 邮箱名不可用,要求的操做未执行(例如邮箱格式错误)
354 开始邮件输入,以<CRLF>.<CRLF>结束
554 操做失败

1.2. 几个术语
1.2.1. 邮件

邮件是一种消息的格式,由信封、首部和正文组成。

信封上最重要的是收信人的地址。邮件服务器用这个地址将邮件发送到收信人所在的邮件服务器上。

首部是由用户代理或邮件服务器添加的一些信息。包括Received、Message-ID、From、Data、Reply-To、X-Phone、X-Mailer、To和Subject等字段。

正文是是发送用户发给接收用户报文的内容。RFC 822 规定正文为NVT ASCII文字行。

更为详细的说明,请参考RFC821和RFC822等协议。

1.2.2. 用户代理
用户代理UA(User Agent)是用户与电子邮件系统的交互接口,通常来讲它就是咱们PC机上的一个程序。Windows上常见的用户代理是Foxmail和Outlook Express。

用户代理提供一个好的用户界面,它提取用户在其界面填写的各项信息,生成一封符合SMTP等邮件标准的邮件,而后采用SMTP协议将邮件发送到发送端邮件服务器。

1.2.3. 邮件服务器
邮件服务器是电子邮件系统的核心,它用来发送和接收邮件。邮件服务器不一样于普通PC的是它几乎是全天工做的,因此它能够在任什么时候候为用户提供服务,后面将提到这正是为何须要邮件服务器的一个重要缘由。不少ISP都提供免费的邮件服务器,如126提供smtp.126.com邮件服务器。

邮件服务器向其它邮件服务器转发邮件也是采用SMTP协议。
1.2.4. SMTP和邮件格式的关系
如前所述,SMTP是客户机向服务器发送邮件时所使用的协议,其核心是2.2中所述的命令和响应,至于它命令和响应中所带的参数采用什么格式,则是依赖于其余标准的。例如DATA后所带的参数,则应遵循邮件格式标准RFC822.

SMTP和邮件格式的关系可用这么一个例子来讲明。甲与乙书信往来,甲经过邮局向乙发信,邮局间转交邮件可当作使用了SMTP协议,至于书信的格式则会由于地区习惯等的不一样而不一样(中国人的书信格式和美国人的书信格式不一样),这个书信格式则可当作是邮件格式标准。

应当认识到不能孤立地看待协议,各个协议之间每每存在着耦合关系,但为了分析方便,咱们在具体叙述某个协议时,只能抓住主要矛盾——主要阐述单个协议。

1.2.5. 浏览器发送邮件用的什么协议
浏览器如IE、Maxthon可经过登录用户邮箱,来收发邮件,这是怎样实现的?例如bripengandre@126.com可经过登录www.126.com来收发邮件。

这个过程是这样的:bripengandre@126.com在www.126.com提供的邮件页面上填写的相应信息(如发信人邮箱、收信人邮箱等),经过http协议被提交给126服务器;126服务器根据这些信息组装一封符合邮件规范的邮件(就像用户代理同样);而后smtp.126.com经过SMTP协议将这封邮件发送到接收端邮件服务器。

能够看出,浏览器发送邮件只是用户代理的功能直接放到邮件服务器上去作了,至于邮件服务器间发送邮件仍是采用的SMTP协议。咱们看问题,若是有必要仍是要适当地透过现象看本质。

1.3. 邮件的收发过程
通常状况下,一封邮件的发送和接收过程以下。

1) 发信人在用户代理里编辑邮件,包括填写发信人邮箱、收信人邮箱和邮件标题等等。

2) 用户代理提取发信人编辑的信息,生成一封符合邮件格式标准(RFC822)的邮件。

3) 用户代理用SMTP将邮件发送到发送端邮件服务器(即发信人邮箱所对应的邮件服务器)。

4) 发送端邮件服务器用SMTP将邮件发送到接收端邮件服务器(即收信人邮箱所对应的邮件服务器)。

5) 收信人调用用户代理。用户代理用POP3协议从接收端邮件服务器取回邮件。

6) 用户代理解析收到的邮件,以适当的形式呈如今收信人面前。

第2章. SMTP详解

<SMTP工做原理>
SMTP,即简单邮件传送协议,所对应RFC文档为RFC821。同http等多数应用层协议同样,它工做在C/S模式下,用来实现因特网上的邮件传送。SMTP在整个电子邮件通讯中所处的位置如图 1所示。

电子邮件收发原理和实现(POP3, SMTP)
能够看出,SMTP是用来将客户机上的邮件传送到服务器上。这里的客户机是指某次链接中的发送方,服务器是指相应的接收方。在讲解发送邮件的整个通讯过程前,先解释一下面几个术语。
2.1. 通讯过程
一个具体的SMTP通讯(如发送端邮件服务器与接收端服务器的通讯)的过程以下。

1) 发送端邮件服务器(如下简称客户端)与接收端邮件服务器(如下简称服务器)的25号端口创建TCP链接。

2) 客户端向服务器发送各类命令,来请求各类服务(如认证、指定发送人和接收人)。

3) 服务器解析用户的命令,作出相应动做并返回给客户端一个响应。

4) 2)和3)交替进行,直到全部邮件都发送完或二者的链接被意外中断。

从这个过程看出,命令和响应是SMTP协议的重点,下面将予以重点讲述。

2.2. 命令和响应
2.2.1. 格式
SMTP的命令很少(14个),它的通常形式是:COMMAND [Parameter] <CRLF>。其中COMMAND是ASCII形式的命令名,Parameter是相应的命令参数,<CRLF>是回车换行符(0DH, 0AH)。

SMTP的响应也不复杂,它的通常形式是:XXX Readable Illustration。XXX是三位十进制数;Readable Illustration是可读的解释说明,用来代表命令是否成功等。XXX具备以下的规律:以2开头的表示成功,以4和5开头的表示失败,以3开头的表示未完成(进行中)。

2.2.2. 一个例子
命令和响应的格式是语法,各命令和响应的意思则是语义,各命令和各响应在时间上的关系则是同步。下面将经过一个简单的SMTP通讯过程来讲明协议的这三个要素。

C:telnet smtp.126.com 25 / 以telnet方式链接126邮件服务器 /

S:220 126.com Anti-spam GT for Coremail System (126com[071018]) / 220为响应数字,其后的为欢迎信息,会应服务器不一样而不一样/

C:HELO smtp.126.com / HELO 后用来填写返回域名(具体含义请参阅RFC821),但该命令并不检查后面的参数/

S:250 OK

C: MAIL FROM: bripengandre@126.com / 发送者邮箱 /

S:250 … ./ “…”表明省略了一些可读信息 /

C:RCPT TO: bripengandre@smail.hust.edu.cn / 接收者邮箱 /

S:250 … ./ “…”表明省略了一些可读信息 /

C:DATA / 请求发送数据 /

S:354 Enter mail, end with "." on a line by itself

C:Enjoy Protocol Studing

C:.

S:250 Message sent

C:QUIT / 退出链接 /

S:221 Bye

分析上面的过程可参考注释进行,这里要补充以下几点。

1) “C:”开头的行(不包括"C:")是客户端的输入,而以“S:”开头的行(不包括"S:")则是服务器的输出。

2) 上述的命令并不必定会一次性成功,服务器会返回错误响应,客户端应该按照协议规定的时序,来输入后续的命令(或重复执行失败的命令,或重置会话,或退出会话等等)。

2.2.3. 经常使用命令
SMTP命令不区分大小写,但参数区分大小写,有关这方面的详细说明请参考RFC821。经常使用的命令以下。

HELO <domain> <CRLF>。向服务器标识用户身份发送者能欺骗,说谎,但通常状况下服务器都能检测到。

MAIL FROM: <reverse-path> <CRLF>。<reverse-path>为发送者地址,此命令用来初始化邮件传输,即用来对全部的状态和缓冲区进行初始化。

RCPT TO:<forward-path> <CRLF>。 <forward-path>用来标志邮件接收者的地址,经常使用在MAIL FROM后,能够有多个RCPT TO。

DATA <CRLF>。将以后的数据做为数据发送,以<CRLF>.<CRLF>标志数据的结尾。

REST <CRLF>。重置会话,当前传输被取消。

NOOP <CRLF>。要求服务器返回OK应答,通常用做测试。

QUIT <CRLF>。结束会话。

VRFY <string> <CRLF>。验证指定的邮箱是否存在,因为安全方面的缘由,服务器大多禁止此命令。

EXPN <string> <CRLF>。验证给定的邮箱列表是否存在,因为安全方面的缘由,服务器大多禁止此命令。

HELP <CRLF>。查询服务器支持什么命令。

2.2.4. 经常使用响应
经常使用的响应以下所示,数字后的说明是从英文译过来的。更详细的说明请参考RFC821。

501参数格式错误

502命令不可实现

503错误的命令序列

504命令参数不可实现

211系统状态或系统帮助响应

214帮助信息

220<domain>服务就绪

221<domain>服务关闭

421<domain>服务未就绪,关闭传输信道

250要求的邮件操做完成

251用户非本地,将转发向<forward-path>

450要求的邮件操做未完成,邮箱不可用

550要求的邮件操做未完成,邮箱不可用

451放弃要求的操做;处理过程当中出错

551用户非本地,请尝试<forward-path>

452系统存储不足,要求的操做未执行

552过量的存储分配,要求的操做未执行

553邮箱名不可用,要求的操做未执行

354开始邮件输入,以"."结束

554操做失败

转自:http://www.javashuo.com/article/p-rfwjddbb-hd.html
转自:http://univasity.iteye.com/blog/1173296