JavaMail学习笔记(一)、理解邮件传输协议(SMTP、POP3、IMAP、MIME)
电子邮件需要在邮件客户端和邮件服务器之间,以及两个邮件服务器之间进行传递,就必须遵循一定的规则,这些规则就是邮件传输协议。SMTP协议定了邮件客户端与SMTP服务之间,以及两台SMTP服务器之间发送邮件的通信规则;POP3/IMAP协议定义了邮件客户端与POP3服务器之间收发邮件的通信规则。
一、SMTP协议
SMTP(Simple Mail Transfer Protocol,简单邮件传输协议)定义了邮件客户端与SMTP服务器之间,以及两台SMTP服务器之间发送邮件的通信规则 。SMTP协议属于TCP/IP协议族,通信双方采用一问一答的命令/响应形式进行对话,且定了对话的规则和所有命令/响应的语法格式。
SMTP协议中一共定了18条命令,发送一封电子邮件的过程通常只需要其中的6条命令即可完成发送邮件的功能,下表按照发送命令的先后顺序列出了这6条命令,并描述了其语法及功能说明,其中,<SP>代表空格,<CRLF>代表回车和换行。
SMTP命令格式 | 说明 |
ehlo<SP><domain><CRLF> |
ehlo命令是SMTP邮件发送程序与SMTP邮件接收程序建立连接后必须发送的第一条SMTP命令,参数<domain>表示SMTP邮件发送者的主机名。 ehlo命令用于替代传统SMTP协议中的helo命令。 |
auth<SP><para><CRLF> | 如果SMTP邮件接收程序需要SMTP邮件发送程序进行认证时,它会向SMTP邮件发送程序提示它所采用的认证方式,SMTP邮件发送程序接着应该使用这个命令回应SMTP邮件接收程序,参数<para>表示回应的认证方式,通常是SMTP邮件接收程序先前提示的认证方式。 |
mail<SP>From:<reverse-path><CRLF> | 此命令用于指定邮件发送者的邮箱地址,参数<reverse-path>表示发件人的邮箱地址 |
rcpt<SP>To:<forword-path><CRLF> | 此命令用于指定邮件接收者的邮箱地址,参数<forward-path>表示接收者的邮箱地址。如果邮件要发送给多个接收者,那么应使用多条rcpt<SP>To命令来分别指定每一个接收者的邮箱地址。 |
data<CRLF> | 此命令用于表示SMTP邮件发送程序准备开始输入邮件内容,在这个命令后面发送的所有数据都将被当做邮件内容,直至遇到“<CRLF>.<CRLF>"标志符,则表示邮件内容结束。 |
quit<CRLF> | 此命令表示要结束邮件发送过程,SMTP邮件接收程序接收到此命令后,将关闭与SMTP邮件发送程序的网络连接。 |
其它SMTP命令的语法及功能描述可以参考RFC821和RFC1869文档。
对于SMTP邮件发送程序发送的每一条命令,SMTP邮件接收程序都将回应一条响应信息。每条响应信息都以一个响应状态开头,如:250 OK。响应状态用于表示SMTP服务器对请求命令的处理结果和状态,它是一个三位的十进制数。响应状态码的最高位数字代表了不同的分类,当其为 2 时表示命令执行成功;为5时表示命令执行失败;为3时表示命令没有完成。关于响应状态码所代表的具体含义,可以参考RFC821文档。
SMTP协议是一个基于TCP/IP的应用层协议,SMTP服务器默认的网络监听端口号为25,下面将通过telnet程序,手工发送SMTP命令来发送一封电子邮件,从而理解SMTP协议的交互过程。
模拟环境说明:连接sina的SMTP服务器,给163的SMTP服务器发送一封邮件,操作过程如下图所示:
说明:
1、连接SMTP服务器的用户名和密码需要经过base64编码,下面是对用户名和密码进行base64编码的JAVA程序:
package org.yangxin.study.jm.util;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import sun.misc.BASE64Encoder;
public class Base64Util {
public static void main(String[] args) throws IOException {
BASE64Encoder encoder = new BASE64Encoder();
System.out.println("请输入用户名:");
String username = new BufferedReader(new InputStreamReader(System.in)).readLine();
System.out.println(encoder.encode(username.getBytes()));
System.out.println("请输入密码:");
String password = new BufferedReader(
new InputStreamReader(System.in))
.readLine();
System.out.println(encoder.encode(password.getBytes()));
}
}
2、红色箭头指向的文字表示我在telnet程序中输入的命令,以2、3、5数字开头的行表示SMTP服务器对命令的响应。通过上表中的6个SMTP命令就完成了一封简单电子邮件的发送。当然一封复杂的邮件不只包含这些信息,还应包括主题、发送日期、抄送和附件等消息头。
二、POP3协议
POP3命令格式 | 说明 |
user<SP>username<CRLF> | user 命令是POP3客户端程序与POP3邮件服务器建立连接后通常发送的第一条命令,参数 username 表示收件人的帐户名称。 |
pass<SP>password<CRLF> | pass 命令是在user命令成功通过后,POP3客户端程序接着发送的命令,它用于传递帐户的密码,参数 password 表示帐户的密码。 |
apop<SP>name,digest<CRLF> | apop 命令用于替代user和pass命令,它以MD5 数字摘要的形式向POP3邮件服务器提交帐户密码。 |
stat<CRLF> | stat 命令用于查询邮箱中的统计信息,例如:邮箱中的邮件数量和邮件占用的字节大小等。 |
uidl<SP>msg#<CRLF> | uidl 命令用于查询某封邮件的唯一标志符,参数msg#表示邮件的序号,是一个从1开始编号的数字。 |
list<SP>[MSG#]<CRLF> | list 命令用于列出邮箱中的邮件信息,参数 msg#是一个可选参数,表示邮件的序号。当不指定参数时,POP3服务器列出邮箱中所有的邮件信息;当指定参数msg#时,POP3服务器只返回序号对应的邮件信息。 |
retr<SP>msg#<CRLF> | retr 命令用于获取某封邮件的内容,参数 msg#表示邮件的序号。 |
dele<SP>msg#<CRLF> | dele 命令用于在某封邮件上设置删除标记,参数msg#表示邮件的序号。POP3服务器执行dele命令时,只是为邮件设置了删除标记,并没有真正把邮件删除掉,只有POP3客户端发出quit命令后,POP3服务器才会真正删除所有设置了删除标记的邮件。 |
rest<CRLF> | rest 命令用于清除所有邮件的删除标记。 |
top<SP>msg#<SP>n<CRLF> | top 命令用于获取某封邮件的邮件头和邮件体中的前n行内容,参数msg#表示邮件的序号,参数n表示要返回邮件的前几行内容。使用这条命令以提高 Web Mail系统(通过Web站点上收发邮件)中的邮件列表显示的处理效率,因为这种情况下不需要获取每封邮件的完整内容,而是仅仅需要获取每封邮件的邮件头信息。 |
noop<CRLF> | noop 命令用于检测POP3客户端与POP3服务器的连接情况。 |
quit<CRLF> | quit 命令表示要结束邮件接收过程,POP3服务器接收到此命令后,将删除所有设置了删除标记的邮件,并关闭与POP3客户端程序的网络连接。 |
对于POP3客户程序发送的每一条POP3命令,POP3服务器都将回应一些响应信息。响应信息由一行或多行文本信息组成,其中的第一行始终以“+OK” 或 “-ERR” 开头,它们分别表示当前命令执行成功或执行失败。
三、IMAP协议
- IMAP具有摘要浏览功能,可以让用户在读完所有邮件的主题、发件人、大小等信息后,再由用户做出是否下载或直接在服务器上删除的决定。
- IMAP可以让用户有选择性地下载邮件附件。例如一封邮件包含3个附件,如果用户确定其中只有2个附件对自已有用,就可只下载这2个附件,而不必下载整封邮件,从而节省了下载时间。
- IMAP可以让用户在邮件服务器上创建自己的邮件夹,分类保存各个邮件。
四、MIME协议
早期人们在使用电子邮件时,都是使用普通文本内容的电子邮件内容进行交流,由于互联网的迅猛发展,人们已不满足电子邮件仅仅是用来交换文本信息,而希望使用电子邮件来交换更为丰富多彩的多媒体信息,例如,在邮件中嵌入图片、声音、动画和附件等二进制数据。但在以往的邮件发送协议RFC822文档中定义,只能发送文本信息,无法发送非文本的邮件,针对这个问题,人们后来专门为此定义了MIME(Multipurpose Internet Mail Extension,多用途Internet邮件扩展)协议。
MIME协议用于定义复杂的邮件体格式,它可以表达多段平行的文本内容和非文本的邮件内容,例如,在邮件体中内嵌的图像数据和邮件附件等。另外,MIME协议的数据格式也可以避免邮件内容在传输过程发生信息丢失。对于表示某个具体资源的MIME消息,它的消息头中需要指定资源的数据类型;对于MIME组合消息,它的消息中需要指定组合关系。具体资源的数据类型和组合消息的组合关系,都是通过消息头中的Content-Type头字段来指定的。Content-Type字段中的内容以“主类型/子类型”的形式出现,主类型有text、image、audio、video、application、multipart、message等,分别表示文本、图片、音频、视频、应用程序、组合结构、消息等。每个主类型下面都有多个子类型,例如text类型包含plain、html、xml、css等子类型。multipart主类型用于表示MIME组合消息,它是MIME协议中最重要的一种类型。一封MIME邮件中的MIME消息可以有三种组合关系:混合、关联、选择,它们对应MIME类型如下:
- multipart/mixed
- multipart/related
- multipart/alternative
了解更多MIME协议的细节,请参考《张孝祥JAVA邮件开发详解》第三章 邮件的组织结构,第2小节 MIME协议