经常使用正则表达式—邮箱(Email)

经常使用正则表达式—邮箱(Email)

 本文针对有一点正则基础的同窗,若是你对正则一无所知,请移步“正则表达式30分钟入门教程”学习。html

 要验证一个字符串是否为邮箱的话,首先要了解邮箱帐号的格式。我尝试过在网上找出一个标准的格式,可是很遗憾我没有找到。我也尝试使用RFC标准来判断邮箱的格式,可是也没有结果。网上些博客说不该该使用RFC标准来验证邮箱是否合法,有兴趣的能够看看“is this email valid?”和“Don’t RFC-Validate Email Addresses”。据了解【参考】,如今用中文命名的邮箱也合法了,好比“杨元庆@联想.中国”。正则表达式

 虽然没有统一的邮箱帐号格式,可是全部邮箱都符合“名称@域名”的规律。对于名称和域名的字符限制,咱们能够根据项目的状况定义一个,好比只容许有英文、数字、下划线等组成。下面举例实现一些验证邮箱格式的正则表达式。 

学习

实例一、只容许英文字母、数字、下划线、英文句号、以及中划线组成

举例:zhangsan-001@gmail.com 
分析邮件名称部分:this

  • 26个大小写英文字母表示为a-zA-Z
  • 数字表示为0-9
  • 下划线表示为_
  • 中划线表示为-
  • 因为名称是由若干个字母、数字、下划线和中划线组成,因此须要用到+表示屡次出现

 根据以上条件得出邮件名称表达式:[a-zA-Z0-9_-]+ 


分析域名部分:.net

 通常域名的规律为“[N级域名][三级域名.]二级域名.顶级域名”,好比“qq.com”、“www.qq.com”、“mp.weixin.qq.com”、“12-34.com.cn”,分析可得域名相似“** .** .** .**”组成。code

  • “**”部分能够表示为[a-zA-Z0-9_-]+
  • “.**”部分能够表示为\.[a-zA-Z0-9_-]+
  • 多个“.**”能够表示为(\.[a-zA-Z0-9_-]+)+

 综上所述,域名部分能够表示为[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+htm

最终表达式: 
 因为邮箱的基本格式为“名称@域名”,须要使用“^”匹配邮箱的开始部分,用“$”匹配邮箱结束部分以保证邮箱先后不能有其余字符,因此最终邮箱的正则表达式为: 
  ^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$blog

 

实例二、名称容许汉字、字母、数字,域名只容许英文域名

举例:杨元庆001Abc@lenovo.com.cn教程

分析邮件名称部分:字符串

  • 汉字在正则表示为[\u4e00-\u9fa5]
  • 字母和数字表示为A-Za-z0-9 
     经过分析得出邮件名称部分表达式为[A-Za-z0-9\u4e00-\u9fa5]+

分析邮件域名部分

 邮件部分能够参考实例1中的分析域名部分。 
 得出域名部分的表达式为[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+

最终表达式: 
 咱们用@符号将邮箱的名称和域名拼接起来,所以完整的邮箱表达式为 
  ^[A-Za-z0-9\u4e00-\u9fa5]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$

相关文章
相关标签/搜索