hive 正则表达式 匹配中文

例如:要取出收件人 *的web

select regexp_extract('收件人为小明的15622150839','收件人为([\\u4E00-\\u9FFF]+)的',1 ) from tmp.t_gg  limit 1;
select regexp_extract('收件人为小明的15622150839','收件人为([啊-龥]+)的',0 ) from tmp.t_gg  limit 1;正则表达式

select regexp_extract('收件人为小明的15622150839','收件人为([\\u4E00-\\u9FA5]+)的',1 ) from tmp.t_gg  limit 1;app

若是要取出手机号码函数

select regexp_extract('你好,李先生你的电话是15622150839','电话是([0-9])+',0 ) from tmp.t_gg  limit 1;spa

regexp_extract函数regexp

 

语法:    regexp_extract(string subject,  string pattern,  int index)orm

返回值: stringci

说明:  将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符。字符串

第一参数:   要处理的字段string

第二参数:    须要匹配的正则表达式

第三个参数:

  • 0是显示与之匹配的整个字符串
  • 1 是显示第一个括号里面的
  • 2 是显示第二个括号里面的字段
相关文章
相关标签/搜索