regular expression (如何用Sed和正则表达式提取子字符串)

时间 2019-11-12

标签 regular expression 如何 sed 正则表达式提取字符串栏目 Linux 繁體版

原文原文链接

echo "mv u3_yunying.war u3_yunying.war_`date +%Y%m%d%H%M`" | sed "s/$mv$ $\w*.war$ $\w*.war_\w*$/\1/g"git

echo "mv u3_yunying.war u3_yunying.war_`date +%Y%m%d%H%M`" | sed "s/$mv$ $\w*.war$ $\w*.war_\w*$/\1 \2 \/tmp\/\3/g"

正则表达式

echo "mv a1_a.war" | sed "s/$mv$ $\w$/\2/g"

express

echo "tar -zcvf tomcat" | sed "s/tar\ -zcvf\ /tar\ -zcvf\ \/tmp\//g"tomcat

echo "tar -zcvf tomcat" |sed 's/$tar$ $-zcvf$ $[a-zA-Z]\+$/\3/g'
this

如何用Sed和正则表达式提取子字符串字符串

如今有以下一串字符串：string

"asdfkjasldjkf"shiner"dfit

需求：io

须要提取出shiner子字符串。扩展

命令以下：

[root@localhost /]$ echo "asdfkjasldjkf\"shiner\"df" | sed 's/$.*$"$.*$"$.*$/\2/g'

shiner

命令解释

s：表示替换命令

$.*$" : 表示第一个引号前的内容

"$.*$"：表示两引号之间的内容

)"$.*$：表示引号后的内容

\2: 表示第二对括号里面的内容

括号里的表达式匹配的内容，能够用\1，\2等进行引用，第n个括号对内的内容，就用\n引用。

这个命令的意思是：

用\2表明的第二个括号的内容（shiner）去替换整个字符串，这样就获得了咱们所须要的子字符串了。

sed命令能够替换给定文本中的字符串。它能够利用正则表达式进行匹配。

$ sed ‘s/pattern/replace_string/’ file

Sed命令也能够从stdin中读取输入，如：

$ cat file | sed ‘s/pattern/replace_string/’

使用-i选项，sed能够将替换结果应用于原文件，如：

$ sed –i ‘s/text/replace/’ file

以上sed命令会将每一行中第一处符合样式的内容替换掉，若是要替换每一行中的全部内容，可在命令尾部加上参数g，如：

$ sed ‘s/pattern/replace_string/g’ file

选项/Ng能够忽略前N-1处匹配，并从第N处开始替换，如：

$echo thisthisthisthis | sed ‘s/this/THIS/3g’

thisthisTHISTHIS

字符/在sed命令中做为定界符使用，其实任意字符均可以看成定界符，如：

$ sed ‘s:text:replace:g’

$ sed ‘s|text|replace|g’

当定界符出如今样式内部时，咱们必须使用前缀\对它进行转义。

/pattern/d会移除匹配样式的行，咱们能够利用这个移除文件空白行：

$ sed ‘/^$/d’ file

在sed中，用&标记匹配样式的字符串，例如：

$ echo this is an example | sed ‘s/\w\+/[&]/g’

[this] [is] [an] [example]

正则表达式\w\+匹配每个单词，&对应于以前所匹配到的单词。

Sed命令也能够匹配给定样式中的子串。$pattern$用于匹配子串。模式被包括在使用斜线转义过的()中。对于匹配到的第一个子串，其对应的标记是\1，匹配到的第二个子串是\2，日后依次类推。例：

$ echo this is digit 7 in a number | sed ‘s/digit $[0-9]$/\1/’

This is 7 in a number

这条命令将digit 7替换为7。样式中匹配到的子串是7。下面是包含多个匹配的例子：

$ echo seven EIGHT | sed ‘s/$[a-z]\+$ $[A-Z]\+$/\2 \1/’

EIGHT seven

([a-z]\+\)匹配第一个单词，([A-Z]\+\)匹配第二个单词，\1和\2用来引用它们。

Sed命令还能够组合多个表达式，如利用管道组合多个sed命令的方法能够用如下方式代替：

$ sed ‘expression1’ | sed ‘expression2’

这等价于

$ sed ‘expression1; expression2’

Sed表达式一般用单引号来引用。不过也可使用双引号。双引号会经过对表达式求值来对其进行扩展，例如：

$ text=hello

$ echo hello world | sed “s/$text/HELLO/”

HELLO world

Sed应用（我工做中碰到的问题）：

应用1：有这样一个文件，每行的格式为：

type1=value1 type2=value2 type3=value3…

其中type类型个数未知，每种type之间以’\t’隔开，要求提取出=右边的value，输出格式为：

value1 value2 value3…

value之间以’\t’隔开。

解决方案：用sed语句将=左边的字符替换成空串。

$sed –r ‘s/[^\t]*://g’ file

其中-r选项表示使用扩展的正则表达式

应用2：有这样一个文件，每行的格式为：

{type}:value t3 t4…

其中value与t之间以’\t’隔开，要求将type和value提取出来，输出格式为：

type value t3 t4…

各数据之间以’\t’隔开。

解决方案：用sed语句将{type}:替换为type\t，使用子串替换的方法。

$ sed ‘s/{$\w\+$}:/\1\t/g’ file