Go语法简略 - 正则表达式

正则表达式Regular Expression(简写regexp或者RE)使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。用法灵活,设计完善,是值得研究的一门技术。多数流行的语言,都支持正则表达式,且用法类似。像这种一处学习,处处可用的东西,值得大家深入研究。然而对我来说,需要的时候查查就行了。

对于像Duck这种Web框架来说,灵活的处理URL是基本需求,这种场景,使用正则表达式再合适不过了。

Go中的regexp

Go的正则表达式在regexp包中实现。基本上只需要熟练掌握以下的方法,就基本上会用了。

MatchString
Regexp.FindAllString
Regexp.FindAllStringSubmatch
Regexp.FindAllStringSubmatchIndex
Regexp.FindString
Regexp.FindStringIndex
Regexp.FindStringSubmatch
Regexp.ReplaceAllLiteralString
Regexp.ReplaceAllString
Regexp.ReplaceAllStringFunc
Regexp.SubexpNames

以下通过例子简要熟悉一下regexp包的用法:

package main

import (
  "fmt"
  "regexp"
)

func main() {
  // 1. MatchString(pattern, string): 用指定的regexp匹配你的字符串
  matched, err := regexp.MatchString("zdd", "zddhub")
  fmt.Println(matched, err)
  //: true <nil>
  fmt.Println(regexp.MatchString("daniu.io", "daniu"))
  //: false
  fmt.Println(regexp.MatchString("a(b", "seafood")) // 正则表达式不正确时报错
  //: false error parsing regexp: missing closing ): `a(b`

  // 2. regexp.FindAllString(string, int)[]string:
  re := regexp.MustCompile("d.")
  fmt.Println(re.FindAllString("daniu.io-zddddd", -1)) // -1,find全部的匹配项
  //: [da dd dd]
  fmt.Println(re.FindAllString("daniu.io-zdd-zddd", 2)) // find配置的2项
  //: [da dd]
  fmt.Println(re.FindAllString("nil", -1))
  //: []

  // 3.FindAllStringSubmatch(s string, n int) [][]string:
  re = regexp.MustCompile("z(d*)hub")
  fmt.Println(re.FindAllStringSubmatch("zddhub", -1))
  //: [[zddhub dd]]
  fmt.Println(re.FindAllStringSubmatch("zdddhub-zdddddhub", -1))
  //: [[zdddhub ddd] [zdddddhub ddddd]]
  fmt.Printf("%q\n", re.FindAllStringSubmatch("zdddhub-zdddddhub", -1))
  //: [["zdddhub" "ddd"] ["zdddddhub" "ddddd"]]

  // 4.FindAllStringSubmatchIndex
  fmt.Println(re.FindAllStringSubmatchIndex("zddhub", -1))
  //: [[0 6 1 3]]
  fmt.Println(re.FindAllStringSubmatchIndex("zdddhub-zdddddhub", -1))
  //: [[0 7 1 4] [8 17 9 14]]

  // 5.FindString
  re = regexp.MustCompile("xx.?")
  fmt.Println(re.FindString("zddhub-xx-zddhub-xxdd"))
  //: xx-
  fmt.Printf("%q\n", re.FindString("zddhub"))
  //: ""

  // 6.FindStringIndex
  fmt.Println(re.FindStringIndex("zddhub-xx-zddhub-xxdd"))
  //: [7 10]
  fmt.Printf("%q\n", re.FindStringIndex("zddhub"))
  //: []

  // 7. FindStringSubmatch
  re = regexp.MustCompile("z(d*)h(u)b")
  fmt.Printf("%q\n", re.FindStringSubmatch("-zdddhub-"))
  //: ["zdddhub" "ddd" "u"]
  fmt.Printf("%q\n", re.FindStringSubmatch("-zdhub-"))
  //: ["zdhub" "d" "u"]

  // 8.ReplaceAllLiteralString(src, repl string) string
  fmt.Printf("%q\n", re.ReplaceAllLiteralString("-zdddhub-bb", "xx"))
  //: "-xx-bb"
  fmt.Println(re.ReplaceAllLiteralString("-xxzdhubxx-zddhub-ddd", "$1")) // 使用$1替换
  //: -xx$1xx-
  fmt.Println(re.ReplaceAllLiteralString("-xxzdhubxx-zddhub-ddd", "${1}"))
  //: -xx${1}xx-

  // 9.ReplaceAllString
  re = regexp.MustCompile("a(x*)b")
  fmt.Println(re.ReplaceAllString("-ab-axxb-", "T"))
  //: -T-T-
  fmt.Println(re.ReplaceAllString("-ab-axxb-", "$1")) //$i代表配置的子串
  //: --xx-
  fmt.Println(re.ReplaceAllString("-ab-axxb-", "$1W"))
  //: ---
  fmt.Println(re.ReplaceAllString("-ab-axxb-", "${1}W"))
  //: -W-xxW-

  fmt.Printf("%q\n", re.FindAllStringSubmatch("-ab-axxb-", -1))
  //: [["ab" ""] ["axxb" "xx"]]
  // $0代表配置的串,$1代表组串,括号内的串
  fmt.Println(re.ReplaceAllString("-ab-axxb-", "$0"))
  //: -ab-axxb-
  fmt.Println(re.ReplaceAllString("-ab-axxb-", "$1"))
  //: --xx-
  fmt.Println(re.ReplaceAllString("-ab-axxb-axxxb-", "$2"))
  //: ----

  // 10.ReplaceAllStringFunc(src string, repl func(string) string) string通过函数的返回值替换
  fmt.Println(re.ReplaceAllStringFunc("-ab-axxb", func(m string) string {
    return fmt.Sprintf("==%q==", m)
  }))
  //: -=="ab"==-=="axxb"==

  // 11.SubexpNames() []string
  re = regexp.MustCompile("(?P<first>[a-zA-Z]+) (?P<last>[a-zA-Z]+)")
  fmt.Println(re.MatchString("zddhub opensse"))
  //: true
  fmt.Printf("%q\n", re.SubexpNames())
  //: ["" "first" "last"]
  reversed := fmt.Sprintf("${ %s} ${ %s}", re.SubexpNames()[2], re.SubexpNames()[1])
  fmt.Println(reversed)
  //: ${last} ${first}
  fmt.Println(re.ReplaceAllString("zddhub opensse", reversed))
  //: opensse zddhub
}

操作就是这样了,至于正则表达式的写法,就看你的水平了,推荐一个入门教程:正则表达式30分钟入门教程

正则表达式匹配URL

URL由三部分组成:协议类型、主机名和路径及文件名。其语法如下:

scheme://[user:password@]domain:port/path?query_string#fragment_id

在服务器端,需要对URL进行解析,选用合适的路由器来处理客户端请求。有兴趣的话,可以研究一下Duck框架对路由的匹配

如果你喜欢这篇文章,欢迎赞赏作者以示鼓励