golang正则子模式-局部匹配
# golang 正则子模式匹配-局部匹配
本文讲述 golang 中如何进行正则表达式的子模式匹配。运用子模式匹配可用于文本的抽取,在爬虫系统中会经常用到。
例如,我们想抽取资讯详情页地址https://toutiao.weaoo.com/detail/1080888_1.html中的资讯ID,即1080888,我们可以使用"正则表达式中的子模式匹配"功能,来提取出我们想要的文本。代码如下
submatchArr := regexp.MustCompile(`toutiao.weaoo.com/detail/(\d+)_\d+.html`).FindStringSubmatch("https://toutiao.weaoo.com/detail/1080888_1.html")
newsId := submatchArr[1]
fmt.Print(newsId)
注意: 第 1 个匹配到的是这个字符串本身,从第 2 个开始,才是我们想要抽取的内容。
上次更新: 2020-09-23 16:12:17