gokogiri 默认不自动处理默认命名空间(xmlns="..."),需显式注册命名空间前缀并用于 xpath 表达式,否则搜索将返回空结果。
在使用 github.com/moovweb/gokogiri 解析带命名空间的 XML 时,一个常见误区是认为 doc.SetNamespace("", "http://example.com/this") 或尝试调用不存在的 RegisterNamespace 方法即可生效。实际上,gokogiri 的 XML 命名空间支持依赖于底层 libxml2 的 XPath 上下文(XPath context),必须通过 doc.DocXPathCtx() 获取上下文对象,并在其上调用 RegisterNamespace(prefix, uri) 才能正确绑定命名空间。
关键点如下:
以下是可直接运行的完整示例:
package main
import (
"fmt"
"github.com/moovweb/gokogiri"
"github.com/moovweb/gokogiri/xpath"
)
func main() {
xml := `thisthat `
doc, err := gokogiri.ParseXml([]byte(xml))
if err != nil {
panic(err)
}
defer doc.Free()
// ✅ 步骤 1:获取 XPath 上下文并注册命名空间(前缀可自定义,如 "ns")
ctx := doc.DocXPathCtx()
ctx.RegisterNamespace("ns", "http://example.com/this")
// ✅ 步骤 2:编写带前缀的 XPath 表达式
expr := xpath.Compile("/ns:NodeA/ns:NodeB")
// ✅ 步骤 3:执行搜索
nodes, err := doc.Search(e
xpr)
if err != nil {
fmt.Printf("XPath error: %v\n", err)
return
}
// 输出匹配节点内容
for i, node := range nodes {
fmt.Printf("%d: %s\n", i, node.Content())
}
}输出结果:
0: thisthat
⚠️ 注意事项:
掌握命名空间的显式注册与前缀化 XPath 是使用 gokogiri 处理真实世界 XML(如 SOAP、Atom、RSS、Office Open XML)的关键基础。