17370845950

.NET的DataSet.ReadXml()方法怎么读取复杂XML
DataSet.ReadXml() 能读取复杂 XML,但需符合 ADO.NET 隐式关系规则,否则易丢数据、建错表或抛异常;关键在于 XML 是否能映射为规范的 DataTable/DataRelation 结构,依赖明确的行元素、稳定嵌套层级与命名一致性。

DataSet.ReadXml() 能读取复杂 XML,但前提是 XML 结构符合 ADO.NET 的“隐式关系”规则,否则会丢数据、建错表,甚至抛异常。关键不是 XML 多“复杂”,而是它是否能映射成规范的 DataTable / DataRelation 层级结构。

XML 必须有明确的“行元素”和“嵌套层级”

ReadXml 默认按元素名推断表名,靠嵌套关系推断父子表。例如:

  • 根元素下的直接子元素(如 )会被当成主表
  • 主表元素内的子元素(如 ...)会被识别为子表,前提是子元素名是复数且内含同名单数项
  • 元素必须有稳定结构:同一层级下不能混用不同结构的同名元素(比如有的 Price,有的没有,容易导致列缺失或类型冲突)

遇到命名不规范?先用 XmlReadMode 指定模式

默认行为(XmlReadMode.Auto)容易误判。更可控的做法是:

  • XmlReadMode.ReadSchema:要求 XML 内嵌 XSD,显式定义表结构和关系(最可靠)
  • XmlReadMode.InferSchema:让 .NET 基于样本数据推断结构(适合测试,但首几条数据决定列类型,后续类型不一致会出错)
  • 避免 Auto——它可能把本该是属性的字段当元素,或忽略嵌套

深层嵌套/同名多层?手动预处理更稳

如果 XML 是类似 ... 这种扁平嵌套,ReadXml 可能只生成一层表。这时建议:

  • XDocumentXmlDocument 先提取关键片段,再分批 Load 到 DataSet 的不同 DataTable
  • DataSet.ReadXmlSchema() 单独加载 XSD,再用 ReadXml(xmlStream, XmlReadMode.ReadSchema) 保证结构对齐
  • 对含属性+文本混合的节点(如 99.99),ReadXml 默认忽略属性——需在 XSD 中声明 xs:attribute 并启用 ReadSchema

验证结果:别只看 Tables.Count

读完后务必检查:

  • ds.Relations.Count 是否等于预期的父子关系数
  • 每个 DataTable.Columns 是否包含所有字段(尤其注意大小写、空格、特殊字符是否被转义成 _x0020_)
  • 执行 ds.GetXmlSchema() 看生成的 XSD 是否合理——这是调试隐式推断的最快方式

基本上就这些。复杂 XML 不一定难读,难的是让它“说人话”:结构清晰、命名一致、嵌套合理。必要时宁可多写几行预处理,也别赌 ReadXml 的自动推断。