DataSet.ReadXml() 能读取复杂 XML,但需符合 ADO.NET 隐式关系规则,否则易丢数据、建错表或抛异常;关键在于 XML 是否能映射为规范的 DataTable/DataRelation 结构,依赖明确的行元素、稳定嵌套层级与命名一致性。
DataSet.ReadXml() 能读取复杂 XML,但前提是 XML 结构符合 ADO.NET 的“隐式关系”规则,否则会丢数据、建错表,甚至抛异常。关键不是 XML 多“复杂”,而是它是否能映射成规范的 DataTable / DataRelation 层级结构。
ReadXml 默认按元素名推断表名,靠嵌套关系推断父
子表。例如:
)会被当成主表- ...
)会被识别为子表,前提是子元素名是复数且内含同名单数项 有 Price,有的没有,容易导致列缺失或类型冲突)默认行为(XmlReadMode.Auto)容易误判。更可控的做法是:
XmlReadMode.ReadSchema:要求 XML 内嵌 XSD,显式定义表结构和关系(最可靠)XmlReadMode.InferSchema:让 .NET 基于样本数据推断结构(适合测试,但首几条数据决定列类型,后续类型不一致会出错)Auto——它可能把本该是属性的字段当元素,或忽略嵌套如果 XML 是类似 这种扁平嵌套,ReadXml 可能只生成一层表。这时建议:
XDocument 或 XmlDocument 先提取关键片段,再分批 Load 到 DataSet 的不同 DataTableDataSet.ReadXmlSchema() 单独加载 XSD,再用 ReadXml(xmlStream, XmlReadMode.ReadSchema) 保证结构对齐99.99 ),ReadXml 默认忽略属性——需在 XSD 中声明 xs:attribute 并启用 ReadSchema
读完后务必检查:
ds.Relations.Count 是否等于预期的父子关系数DataTable.Columns 是否包含所有字段(尤其注意大小写、空格、特殊字符是否被转义成 _x0020_)ds.GetXmlSchema() 看生成的 XSD 是否合理——这是调试隐式推断的最快方式基本上就这些。复杂 XML 不一定难读,难的是让它“说人话”:结构清晰、命名一致、嵌套合理。必要时宁可多写几行预处理,也别赌 ReadXml 的自动推断。