¿Existe un método simple para analizar archivos XML en C #? ¿Entonces qué?
¿Existe un método simple para analizar archivos XML en C #? ¿Entonces qué?
Respuestas:
Que haría uso de LINQ to XML si estás en .NET 3.5 o superior.
Es muy simple. Sé que estos son métodos estándar, pero puedes crear tu propia biblioteca para lidiar con eso mucho mejor.
Aquí hay unos ejemplos:
XmlDocument xmlDoc= new XmlDocument(); // Create an XML document object
xmlDoc.Load("yourXMLFile.xml"); // Load the XML document from the specified file
// Get elements
XmlNodeList girlAddress = xmlDoc.GetElementsByTagName("gAddress");
XmlNodeList girlAge = xmlDoc.GetElementsByTagName("gAge");
XmlNodeList girlCellPhoneNumber = xmlDoc.GetElementsByTagName("gPhone");
// Display the results
Console.WriteLine("Address: " + girlAddress[0].InnerText);
Console.WriteLine("Age: " + girlAge[0].InnerText);
Console.WriteLine("Phone Number: " + girlCellPhoneNumber[0].InnerText);
Además, hay algunos otros métodos para trabajar. Por ejemplo, aquí . Y creo que no hay un mejor método para hacer esto; siempre debe elegirlo usted mismo, lo que sea más adecuado para usted.
InnerText
aquí obtiene el valor de ese nodo, concatenado con todos los valores de los nodos secundarios, ¿verdad? Parece una cosa extraña querer.
InnerText
simplemente devolverá el valor del nodo - que es lo que (y probablemente todos los demás leer esta pregunta) Estoy análisis del XML de encontrar en el primer lugar.
Use un buen esquema XSD para crear un conjunto de clases con xsd.exe y use un XmlSerializer
para crear un árbol de objetos a partir de su XML y viceversa. Si tiene pocas restricciones en su modelo, incluso podría intentar crear una asignación directa entre sus clases de modelo y el XML con los Atributos Xml *.
Hay un artículo introductorio sobre la serialización XML en MSDN.
Consejo de rendimiento: la construcción de un XmlSerializer
es costoso. Mantenga una referencia a su XmlSerializer
instancia si tiene la intención de analizar / escribir múltiples archivos XML.
Si está procesando una gran cantidad de datos (muchos megabytes), entonces desea usar XmlReader
para analizar el XML.
Todo lo demás ( XPathNavigator
, XElement
, XmlDocument
e incluso XmlSerializer
si se mantiene la gráfica completa objeto generado) resultará en uso de memoria alta y también un tiempo de carga muy lento.
Por supuesto, si necesita todos los datos en la memoria de todos modos, es posible que no tenga muchas opciones.
Uso XmlTextReader
, XmlReader
, XmlNodeReader
y el System.Xml.XPath
espacio de nombres. Y ( XPathNavigator
, XPathDocument
, XPathExpression
,XPathnodeIterator
).
Por XPath
lo general, facilita la lectura de XML, que es lo que podría estar buscando.
new XmlTextReader()
o new XmlTextWriter()
. Han quedado en desuso desde .NET 2.0. Uso XmlReader.Create()
o en su XmlWriter.Create()
lugar.
Recientemente, se me solicitó trabajar en una aplicación que implicaba el análisis de un documento XML y estoy de acuerdo con Jon Galloway en que el enfoque basado en LINQ to XML es, en mi opinión, el mejor. Sin embargo, tuve que cavar un poco para encontrar ejemplos utilizables, así que sin más preámbulos, ¡aquí hay algunos!
Cualquier comentario es bienvenido ya que este código funciona, pero puede que no sea perfecto y me gustaría obtener más información sobre cómo analizar XML para este proyecto.
public void ParseXML(string filePath)
{
// create document instance using XML file path
XDocument doc = XDocument.Load(filePath);
// get the namespace to that within of the XML (xmlns="...")
XElement root = doc.Root;
XNamespace ns = root.GetDefaultNamespace();
// obtain a list of elements with specific tag
IEnumerable<XElement> elements = from c in doc.Descendants(ns + "exampleTagName") select c;
// obtain a single element with specific tag (first instance), useful if only expecting one instance of the tag in the target doc
XElement element = (from c in doc.Descendants(ns + "exampleTagName" select c).First();
// obtain an element from within an element, same as from doc
XElement embeddedElement = (from c in element.Descendants(ns + "exampleEmbeddedTagName" select c).First();
// obtain an attribute from an element
XAttribute attribute = element.Attribute("exampleAttributeName");
}
¡Con estas funciones pude analizar cualquier elemento y cualquier atributo de un archivo XML sin ningún problema!
Si está utilizando .NET 2.0, pruebe XmlReader
y sus subclases XmlTextReader
, y XmlValidatingReader
. Proporcionan una forma rápida, liviana (uso de memoria, etc.), solo hacia adelante para analizar un archivo XML.
Si necesita XPath
capacidades, pruebe el XPathNavigator
. Si necesita todo el documento en memoria, intente XmlDocument
.
Además, puede usar el selector XPath de la siguiente manera (manera fácil de seleccionar nodos específicos):
XmlDocument doc = new XmlDocument();
doc.Load("test.xml");
var found = doc.DocumentElement.SelectNodes("//book[@title='Barry Poter']"); // select all Book elements in whole dom, with attribute title with value 'Barry Poter'
// Retrieve your data here or change XML here:
foreach (XmlNode book in nodeList)
{
book.InnerText="The story began as it was...";
}
Console.WriteLine("Display XML:");
doc.Save(Console.Out);
No estoy seguro de si existe la "mejor práctica para analizar XML". Existen numerosas tecnologías adecuadas para diferentes situaciones. La forma de usar depende del escenario concreto.
Usted puede ir con LINQ to XML , XmlReader
, XPathNavigator
o incluso expresiones regulares. Si elabora sus necesidades, puedo intentar darle algunas sugerencias.
Puede analizar el XML utilizando esta biblioteca System.Xml.Linq
. A continuación se muestra el código de muestra que utilicé para analizar un archivo XML
public CatSubCatList GenerateCategoryListFromProductFeedXML()
{
string path = System.Web.HttpContext.Current.Server.MapPath(_xmlFilePath);
XDocument xDoc = XDocument.Load(path);
XElement xElement = XElement.Parse(xDoc.ToString());
List<Category> lstCategory = xElement.Elements("Product").Select(d => new Category
{
Code = Convert.ToString(d.Element("CategoryCode").Value),
CategoryPath = d.Element("CategoryPath").Value,
Name = GetCateOrSubCategory(d.Element("CategoryPath").Value, 0), // Category
SubCategoryName = GetCateOrSubCategory(d.Element("CategoryPath").Value, 1) // Sub Category
}).GroupBy(x => new { x.Code, x.SubCategoryName }).Select(x => x.First()).ToList();
CatSubCatList catSubCatList = GetFinalCategoryListFromXML(lstCategory);
return catSubCatList;
}
Puede usar ExtendedXmlSerializer para serializar y deserializar.
Instalación Puede instalar ExtendedXmlSerializer desde nuget o ejecutar el siguiente comando:
Install-Package ExtendedXmlSerializer
Publicación por entregas:
ExtendedXmlSerializer serializer = new ExtendedXmlSerializer();
var obj = new Message();
var xml = serializer.Serialize(obj);
Deserialización
var obj2 = serializer.Deserialize<Message>(xml);
El serializador XML estándar en .NET es muy limitado.
ExtendedXmlSerializer puede hacer esto y mucho más.
ExtendedXmlSerializer admite .NET 4.5 o superior y .NET Core . Puede integrarlo con WebApi y AspCore.
Puede usar XmlDocument y para manipular o recuperar datos de los atributos puede Linq a clases XML.