使用DOM组装和解析XML

2015-6-30 9819 0

文档对象模型（Document Object Model，简称DOM），是W3C组织推荐的处理可扩展标志语言的标准编程接口。Document Object Model的历史可以追溯至1990年代后期微软与Netscape的“浏览器大战”，双方为了在JavaScript与JScript一决生死，于是大规模的赋予浏览器强大的功能。微软在网页技术上加入了不少专属事物，计有VBScript、ActiveX、以及微软自家的DHTML格式等，使不少网页使用非微软平台及浏览器无法正常显示。DOM即是当时蕴酿出来的杰作。

优点：整个文档树在内存中，便于操作；支持删除、修改、重新排列等多种功能；缺点：将整个文档调入内存（包括无用的节点），浪费时间和空间；使用场合：一旦解析了文档还需多次访问这些数据；硬件资源充足（内存、CPU）。

不是你指定了OutputKeys.ENCODING，输出的XML文件就为UTF-8了，因为文件是以一定格式存放的操作系统硬盘的，你同时需要指定该文件的编码格式，否则可能出现乱码的问题。以下内容是推荐加上的：

PrintWriter pw = new PrintWriter(filePath, "utf-8");

还是解析那个XML文件：

<?xml version="1.0" encoding="utf-8"?>
<persons>
	<person>
		<name>java小强</name>
		<sex>man</sex>
		<age>30</age>
	</person>
	<person>
		<name>崔素强</name>
		<sex>man</sex>
		<age>26</age>
	</person>
</persons>

解析代码：

package com.test;

import java.io.PrintWriter;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.OutputKeys;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

/**
 * @说明 使用DOM组装和解析XML
 * @author cuisuqiang
 * @version 1.0
 * @since
 */
public class DomDemo{
	
	public static void main(String[] args) {
		DomDemo d = new DomDemo();
		String file = "C:\\p.xml"; // 文件存放位置
		d.createXml(file);
		d.parserXml(file);
	}

	/**
	 * 生成XML文件
	 * @param filePath 文件存放位置
	 */
	public void createXml(String filePath) {
		try {
			// 定义工厂 API，使应用程序能够从 XML 文档获取生成 DOM 对象树的解析器
			DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
			// 定义 API， 使其从 XML 文档获取 DOM 文档实例。使用此类，应用程序员可以从 XML 获取一个 Document
			DocumentBuilder builder = factory.newDocumentBuilder();
			// Document 接口表示整个 HTML 或 XML 文档。从概念上讲，它是文档树的根，并提供对文档数据的基本访问
			Document document = builder.newDocument();
			
			Element root = document.createElement("persons");
			document.appendChild(root);
			Element person = document.createElement("person");
			Element name = document.createElement("name");
			name.appendChild(document.createTextNode("java小强"));
			person.appendChild(name);
			Element sex = document.createElement("sex");
			sex.appendChild(document.createTextNode("man"));
			person.appendChild(sex);
			Element age = document.createElement("age");
			age.appendChild(document.createTextNode("30"));
			person.appendChild(age);
			root.appendChild(person);
			
			TransformerFactory tf = TransformerFactory.newInstance();
			// 此抽象类的实例能够将源树转换为结果树
			Transformer transformer = tf.newTransformer();
			DOMSource source = new DOMSource(document);
			transformer.setOutputProperty(OutputKeys.ENCODING, "utf-8");
			// 一个节点后换行，你可以设置为true，然后尝试解析看打印结果
			transformer.setOutputProperty(OutputKeys.INDENT, "yes");
			// 向文本输出流打印对象的格式化表示形式
			// 要保证你的文本输出后格式不乱码，打印对象需指定打印格式，以标记此文本支持的格式
			PrintWriter pw = new PrintWriter(filePath, "utf-8");
			// 充当转换结果的持有者，可以为 XML、纯文本、HTML 或某些其他格式的标记
			StreamResult result = new StreamResult(pw);
			transformer.transform(source, result);
			System.out.println("生成XML文件成功!");
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

	/**
	 * 解析XML
	 * @param filePath 文件位置
	 */
	public void parserXml(String filePath) {
		try {
			DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
			DocumentBuilder db = dbf.newDocumentBuilder();
			Document document = db.parse(filePath);
			// 接口提供对节点的有序集合的抽象，没有定义或约束如何实现此集合。DOM 中的 NodeList 对象是活动的
			// NodeList 中的项可以通过从 0 开始的整数索引进行访问
			NodeList xml = document.getChildNodes();
			for (int i = 0; i < xml.getLength(); i++) {
				Node roots = xml.item(i);
				NodeList persons = roots.getChildNodes();
				for (int j = 0; j < persons.getLength(); j++) {
					Node person = persons.item(j);
					NodeList pros = person.getChildNodes();
					for (int k = 0; k < pros.getLength(); k++) {
						Node item = pros.item(k);
						System.out.println(item.getNodeName() + ":" + item.getTextContent());
					}
				}
			}
			System.out.println("XML解析完毕");
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
}

结束。

上一篇: 免费开源的JS音乐播放器插件

下一篇: 使用SAX解析XML