Jsoup加载HTML的三种方式,上一篇说的只是一种方式,直接从HTTP源网站获取。从字符串解析来自用户输入,一个文件或一个网站的HTML字符串,你可能需要对它进行解析并取其内容,或校验其格式是否完整,或想修改它。String html = "<html><head><title>F......查看详细
jsoup是一款Java的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。解析XML和解析JSON大家都已经在程序中使用很多了,解析HTML也是一个意思,就是用法不同而已。这里实用jsoup来解析我自己的博客,抓取博客首页的标题列表并打印,该程序为......查看详细
Pinyin4j是一个流行的Java库,支持中文字符和拼音之间的转换。拼音输出格式可以定制。Support Chinese character (both Simplified and Tranditional) to most popular Pinyin systems, including Hanyu Pinyin, Tongyong Pinyin, ......查看详细
一、Log4j简介Log4j有三个主要的组件:Loggers(记录器),Appenders (输出源)和Layouts(布局)。这里可简单理解为日志类别,日志要输出的地方和日志以何种形式输出。综合使用这三个组件可以轻松地记录信息的类型和级别,并可以在运行时控制日志输出的样式和位置。1、LoggersLoggers组件在此系统中被分为五个级别:DEBUG、IN......查看详细
Tomcat安装和配置自行解决。官方网站:https://lucene.apache.org/solr/ 。本人下载了solr-4.10.4版本,下载解压后打开example目录,内有示例程序,参照其README.txt可以直接实用jetty运行,用工具导入数据。运行,打开命令窗口,在该目录下执行:java -jar start......查看详细
以下是一个参考的连接池配置:通常来说,只需要修改initialSize、minIdle、maxActive。如果用Oracle,则把poolPreparedStatements配置为true,mysql可以配置为false。分库分表较多的数据库,建议配置为false。<bean id="dataSource" c......查看详细
使用Druid数据库连接池,然后实用SpringMVC和JSP来从数据库读取一些数据出来。我们要引用那些Lib包,这里实用Maven配置,注意JSP中使用到了JSTL,我直接在Eclipse里面引用的。如果大家有哪些Maven的引用不知道怎么写,可以从http://mvnrepository.com 查看相应的Maven配置。<project......查看详细
需要什么?Zookeeper,如果在Linux上安装就参考(http://www.javacui.com/opensource/445.html )。如果在Windows上,新版本可以直接在Windows运行,只需修改zoo.cfg配置文件即可。如何设计之所以用Dubbo,就是为了应付团队模块开发,所以这里会有两个工程,服务和使用。服务者要提供接......查看详细
Java小强
未曾清贫难成人,不经打击老天真。
自古英雄出炼狱,从来富贵入凡尘。