Java小强个人技术博客站点
当前位置: 首页 >> 开源

mmseg4j中的MMSeg4jHandler,动态加载词库

518317 开源 | 2016-6-22 21:47
mmseg4j 1.8 中有词库变化检测功能,新加载词库后,很有可能此时的分词(搜索时)与索引不对应了。所以要有个机制让重新做索引。这里使用最简单的方式,就是被动式的加载词库。由外围的程序去决定什么时候更新词库,然后也由外围的程序决定重做索引与否。比如可以写个 shell 脚本放到 crontab 里。按 solr 的理念——用 url 方式去通知 mmse......查看详细

Solr常用函数和实际使用

45170 开源 | 2016-6-22 14:17
ord对于一个域,它所有的值都将会按照字典顺序排列,这个函数返回你要查询的那个特定的值在这个顺序中的排名。这个域,必须是非multiValued的,当没有值存在的时候,将返回0.例如:某个特定的域只能去三个值,“apple”、“banana”、“pear”,那么ord(“apple”)=1,ord(“banana”)=2,ord(“pear”)=3.需要注意......查看详细

Jsoup加载HTML的三种方式

58112 开源 | 2016-6-13 20:28
Jsoup加载HTML的三种方式,上一篇说的只是一种方式,直接从HTTP源网站获取。从字符串解析来自用户输入,一个文件或一个网站的HTML字符串,你可能需要对它进行解析并取其内容,或校验其格式是否完整,或想修改它。String html = "<html><head><title>F......查看详细

jsoup入门示例程序

42851 开源 | 2016-6-13 17:09
jsoup是一款Java的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。解析XML和解析JSON大家都已经在程序中使用很多了,解析HTML也是一个意思,就是用法不同而已。这里实用jsoup来解析我自己的博客,抓取博客首页的标题列表并打印,该程序为......查看详细

中文转拼音,pinyin4j实用示例

47975 开源 | 2016-4-14 13:41
Pinyin4j是一个流行的Java库,支持中文字符和拼音之间的转换。拼音输出格式可以定制。Support Chinese character (both Simplified and Tranditional) to most popular Pinyin systems, including Hanyu Pinyin, Tongyong Pinyin, ......查看详细

Log4J日志配置详解

51922 开源 | 2016-3-15 13:18
一、Log4j简介Log4j有三个主要的组件:Loggers(记录器),Appenders (输出源)和Layouts(布局)。这里可简单理解为日志类别,日志要输出的地方和日志以何种形式输出。综合使用这三个组件可以轻松地记录信息的类型和级别,并可以在运行时控制日志输出的样式和位置。1、LoggersLoggers组件在此系统中被分为五个级别:DEBUG、IN......查看详细

Solr-在Tomcat上安装Solr

47471 开源 | 2016-3-11 14:33
Tomcat安装和配置自行解决。官方网站:https://lucene.apache.org/solr/ 。本人下载了solr-4.10.4版本,下载解压后打开example目录,内有示例程序,参照其README.txt可以直接实用jetty运行,用工具导入数据。运行,打开命令窗口,在该目录下执行:java -jar start......查看详细