Java小强个人技术博客站点    手机版
当前位置: 首页 >> 时间 2016年06月

mmseg4j中的MMSeg4jHandler,动态加载词库

1033811 开源 | 2016-6-22 21:47
mmseg4j 1.8 中有词库变化检测功能,新加载词库后,很有可能此时的分词(搜索时)与索引不对应了。所以要有个机制让重新做索引。这里使用最简单的方式,就是被动式的加载词库。由外围的程序去决定什么时候更新词库,然后也由外围的程序决定重做索引与否。比如可以写个 shell 脚本放到 crontab 里。按 solr 的理念——用 url 方式去通知 mmse......查看详细

MySQL的create table as 与 like区别

123260 DB | 2016-6-22 14:41
对于MySQL的复制相同表结构方法,有create table as 和create table like 两种,区别是什么呢?create table t2 as select * from t1 where 1=2;或者 limit 0;as创建出来的t2表(新表)......查看详细

Solr常用函数和实际使用

109160 开源 | 2016-6-22 14:17
ord对于一个域,它所有的值都将会按照字典顺序排列,这个函数返回你要查询的那个特定的值在这个顺序中的排名。这个域,必须是非multiValued的,当没有值存在的时候,将返回0.例如:某个特定的域只能去三个值,“apple”、“banana”、“pear”,那么ord(“apple”)=1,ord(“banana”)=2,ord(“pear”)=3.需要注意......查看详细

mysql参数max_allowed_packet

107160 DB | 2016-6-14 13:19
MySQL根据配置文件会限制server接受的数据包大小。有时候大的插入和更新会被max_allowed_packet参数限制掉,导致失败。如下是使用Navicat进行数据传输时报错内容:[Msg] [Dtf] DataTransfer started [Msg] [Dtf] Getting ta......查看详细

Jsoup加载HTML的三种方式

115391 开源 | 2016-6-13 20:28
Jsoup加载HTML的三种方式,上一篇说的只是一种方式,直接从HTTP源网站获取。从字符串解析来自用户输入,一个文件或一个网站的HTML字符串,你可能需要对它进行解析并取其内容,或校验其格式是否完整,或想修改它。String html = "<html><head><title>F......查看详细

jsoup入门示例程序(网络爬虫)

104752 开源 | 2016-6-13 17:09
jsoup是一款Java的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。解析XML和解析JSON大家都已经在程序中使用很多了,解析HTML也是一个意思,就是用法不同而已。这里实用jsoup来解析我自己的博客,抓取博客首页的标题列表并打印,该程序为......查看详细