- 浏览: 43912 次
最新评论
文章列表
Java调用DOS命令
- 博客分类:
- java基础
public static void main(String[] args) {
InputStream ins = null;
//&&可以执行多条命令
//路径参数注意 要么\\ or /
// String[] cmd = new String[] { "cmd.exe","/C","cd /d E:/1&&java com.stx.frame.TestCmd"};
...
CharTokenizer的简单学习
- 博客分类:
- lucene
一、关系
AttributeSource→TokenStream→Tokenizer
↓
TokenFilter
=============================================
Analyzer中的一个抽象方法是
//属性
private final ReuseStrategy reuseStrategy;
========================================
//TokenStr ...
一、简单介绍
Attribute接口是一个空接口;
AttributeImpl也继承Attribute接口;
根据源码是:记录对象的属性,但是不包含静态属性
对于一些属性是Attribute是接口,然后AttributeImpl去实现接口。
例如:OffsetAttribute 和 OffsetAttributeImpl
二、简单源码分析
public abstract class AttributeImpl impleme ...
AttributeSource内容简答分析
- 博客分类:
- lucene
一、AttributeImpl通过AttributeSource得到自己的属性和对应的值
//静态的final方法得到一个WeakIdentityMap<k,v> k=impl v=list<attribute>
private static final WeakIdentityMap<Class<? extends AttributeImpl>,LinkedList<WeakReference<Class<? extends A ...
Java的Enum类型
- 博客分类:
- java基础
没注意到一直以为java的enum只是简单的数字表示跟C一样,
没想到可以和类一样
转载:http://wosyingjun.iteye.com/blog/1895381
------------------------------------------------------------------------------------------------------
1、enum的遍历和基本方法
package yingjun.enumeration;
enum Shrubbery { GROUND, CRAWLING, HANGING }
pu ...
- 2013-06-30 23:33
- 浏览 748
- 评论(0)
一、对于处理方式的分类
字节流
字符流
输入流
InputStream
Reader
输出流
OutputStream
Writer
二、字节流
1.InputStream的API
read() //从输入流中读取下一个字节。返回0-255,结尾返回-1
read(byte[]) //返回从输入流中读取的字节数,文件末尾返回-1;byte的长度0返回0
read(byte[],off,len)//读取长度<=len,off为byte中的位置byte[of ...
以后把这当做一个小知识库吧。
一、垃圾回收相关
关于垃圾回收先关的两个类:WeakReference与SoftReference都可以用来保存对象的实例引用。
到跟了再细看吧。先放下
二、反射的基础
反射详解
三、断言assert
一、文档中的代码修改下Filter:
Directory dir=FSDirectory.open(new File("E:\\lucene\\test_lucene\\index"));
IndexReader r=DirectoryReader.open(dir);
//IndexSearcher search=new IndexSearcher(r);
IndexSearcher searcher = new IndexSearcher(r);
Analyzer analyzer=new SmartChineseAnalyzer( ...
内容解析工具:TIKA
- 博客分类:
- lucene
一、TIKA是什么
它是这样的一个工具集:使用已有的各种解析库(parser libraries),从各种类型的文档中,探测、抽取其中的头数据(metadata)和结构化文本内容。
二、TIKA的作用
1.能识别文档类型、编码、语言、其他属性
2.抽取文档内容
三、获取TIKA
1.得到TIKA:http://tika.apache.org/download.html
要是不想不想重新打包项目,可以直接下载:tika-app-1.3. ...
Dom 解析XML文件
- 博客分类:
- java基础
一、引言
说起来学java好长时间了,却不会XML的解析,感觉好惭愧。由于要用到XML所以学习下怎么解析XML,百度了下发下JAVA下有好多方式去解析,在这就先学习下以DOM模式的解析。
W3C关于XML的DOM教程:http://w ...
设计模式----责任链模式
- 博客分类:
- 设计模式
一、前话
因为想要实现一个简单过滤的功能,又加上过滤的类别比较多。当时第一次写的时候我把方法里面写了好多个list参数,一次性实现过滤,但是感觉太凌乱了、感觉好别扭、并且额外添加一些过滤的修改也 ...
Lucene 扩展QueryParse
- 博客分类:
- lucene
一、QueryParser的功能扩展点
//通配符查询
protected Query getWildcardQuery(String field,String termStr) throws ParseException{
throw new ParseException("Wildcard not allowed");
}
//模糊查询
protected Query getFuzzyQuery(String field,String term,float minSimilarity) throws ParseExcept ...
Lucene匹配所有的信息Collector
- 博客分类:
- lucene
一、继承Collector接口实现这样的一个自定义类
public class TestCollectors extends Collector{
private Scorer socore;
//这个是否为有序排列的 ture可以接受无序排列
@Override
public boolean acceptsDocsOutOfOrder() {
return true;
}
//返回文档的ID编号 被执行很多次的根据匹配的文档数目。
@Override
public void collect(int arg0) ...
lucene跨度域查询(一)
- 博客分类:
- lucene
一、跨度域查询
基类是:SpanQuery
子类:SpantermQuery; //测试用的这个子类当然还有其他
二、测试
public class SpanTest {
Directory dir;
IndexWriter writer;
IndexReader reader;
IndexSearcher search;
String[] ceshi;
//初始化把索引存在内存中做测试
public void init() throws IOException{
dir=n ...
Lucene的简单查询(二)
- 博客分类:
- lucene
一、查询
1.查询的基本方法
search.search(query, results)
search.search(query, n)
search.search(query, filter, results)
search.search(query, filter, n)
search.search(query, n, sort)
search.search(query, filter, n, sort)
search.search(query, filter, n, sort, doDocSco ...