基于lucene的案例开发：创建索引

从这篇博客开始，不论是API介绍还是后面的案例开发，都是基于 lucene4.3.1 这个版本，Lucene4.3.1 下载请点击这里， Lucene其他版本下载请点击这里，Lucene4.3.1官方API文档请点击这里。

创建索引demo

在开始介绍之前，先看一个简单的索引创建demo程序：

*@Description: 索引创建demo args analyzer LUCENE_43 indexWriterConfig LUCENE_43 analyzer indexWriterConfigCREATE_OR_APPEND directory indexWrite directory directory directory indexWrite directory indexWriterConfig e e doc1 doc1 YES doc1 YES indexWritedoc1 e e doc2 doc2 YES doc2 YES indexWritedoc2 e e indexWrite indexWrite directory e e

在上述的程序中，已做了详细的注释，对每一条语句的作用就不再介绍，下面就看一下执行这个main函数之后创建的索引文件，如下图：

通过索引查看工具 luke 可以简单的看下索引中的内容，如下图：

从上面两张图，我们可以看出索引中一共有两个文档，content域有50个词，name域有18个词，索引中存储了文档的详细信息。

创建索引核心类

在上述创建索引过程中，用到了几个核心类：IndexWriter、Directory、Analyzer、Document、Field。

IndexWriter

IndexWriter(写索引)是索引过程中的核心组件，这个类负责创建新的索引或打开已有的索引以及向索引中添加、删除、更新被索引的文档信息；IndexWriter需要开辟一定空间来存储索引，该功能可以由Directory完成。

Directory

Directory类描述了Lucene索引的存放位置。它是一个抽象类，它的子类负责指定索引的存储路径，在前面的例子中，我们用的是FSDirectory.open方法来获取真实文件在文件系统中的存储路径，然后将他们依次传递给IndexWriter类构造方法。

Analyzer

文档信息在被索引之前需要经过Analyzer（分析器）处理，上述例子中使用的是标准分词，在以后的博客中会单独介绍各种分词器以及使用场景。

Document