java Apache solr如何索引不同的文件
我研究了ApacheLucene并发现,直到我们使用任何一个字段存储字段为止。百货商店是或存储字段,我们无法检索当前命中的特定字段
现在在ApacheSolr中,我们只使用以下命令发布用于索引的数据
java-Durl=http://“localhost”:8080/solr/update-jarpost。jar*。xml
现在我的问题是solr是解析xml文件中的每个文件并存储它,还是简单地索引整个文件而不存储它
在搜索了一点之后,我了解了schema。指定是否存储字段的xml
现在我想知道如何对桌面应用程序执行相同的操作,这样就不需要指定存储。提出。每行都是
# 1 楼答案
根据您对@bmargules提供的答案的评论,对于桌面应用程序,您可以使用EmbeddedSolr或直接使用Lucene管理索引。在两者之间,我推荐EmbeddedSolr,因为Solr是Lucene的最佳实践实现
# 2 楼答案
答案完全取决于Solr模式的内容。xml。Solr将只存储该文件中定义的字段,该文件中的字段定义指定您引用的Lucene参数。如果在
<field/>
或<dynamicField/>
元素中没有调用字段,Solr会记录一个错误;它根本不会存储或索引它。因此,必须考虑模式中的所有字段Solr还可以在其其他配置文件中定义“更新请求处理器”,以执行额外的数据预处理