solr批量写入索引（solr更新索引）-兴科数码

本篇目录：

1、(1)创建配置文件从solr的默认配置文件拷贝一份出来 (2)修改配置book/managed-schema 在根节点下面添加字段 (2)修改配置book/schema.xml 这里修改下其中的软硬提交方式。

2、Solr是一个独立的企业级搜索应用服务器，它对外提供类似于Web-service的API接口。用户可以通过http请求，向搜索引擎服务器提交一定格式的XML文件，生成索引；也可以通过Http Get操作提出查找请求，并得到XML格式的返回结果。

3、第一种方案，solr配置数据库，自动处理建索引。

4、数据查询分析：Hive的核心工作就是把SQL语句翻译成MR程序，可以将结构化的数据映射为一张数据库表，并提供HQL(HiveSQL)查询功能。Spark启用了内存分布数据集，除了能够提供交互式查询外，它还可以优化迭代工作负载。

1、第一种方案，solr配置数据库，自动处理建索引。

2、SOLR_HEAP=地512m地依据你的数据量，把它修改成更高，我这里改成4G，改完保存. 在windows下略有不同，需要修改solr.in.cmd文件中的这一行：set SOLR_JAVA_MEM=-Xms512m -Xmx512m同样把两个512m都修改成4G。

3、Elasticsearch 插入层面优化，如果瓶颈不在这块，而是在产生数据部分，比如 DB 或者 Hadoop 上，那么优化方向就需要改变下。同时，Elasticsearch 本身索引速度其实还是蛮快的，具体数据，我们可以参考官方的 benchmark 数据。

4、使用缓存：使用程序直接保存到内存中。或者使用缓存框架：用一个特定的类型值来保存，以区别空数据和未缓存的两种状态。

5、用事务。这样可以具有统一性。然后第一个表插入的时候调用那个能返回主键的方法。这样把返回的主键带入第二条SQL。或者写一个函数。直接到数据库里面操作插入去。

1、打开DataImportHandler页面去验证，是否该配置的都配置好了。

2、commit操作时会将数据写入到tlog中，然后tlog会将数据的修改反映在索引库中。遇到应用非正常关闭的情况，在应用启动时，系统会将tlog中未操作的数据先写入到索引库中。

3、下面介绍下SolrCloud下的索引集相关操作API。创建Collection前需要先将配置上传到zookeeper的/solr/configs下。这里_default是默认的配置文件，SolrCloud搭建启动后默认上传到zookeeper中。book就是我定义上传的配置文件。

4、启动本机的mysql数据库我新建test数据库，并在其中新建test表，表有两个字段，ID与Val。ID表示文档编号，Val表示文档内容，这是一个最简单的数据源。

5、之后在该界面中，右键点击“任务”里“导入数据”选项。接着在该界面中，输入服务器名称。然后在该界面中，选择要导入的数据库。然后在该界面中，点击“下一步”按钮。

到此，以上就是小编对于solr更新索引的问题就介绍到这了，希望介绍的几点解答对大家有用，有任何问题和不懂的，欢迎各位老师在评论区讨论，给我留言。