欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Docker安装ElasticSearch 以及使用LogStash实现索引库和数据库同步

程序员文章站 2022-04-08 19:45:19
1:下载 ElasticSearch 镜像 2:创建 ElasticSearch 容器: 启动成功后在浏览器地址栏输入:http://宿主机ip:9200 出现如下,表示启动成功 3:但是如果 Java 使用 9300 端口连接ES 会出现如下错误 4:修改docker容器中的配置文件: 进入 co ......

1:下载 elasticsearch 镜像

docker pull docker.io/elasticsearch:5.6.8

Docker安装ElasticSearch 以及使用LogStash实现索引库和数据库同步

 

2:创建 elasticsearch 容器:

docker  run  -di  --name=my_es  -p  9200:9200  -p  9300:9300  elasticsearch:5.6.8

启动成功后在浏览器地址栏输入:http://宿主机ip:9200  出现如下,表示启动成功

Docker安装ElasticSearch 以及使用LogStash实现索引库和数据库同步

 

3:但是如果 java 使用 9300 端口连接es 会出现如下错误

nonodeavailableexception[none of the configured nodes are available:
[{#transport#‐1}{exvgjlr‐rlcnmjy‐hzktna}{192.168.184.135}{192.168.184.135:9300}]] at org.elasticsearch.client.transport.transportclientnodesservice.ensurenodes areavailable at org.elasticsearch.client.transport.transportclientnodesservice.execute at org.elasticsearch.client.transport.transportproxyclient.execute

 

 4:修改docker容器中的配置文件:

docker  exec  -it  my_es  /bin/bash

 进入 config 文件夹有一个  elasticsearch.yml  文件,但是发现 vim / vi 命令失效(因为是在docker容器中)

 

5 :首先退出容器,然后执行命令,拷贝配置文件到宿主机(必须保证容器中的es是启动状态):

docker  cp  my_es:/usr/share/elasticsearch/config/elasticsearch.yml /usr/share/elasticsearch.yml

 

6:停止 和 删除原来创建的容器

docker stop elasticsearch:5.6.8
docker rm my_es

 

7:重新执行创建容器命令(重点:挂载文件

docker run -di --name=my_es -p 9200:9200 -p 9300:9300 -v /usr/share/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml  elasticsearch:5.6.8

 

8: 修改  /usr/share/elasticsearch.yml  将 transport.host: 0.0.0.0 前的 # 去掉后保存文件退出。  其作用是允许任何ip地址访问 elasticsearch 开发测试阶段可以这么做,生产环境下指定具体的ip

9:重启后发现重启启动失败了(纯宿主机问题),这与我们刚才修改的配置有关,因为elasticsearch在启动的时候会进行一些检查,比如最多打开的文件的个数以及虚拟内存区域数量等等

 

10:系统调优

(1)修改  /etc/security/limits.conf  追加内容

* soft nofile 65536
* hard nofile 65536

说明:nofile是单个进程允许打开的最大文件个数 soft nofile 是软限制 hard nofile是硬限制


(2)修改  /etc/sysctl.conf  追加内容

vm.max_map_count=655360

说明:限制一个进程可以拥有的vma(虚拟内存区域)的数量

 

11: 执行下面命令 修改内核参数马上生效:sysctl  ‐p    重新启动虚拟机,再次启动容器,发现已经可以启动并远程访问

 


 使用 restapi 操作 elasticsearch

  (put)创建索引:http://localhost:9200/index_name
  (get)查询所有:http://localhost:9200/index_name/type_name/_search
  (get)根据id查询:http://localhost:9200/index_name/type_name/1
  (get)条件查询:http://localhost:9200/index_name/type_name/_search?q=title:spring
  (get)模糊查询:http://localhost:9200/index_name/type_name/_search?q=title:*spring*
  (delete)删除:http://localhost:9200/index_name/type_name/1
  (post)新增类型和文档:http://localhost:9200/index_name/type_name
    {
      "title": "spring框架",
      "content" : "spring框架是由于软件开发的复杂性而创建的"
    }
  (put)修改id不存在新增:http://localhost:9200/type_name/article/1
    {
      "title": "spring框架",
      "content" : "spring框架是由于软件开发的复杂性而创建的"
    }

 安装ik分词器

docker  cp  ik  my_es:/usr/share/elasticsearch/plugins
默认分词:http://127.0.0.1:9200/_analyze?analyzer=chinese&pretty=true&text=我是程序员
最少切分:http://127.0.0.1:9200/_analyze?analyzer=ik_smart&pretty=true&text=我是程序员
最细切分:http://127.0.0.1:9200/_analyze?analyzer=ik_max_word&pretty=true&text=我是程序员
定制词汇
(1):elasticsearch-5.6.8\plugins\ik\config 文件夹下创建文件名 xxx.dic (2):修改 ikanalyzer.cfg.xml 文件:<entry key="ext_dict">xxx.dic</entry>

 使用  elasticsearch head 连接es会出现跨域问题的解决方法: 在 elasticsearch.yml 文件 添加

 

http.cors.enabled: true
http.cors.allow-origin: "*"

 


使用 logstash 实现索引库和数据库同步

(1):安装 logstash (直接解压)
(2):启动命令:logstash -e 'input { stdin { } } output { stdout {} }'
(3):配置同步 创建 xxx.conf 文件:
input { jdbc { # mysql jdbc connection string to our backup databse jdbc_connection_string => "jdbc:mysql://192.168.2.130:3306/article?characterencoding=utf8" # the user we wish to excute our statement as jdbc_user => "root" jdbc_password => "root" # the path to our downloaded jdbc driver jdbc_driver_library => "d:\logstash-5.6.8\mysqletc\mysql-connector-java-5.1.46.jar" # the name of the driver class for mysql jdbc_driver_class => "com.mysql.jdbc.driver" jdbc_paging_enabled => "true" jdbc_page_size => "50" #以下对应着要执行的sql的绝对路径。 #statement_filepath => "" statement => "select id, title, content, state from tb_article" #定时字段 各字段含义(由左至右)分、时、天、月、年,全部为*默认含义为每分钟都更新(测试结果,不同的话请留言指出) schedule => "* * * * *" } } output { elasticsearch { #esip地址与端口 hosts => "127.0.0.1:9200" #es索引名称(自己定义的) index => "tensquare_article" #自增id编号 document_id => "%{id}" document_type => "article" } stdout { #以json格式输出 codec => json_lines } } 启动 logstash:logstash -f conf.xml

 


 elaticsearch配套软件(安装包,head,logstash,node,js):

链接:https://pan.baidu.com/s/1jhl75tgtxkvxplzqrluaww 
提取码:7a69