2.新建用户
ES不允许以root用户执行。因此需要创建新用户:
adduser es
3.
access denied (javax.management.MBeanTrustPermission register)
jre/lib/security/java.policy文件中新增
permission javax.management.MBeanTrustPermission "register";
4.以es用户的身份解压各压缩包,否则会有一大堆的权限错误。
5.Bootstrap checks failing
当配置的host不是localhost的时候,ES会进行Bootstrap checks。其主要目的是增加ES能够获得的各种资源。一般不推荐在实际生产环境中,关闭Bootstrap checks。
max file descriptors [4096] for elasticsearch process is too low, increase to at least [65536]
修改/etc/security/limits.conf:(需要root权限)
es soft nproc 65536
es hard nproc 65536
es soft nofile 65536
es hard nofile 65536
重新登录es用户后,修改生效。
在bin/elasticsearch的开头添加:
ulimit -n 65536
ulimit增加的资源数,不能超过limits.conf中的数量,否则会报错。
max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]
修改/etc/sysctl.conf:(需要root权限)
vm.max_map_count=262144
执行sysctl -p
使配置生效。
参考:
http://stackoverflow.com/questions/42300463/elasticsearch-5-x-bootstrap-checks-failing
5.数据存储
默认情况下,data和log都在ES文件夹下的同名文件夹下。可在config/elasticsearch.yml中修改之。
ES的Client支持多种语言。其中,Java语言有两种API:Java API和Java REST API。其中,前者对后者的调用进行了封装,但由于REST命令可以直接在kibana中调试,实际使用中,反而后者更方便一些。
Java REST API的示例参见:
https://github.com/antkillerfarm/antkillerfarm_crazy/tree/master/helloworld/elasticsearch/es_client_hello
其中,test1函数给出了基本的查询示例。test2函数给出了json格式查询的示例,test3函数对查询返回的json数据采用jackson的树模型进行解析,test3函数对查询返回的json数据采用jackson的流模型进行解析。
更全面的示例参见:
https://github.com/Top-Q/elasticsearch-client
bin/logstash-plugin install logstash-output-jdbc
https://github.com/theangryangel/logstash-output-jdbc/blob/master/examples/mysql.md
Spring也提供了对ES的支持。
SpringBoot官方的ES文档:
http://docs.spring.io/spring-data/elasticsearch/docs/current/reference/html/
这篇文章里的Table 2写的很好,可以方便用户快速掌握最常用的查询语法。
SpringBoot官方的ES示例:
https://github.com/spring-projects/spring-boot/tree/master/spring-boot-samples/spring-boot-sample-data-elasticsearch
Spring的问题在于它的发布由于和ES并无关联,因此更新比较迟。而且内部由于使用的是ES Java API,对ES版本有要求,通用性上不如Java REST API。
参考:
http://blog.720ui.com/2016/springboot_02_data_elasticsearch/
Spring Boot揭秘与实战(二)数据存储篇-ElasticSearch
https://juejin.im/entry/58b56c4a8d6d81005765fc73
SpringBoot整合Elasticsearch
http://cloud.51cto.com/art/201505/476450.htm
五类Elasticsearch扩展性插件推荐
http://blog.csdn.net/cnweike/article/details/33736429
Elasticsearch基础教程
http://blog.csdn.net/a809146548/article/details/52371110
Logstash使用详解
http://www.cnblogs.com/ajianbeyourself/p/5529575.html
Elasticsearch教程-从入门到精通
http://www.freebuf.com/sectool/78225.html
Elk大数据查询系列:Elasticsearch与Logstash基础篇
http://www.tuicool.com/articles/YR7RRr
ELK搭建实时日志分析平台
http://467754239.blog.51cto.com/4878013/1700828/
ELK 日志分析系统
https://www.ibm.com/developerworks/cn/opensource/os-cn-elk/
集中式日志系统ELK协议栈详解
https://es.xiaoleilu.com/
Elasticsearch权威指南(中文版)
http://udn.yyuap.com/doc/logstash-best-practice-cn/
logstash最佳实践
https://zhuanlan.zhihu.com/p/24428355
使用ElasticSearch踩过的坑
https://zhuanlan.zhihu.com/p/25723815
教你快速使用Tensorflow/Elasticsearch实现全文的图片搜索
http://www.cnblogs.com/buzzlight/p/logstash_elasticsearch_kibana_log.html
使用logstash+elasticsearch+kibana快速搭建日志平台
http://blog.csdn.net/longxibendi/article/details/35237543/
ELK入门学习资源索引
http://www.jianshu.com/p/0b4346f503e3
探索elasticsearch。该文包含如何使用ES进行TF/IDF的方法
https://my.oschina.net/taogang/blog/983586
ElasticSearch对比Splunk
https://mp.weixin.qq.com/s/jZ_jM6yUPK8Ev7FSwdgTIA
360私有云平台Elasticsearch服务初探
https://mp.weixin.qq.com/s/osOggCYvzun6X6yquD7cYg
浅析ElasticSearch原理
https://mp.weixin.qq.com/s/j_9PCwWoGu9cZM9sD1klog
Elasticsearch性能监控(一)
http://bbotte.com/logs-service/use-elk-processing-logs-multiple-log-file-send/
ELK日志服务使用-filebeat多文件发送
https://www.digitalocean.com/community/tutorials/how-to-map-user-location-with-geoip-and-elk-elasticsearch-logstash-and-kibana
How To Map User Location with GeoIP and ELK (Elasticsearch, Logstash, and Kibana)
https://mp.weixin.qq.com/s/kxBxaK72ovaMHQgumXALmw
Elasticsearch性能监控(二)
http://blog.csdn.net/qq_21383435/article/details/79367457
linux下ElasticSearch.6.2.1与head、Kibana、X-Pack、SQL、IK、PINYIN插件的配置安装
https://mp.weixin.qq.com/s/Wzrt7H9gDIUQn7KEc0qZHQ
在Python中使用Elasticsearch
https://mp.weixin.qq.com/s/K44-L0rclaIM40hma55pPQ
滴滴Elasticsearch多集群架构实践
https://mp.weixin.qq.com/s/1hRB3ylkJbcjUe4l-bpCsA
Elaticsearch在蚂蚁金服的实践经验
https://mp.weixin.qq.com/s/Hpy76P0spGJcDmmBCq2vpA
为什么已有Elasticsearch,我们还要重造实时分析引擎AresDB?
https://mp.weixin.qq.com/s/di_CJ7kBwI4ICe4mhz0Tcg
滴滴基于ElasticSearch的一站式搜索中台实践
https://mp.weixin.qq.com/s/-NfKH-2PpA-peq9CU0g1JA
解密Elasticsearch技术,腾讯开源的万亿级分布式搜索分析引擎
https://mp.weixin.qq.com/s/0TMESj2Z-XK2PzwBQo0Mpg
Elasticsearch调优实践
https://mp.weixin.qq.com/s/pT-6-U9mF4ttg0arp6BsVQ
Python+ElasticSearch:有了这个超级武器,你也可以报名参加诗词大会了!
https://mp.weixin.qq.com/s/W61SstvGawgVVqQxNa7GyQ
Elasticsearch入门学习权威指南,719页pdf教您构建分布式实时搜索和分析引擎
https://mp.weixin.qq.com/s/Olz-kvHM-SkC-pZr08r7ow
相关搜索—使用Solr和Elasticsearch,360页pdf
https://mp.weixin.qq.com/s/ipuIq_E5rOPPF7_XdS5PGQ
腾讯万亿级Elasticsearch内存效率提升技术解密
https://mp.weixin.qq.com/s/eejvp9yCJxP_Crj8P9jqew
Elasticsearch索引容量管理实践
https://mp.weixin.qq.com/s/Osw6IAK5G6v11nyhq5u-HA
Elasticsearch遇上BERT:使用Elasticsearch和BERT构建搜索引擎
https://mp.weixin.qq.com/s/MDT5-I5kza1yJdA_JWpPkA
ElasticSearch介绍及使用方法
https://mp.weixin.qq.com/s/S29Ro51Oidx5ikO8sj-UEA
新一代搜索引擎项目ZeroSearch设计探索(ES是磁盘检索引擎。而ZS是磁盘检索引擎)
https://mp.weixin.qq.com/s/2PRX_vVhi3SygrZydBfG6w
携程Elasticsearch数据同步实践
https://mp.weixin.qq.com/s/dFspZaLOOOl8Y28wN_EWfA
还在用ELK?是时候了解一下轻量化日志服务Loki了
https://mp.weixin.qq.com/s/JOS_fxec6YWjfekQzgGiKA
百亿数据,毫秒级返回,如何构建?
https://mp.weixin.qq.com/s/UFUItQlYsQrpvkHth1ujFw
1W字 40图 硬核ES实战
https://mp.weixin.qq.com/s/6k8THshasaYfSaLr58O1NA
美团外卖搜索基于Elasticsearch的优化实践
Flume和Kafka都是日志系统。
Flume官网:
https://flume.apache.org/
Kafka官网:
https://kafka.apache.org/
以下是它们的比较:
http://www.cnblogs.com/ibyte/p/5830715.html
Flume与Kafka区别
http://www.aichengxu.com/view/2412170
kafka和flume的对比
http://www.cnblogs.com/lishouguang/p/4560858.html
flume使用场景 flume与kafka的比较
两种最常见的Style: 消息队列方式(Message queuing)和发布订阅(publish-subscribe)方式。
参考:
https://mp.weixin.qq.com/s/oiaXjFxNcwJenkGuJBPm5Q
消息中间件的”Style”
message delivery semantic也就是消息传递语义,简单说就是消息传递过程中消息传递的保证性。主要分为三种:
at most once:最多一次。消息可能丢失也可能被处理,但最多只会被处理一次。
at least once:至少一次。消息不会丢失,但可能被处理多次。可能重复,不会丢失。
exactly once:精确传递一次。消息被处理且只会被处理一次。不丢失不重复就一次。
https://mp.weixin.qq.com/s/TScpvjpIlyZyj62e8EwOPg
Kafka消息中间件到底会不会丢消息
https://www.zhihu.com/question/54152397
消息队列(mq)是什么?
https://mp.weixin.qq.com/s/bjlDHFLwxjej2t8iDhVb1A
Spark Streaming消费Kafka数据的两种方案
https://mp.weixin.qq.com/s/o-zfrJS5Ito1kWPBJUIryg
Kafka相关资源
https://mp.weixin.qq.com/s/TzF6GBb1NI5iE8q2Rxo95Q
Kafka实战:Kafka in Action,209页pdf
https://mp.weixin.qq.com/s/l0AL89M0xPbWMFj6U7yYZw
消息中间件选型分析:从Kafka与RabbitMQ的对比看全局
https://mp.weixin.qq.com/s/SaXRwTUaMlC64Z6qHvXiqg
非常强悍的RabbitMQ总结
https://mp.weixin.qq.com/s/oKBUb2IbG_h1xDhL42TbuQ
360开源又一力作——KafkaBridge:让操作kafka更简单!
https://mp.weixin.qq.com/s/P6K1tXuBZHaaizwGVo-22A
Kafka的API那么多,到底该怎么选?
https://mp.weixin.qq.com/s/XvWxaoob_PYpcOt8XpK7mw
杠上Spark、Flink?Kafka为何转型流数据平台
https://mp.weixin.qq.com/s/2kU9QhLP-njpToPckyfK5A
伯克利RISE Lab开源Confluo:吞吐量比Kafka高4到10倍
https://mp.weixin.qq.com/s/QJOfh5gJReQTimu-mAzexg
以Kafka和RocketMQ为例,漫谈消息队列
https://mp.weixin.qq.com/s/imLTVwgm8MOiY1_5s3rdFQ
RocketMQ如何保证消息的可靠性?
https://mp.weixin.qq.com/s/9ZqEOlD3v–U3BNCPZSUjw
浅谈消息队列及常见的分布式消息队列中间件
https://mp.weixin.qq.com/s/6aXcum-FAbvcGcOrkSC4vQ
为什么Kafka会成为微服务架构的事实标准?
https://zhuanlan.zhihu.com/p/87987916
Kafka基本原理
https://mp.weixin.qq.com/s/46u-qyk00yZM_bIah-zs-A
基于Kafka的实时计算引擎如何选择?Spark or Flink?
https://mp.weixin.qq.com/s/059DK6v1j5yi9OlqdbI7Cg
从面试角度一文学完Kafka
https://mp.weixin.qq.com/s/T6gCc8OBgyV-yeAg_MUzPQ
简单理解Kafka的消息可靠性策略
https://mp.weixin.qq.com/s/DQZh-V0jnlqLNqkyRkoDQQ
使用Kafka,如何成功迁移SQL数据库中超过20亿条记录?
您的打赏,是对我的鼓励