本文主要讲解Elasticsearch及其套件Kibana、Logstash的安装及启动,还讲解如何导入数据用于后续的实验。html
说明:Elasticsearch是基于Java开发的,因此若是是下载Elasticsearch 6.x及以前的版本,须要本身安装Java环境;若是是7.x版本,会自带Java环境,无需额外安装,本次咱们安装的版本是7.11.1。其余套件的安装,也须要根据相应的版本进行安装。node
windows 环境,下载后加压便可。https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.11.1-windows-x86_64.zipwindows
mac环境,下载后解压便可。服务器
curl -L -O https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.11.1-darwin-x86_64.tar.gz tar -xzvf elasticsearch-7.11.1-darwin-x86_64.tar.gz
启动curl
bin/elasticsearch
单机启动多实例elasticsearch
elasticsearch -E node.name=node1 -E cluster.name=zxy -E path.data=/data/logs/es/node1_data -d elasticsearch -E node.name=node2 -E cluster.name=zxy -E path.data=/data/logs/es/node2_data -d elasticsearch -E node.name=node3 -E cluster.name=zxy -E path.data=/data/logs/es/node3_data -d
访问ide
http://localhost:9200/
查看插件ui
bin/elasticsearch-plugin list
安装插件analysis-icu,后续用于中文分词url
bin/elasticsearch-plugin install analysis-icu
Kibana 是一个免费且开放的用户界面,可以让咱们对 Elasticsearch 数据进行可视化,并让咱们在 Elastic Stack 中进行导航。咱们能够进行各类操做,从跟踪查询负载,到理解请求如何流经整个应用,都能轻松完成。插件
windows环境的下载包:https://artifacts.elastic.co/downloads/kibana/kibana-7.11.1-windows-x86_64.zip
mac环境
curl -L -O https://artifacts.elastic.co/downloads/kibana/kibana-7.11.1-darwin-x86_64.tar.gz tar xzvf kibana-7.11.1-darwin-x86_64.tar.gz
改成中文
修改配置文件 kibana.yml,在最后添加配置以下 i18n.locale: "zh-CN"
启动
./bin/kibana
访问
http://127.0.0.1:5601/
Logstash 是免费且开放的服务器端数据处理管道,可以从多个来源采集数据,转换数据,而后将数据发送到咱们最喜欢的“存储库”中。
windows环境的下载包:https://artifacts.elastic.co/downloads/logstash/logstash-7.11.1-windows-x86_64.zip
mac
curl -L -O https://artifacts.elastic.co/downloads/logstash/logstash-7.11.1-darwin-x86_64.tar.gz tar xzvf logstash-7.11.1-darwin-x86_64.tar.gz
启动
sudo ./bin/logstash -f ./config/logstash.conf
MovieLens 是一个推荐系统。它由美国 Minnesota 大学计算机科学与工程学院的 GroupLens 项目组创办,是一个非商业性质的、以研究为目的的实验性站点。
下载实验用的csv数据文件:http://files.grouplens.org/datasets/movielens/ml-25m.zip
解压后把数据经过Kinana进行导入,后续作实验的时候会用到,解压后的文件主要有links.csv,movies.csv,ratings.csv,tags.csv。
操做路径:Machine Learning->DataVisualizer 点击UPLOAD。
注意表头无法自动识别,可能变成了“column1,column2,column3”等等,须要自行修改。