PHP使用elasticsearch搜索安装及分词方法

PHP使用elasticsearch搜索安装及分词方法

PHP小彩虹2021-08-23 1:20:50210A+A-

简介

为什么会用到这个ES搜索?是因为我在看乌云的漏洞案例库时候,搜索即为不方便。

比如说说我要搜索一个 SQL注入

那mysql匹配的时候是like模糊匹配,搜索必须要有SQL注入这四个字,连续的才能查找到那这样会不太方便。

然后我就想着做一个分词,搜索起来会方便不少,第一个想到的就是ES搜索了。

怎么去用ES呢?

第一步 安装ES搜索

我们只需要一个JAVA环境并且把Java的环境变量配置好,我相信这些JAVA环境大家之前都配置过,这里不多说。

那现在只需要下载ES的文件,也不需要编译,下载下来就行了,把他放到一个目录。
下载地址: www.elastic.co/downlo...

第二步 安装head

head是基于node开发的,所以需要先安装node
node下载地址:cdn.npm.taobao.org/dis...

在电脑任意一个目录下(不要在elasticsearch目录里面),执行一下命令,

git clone https://github.com/mobz/elasticsearch-head.git  
cd elasticsearch-head/  
npm install  

3、修改部分配置
修改两个地方:
文件:elasticsearch-headGruntfile.js

connect: {
 server: {
 options: {
 port: 9100,
 hostname: '*',
 base: '.',
 keepalive: true
        }
    }
}

增加配置,文件:elasticsearch-5.6.0configelasticsearch.yml

http.cors.enabled: true  
http.cors.allow-origin: "*"  

4、输入 npm run start 启动

5、访问head管理页面: http://localhost:9100/

第三步 安装composer

就是我们需要安装composer,安装composer干什么呢?

下载地址:getcomposer.org/Compo...

下载之后,直接下一步下一步就安装好了。

因为我们PHP如果调用ES搜索的接口,我们是需要去下载一个类库。

1. 在当前目录下载composer.phar
curl -sS https://getcomposer.org/installer | php
2. 在当前目录下创建一个composer.json的文件
{
    "require": {
        "elasticsearch/elasticsearch": "~2.0@beta"
    }
}
3. 安装依赖
php composer.phar install

第四步 安装分词插件

就是说我们需要安装一个分词插件。在ES搜索当中Ik分词插件是中文分词最好用的一个,安装也极为方便。

我们只需要到GitHub上把他对应版本的这个,文件下载下来,然后解压到ES的插件目录,然后重新启动一下ES搜索服务,就可以了。

下载地址:github.com/medcl/elas.…

怎么去验证这个插件有没有安装成功呢?
我们可以通过下面的URL,做分词测试。
http://localhost:9200/你的库名/_analyze?analyzer=ik_max_word&pretty=true&text=中华人民共和国

我们可以在这个URL中输入,中华人民共和国; 默认的分词器他会把中华人民共和国分别以以 中、华、人、民、共、和、国。

那我们选择用IK作为分词器后,它是可以把 中华人民共和国 作为一个词,把中华作为一个词。

第五步 导入数据

现在说一下怎么把数据库中的数据导入到ES中,

首先需要建立这样一个库,然后把数据按照固定的格式插入到ES搜索中。下面是我的一个代码示例

<?php require_once './vendor/autoload.php'; //连接MYSQL数据库 function get_conn() { @$conn = mysql_connect("localhost", "root", "") or die("error connecting"); mysql_select_db("wooyun", $conn); mysql_query("SET NAMES 'UTF8'"); return $conn; } //插入数据到ES搜索中 function create_index($maxId, $client) { //查询数据库中的数据 $sql = "SELECT * FROM bugs where id > $maxId limit 0,300"; get_conn(); @$result_bugs = mysql_query($sql); while (@$row = mysql_fetch_assoc(@$result_bugs)) { $rtn[] = $row; } foreach ($rtn as $val) { $params = array(); $params['body'] = array( 'id' => $val['id'], 'wybug_id' => $val['wybug_id'], 'wybug_title' => $val['wybug_title'], ); $params['index'] = 'wooyun'; $params['type'] = 'title'; $client->index($params); } return (count($rtn) == 300) ? $val['id'] : false; } set_time_limit(0); $client = Elasticsearch\ClientBuilder::create()->setHosts(['localhost'])->build(); //删除所有数据 $client->indices()->delete(['index' => 'wooyun']); $a = true; $maxId = 0; while ($a) { $maxId = create_index($maxId, $client); if (empty($maxId)) { $a = false; } }

第六步 查询数据

<?php //引入mysql连接,和ES类库 require('conn.php'); require_once 'vendor/autoload.php'; function search($keyword, $page = 0, $size = 20) { //对象实例化 $client = Elasticsearch\ClientBuilder::create()->setHosts(['localhost'])->build(); //查询数据的拼装 $params = array(); $params['index'] = 'wooyun'; $params['type'] = 'title'; $params['body']['query']['match']['wybug_title'] = $keyword; $params['from'] = $page; $params['size'] = $size; //执行查询 $rtn = $client->search($params)['hits']; //结果组装组装数据 $data['total'] = $rtn['total']; $data['lists'] = array_column($rtn['hits'], '_source'); $data['lists'] = formartData(array_column($data['lists'], 'id')); return $data; } function formartData($ids) { $ids = implode($ids, ','); $sql = "select * from bugs where id in($ids)"; $data = mysql_query($sql); $rtn = []; while (@$row = mysql_fetch_assoc(@$data)) { $rtn[] = $row; } return $rtn; } $q0 = isset($_GET['q']) ? $_GET['q'] : 'SQL注入'; $num = "15"; //每页显示15条 $page = isset($_GET['page']) ? intval($_GET['page']) : 1; $offset = ($page - 1) * $num; $esData = search($q0, $offset, $num);

点击这里复制本文地址 以上内容由权冠洲的博客整理呈现,请务必在转载分享时注明本文地址!如对内容有疑问,请联系我们,谢谢!

支持Ctrl+Enter提交

联系我们| 本站介绍| 留言建议 | 交换友链 | 域名展示
本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除

权冠洲的博客 © All Rights Reserved.  Copyright quanguanzhou.top All Rights Reserved
苏公网安备 32030302000848号   苏ICP备20033101号-1
本网站由 提供CDN/云存储服务

联系我们