solr的基本使用

Roy 2018-11-09 01:4629 阅读

Solr

概念:

1. 搜索引擎的技术,建立在Lucene之上,可以解决跨平台,跨语言的问题.(Lucene本身是个jar包,也就是API,不能独立运行,需要程序的调用来完成全局检索,不具备跨平台,跨语言).
2. 基于Lucene的全文检索服务,是可以独立运行的(war包,运行在tomcat).

solr安装

1. 解压新的tomcat
2. 将solr进行解压
3. 找到solr.war:
    * D:\develop\lucene\solr\solr-4.10.3\dist 下,自己的解压目录
    * D:\develop\lucene\solr\solr-4.10.3\example\webapps 下也有
4. 将war包放在tomcat的webapps下
5. 启动tomcat,解压war包,关闭tomcat
6. 将D:\develop\lucene\solr\solr-4.10.3\example下有个solr文件夹,将该文件夹拷贝到D盘根目录(习惯)
    * solrHome: 是solr运行的主目录
    * solrCore: 类似于数据库,可以单独对外提供索引和搜索的服务
    * 一个solrHome下包含多个solrCore
7. 在tomcat的webapps下的solr的解压文件夹下的WEB-INF下的web.xml,进行修改:
    第41到45行(修改<env-entry-value>的目录为第六步复制后的那个目录):
         <env-entry>
           <env-entry-name>solr/home</env-entry-name>
           <env-entry-value>D:\solr</env-entry-value>
           <env-entry-type>java.lang.String</env-entry-type>
        </env-entry>
8. 复制扩展包:
    D:\develop\lucene\solr\solr-4.10.3\example\lib\ext目录下的所有包复制到tomcat的webapps下的solr下的WEB-INF下的lib下,然后可以启动tomcat,在网页进行访问 localhost:8080/solr

中文分析器IK Analyzer

1. 为什么要使用IK呢?
    因为solr是由外国人研发,对汉语的分词是一个汉字一个汉字分的,所以引入IK,对中文有很好的分词效果,并且可以自定义扩充分词词典
2. 安装IK
    1. 解压IK Analyzer 2012FF_hf1.zip
    2. 将解压目录下的IKAnalyzer2012FF_u1.jar放在tomcat下的webapps下的solr下的WEB-INF下的lib下
    3. 拷贝解压目录下的IKAnalyzer.cfg.xml,ext_stopword.dic,mydict.dic放在tomcat下的webapps下的solr下的WEB-INF下的classes下,classes不存在创建一个就好
    4. 到前面安装solr时的那个solrhome下,修改collection1\conf\schema.xml,在1152行添加:
        <fieldType name="text_ik" class="solr.TextField">
          <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
        </fieldType>
    5. 选择分词的时候选择text_ik,就可以使用中文分析器了.(笔者第一次就是选择text,一直失败,谨此注意一下)

配置域:

1. 域是针对当前项目而言的
    * 需要根据什么样的条件进行查询
    * 查询出来的记过需要展示的数据信息
    * 需要用到的字段
2. 使用solr进行索引创建,所指定的域 必须在schema.xml中存在,否则会创建失败.
3. 关于域的属性:
    * name: 所指定域的名称
    * type: 域的类型-----> 引用filedType中的name属性(是否分词)---->为了索引
    * indexed: 是否索引----> 为了搜索
    * stored: 是否存储----> 为了展示
    * required: 是否必须
    * multiValued: 是否多值
4. 针对本项目,修改schema.xml文件,在</schema>之前添加:
    <field name="item_goodsid" type="long" indexed="true" stored="true"/>
    <field name="item_title" type="text_ik" indexed="true" stored="true"/>
    <field name="item_price" type="double" indexed="true" stored="true"/>
    <field name="item_image" type="string" indexed="false" stored="true" />
    <field name="item_category" type="string" indexed="true" stored="true" />
    <field name="item_seller" type="text_ik" indexed="true" stored="true" />
    <field name="item_brand" type="string" indexed="true" stored="true" />
5. 复制域(多个字段进行搜索):
    <field  name="item_keywords"  type="text_ik"  indexed="true"  stored="false"

multiValued="true"/>

SolrJ(原理: http请求和响应)

Solr官方提供的API(理解)

SpringDataSolr(对SolrJ的封装)

1. 引入依赖:
    <dependencies>
        <dependency>
            <groupId>org.springframework.data</groupId>
            <artifactId>spring-data-solr</artifactId>
            <version>1.5.5.RELEASE</version>
        </dependency>
        <dependency>
            <groupId>org.springframework</groupId>
            <artifactId>spring-test</artifactId>
            <version>4.2.4.RELEASE</version>
        </dependency>
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>4.9</version>
        </dependency>
    </dependencies>
2. 基本的操作:
    package springdatasolr;

    import com.wzlove.pojo.TbItem;
    import org.apache.solr.client.solrj.response.UpdateResponse;
    import org.apache.solr.common.SolrInputDocument;
    import org.junit.Test;
    import org.junit.runner.RunWith;
    import org.springframework.beans.factory.annotation.Autowired;
    import org.springframework.data.solr.core.SolrTemplate;
    import org.springframework.data.solr.core.query.Criteria;
    import org.springframework.data.solr.core.query.Query;
    import org.springframework.data.solr.core.query.SimpleQuery;
    import org.springframework.data.solr.core.query.result.ScoredPage;
    import org.springframework.test.context.ContextConfiguration;
    import org.springframework.test.context.junit4.SpringJUnit4ClassRunner;
    
    import java.math.BigDecimal;
    import java.util.ArrayList;
    import java.util.List;
    
    /**
     * @ClassName SpringDataSolrDemo
     * @Author wz157
     * @Date 2018/11/8 15:22
     * @Description TODO
     */
    @RunWith(SpringJUnit4ClassRunner.class)
    @ContextConfiguration({"classpath:applicationContext-solr.xml"})
    public class SpringDataSolrDemo {
    
        // 注入SolrTemplate
        @Autowired
        private SolrTemplate solrTemplate;
    
        /**
         * 测试添加索引
         */
        @Test
        public void testAdd(){
    
            TbItem item = new TbItem();
            item.setId(1L);
            item.setBrand("华为");
            item.setCategory("手机");
            item.setGoodsId(1L);
            item.setSeller("华为2号专卖店");
            item.setTitle("华为 Mate9");
            item.setPrice(new BigDecimal(2000));
            solrTemplate.saveBean(item);
            solrTemplate.commit();
    
        }
    
        /**
         * 根据主键进行查询,getById()
         */
        @Test
        public void findByUniqueKey(){
            TbItem byId = solrTemplate.getById(1, TbItem.class);
            System.out.println(byId);
        }
    
        /**
         * 根据主键进行删除,deleteById() 记得传字节码文件
         */
        @Test
        public void deleteByUniqueKey(){
            solrTemplate.deleteById("1");
            // 提交
            solrTemplate.commit();
        }
    
        /**
         * 批量插入,saveBeans
         */
        @Test
        public void testAddList(){
    
            List<TbItem> list = new ArrayList<TbItem>(100);
            for (int i = 0; i < 100; i++) {
                TbItem item = new TbItem();
                item.setId(i + 1L);
                item.setBrand("华为" + i);
                item.setCategory("手机");
                item.setGoodsId(1L);
                item.setSeller("华为2号专卖店" + i);
                item.setTitle("华为 Mate9" + i );
                item.setPrice(new BigDecimal(2000 + i));
                list.add(item);
            }
            solrTemplate.saveBeans(list);
            solrTemplate.commit();
    
        }
    
    
        /**
         * 分页查询(总页数,总记录数)
         * offset 开始索引
         * rows 每页记录数
         */
        @Test
        public void testQueryByPage(){
            // 创建查询条件,查询所有使用 *:*
            Query query = new SimpleQuery("*:*");
            // 设置分页条件
            query.setOffset(2);
            query.setRows(5);
            // 执行分页查询
            ScoredPage<TbItem> tbItems = solrTemplate.queryForPage(query, TbItem.class);
            // 解析分页结果
            for (TbItem tbItem : tbItems) {
                System.out.println(tbItem.getBrand());
                System.out.println(tbItem.getPrice());
            }
            System.out.println("总记录的数 :  " + tbItems.getTotalElements());
            System.out.println("总页数 : " + tbItems.getTotalPages());
    
        }
    
        /**
         * 条件查询
         */
        @Test
        public void testPageQueryMutil(){
            // 创建查询条件,查询所有使用 *:*
            Query query = new SimpleQuery("*:*");
            // 设置查询条件(Criterial)
            Criteria criteria = new Criteria("item_brand").contains("2");
            criteria = criteria.and("item_seller").contains("2");
            query.addCriteria(criteria);
    
            // 执行分页查询
            ScoredPage<TbItem> tbItems = solrTemplate.queryForPage(query, TbItem.class);
            // 解析分页结果
            for (TbItem tbItem : tbItems) {
                System.out.println(tbItem.getBrand() + "          " + tbItem.getPrice() + "      " + tbItem.getSeller());
            }
            System.out.println("总记录的数 :  " + tbItems.getTotalElements());
            System.out.println("总页数 : " + tbItems.getTotalPages());
    
        }
    
        /**
         * 全部删除
         */
        @Test
        public void testDeleteAll(){
            Query query = new SimpleQuery("*:*");
            solrTemplate.delete(query);
            solrTemplate.commit();
        }
    }
3. 配置文件:
    <?xml version="1.0" encoding="UTF-8"?>
    <beans xmlns="http://www.springframework.org/schema/beans"
           xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
           xmlns:p="http://www.springframework.org/schema/p"
           xmlns:context="http://www.springframework.org/schema/context"
           xmlns:solr="http://www.springframework.org/schema/data/solr"
           xsi:schemaLocation="http://www.springframework.org/schema/data/solr
    http://www.springframework.org/schema/data/solr/spring-solr-1.0.xsd
    http://www.springframework.org/schema/beans
    http://www.springframework.org/schema/beans/spring-beans.xsd
    http://www.springframework.org/schema/context
    http://www.springframework.org/schema/context/spring-context.xsd">
    
        <!-- solr 服务器地址,相当于配置了HttpSolrServer这个bean -->
        <solr:solr-server id="solrServer" url="http://127.0.0.1:8080/solr/collection1" />
    
        <!-- solr 模板,使用 solr 模板可对索引库进行 CRUD 的操作 -->
        <bean id="solrTemplate" class="org.springframework.data.solr.core.SolrTemplate">
            <constructor-arg ref="solrServer" />
        </bean>
    </beans>
4. 实体:
    public class TbItem implements Serializable {

        @Field
        private Long id;
    
        @Field("item_title")
        private String title;
    
        @Field("item_price")
        private BigDecimal price;
    
    
        @Field("item_image")
        private String image;
    
     
    
        @Field("item_goodsid")
        private Long goodsId;
    
    
        @Field("item_category")
        private String category;
    
        @Field("item_brand")
        private String brand;
    
     
        @Field("item_seller")
        private String seller;
    
        get和set
    
        @Override
        public String toString() {
            return "TbItem{" +
                    "id=" + id +
                    ", title='" + title + '\'' +
                    ", sellPoint='" + sellPoint + '\'' +
                    ", price=" + price +
                    ", stockCount=" + stockCount +
                    ", num=" + num +
                    ", barcode='" + barcode + '\'' +
                    ", image='" + image + '\'' +
                    ", categoryid=" + categoryid +
                    ", status='" + status + '\'' +
                    ", createTime=" + createTime +
                    ", updateTime=" + updateTime +
                    ", itemSn='" + itemSn + '\'' +
                    ", costPirce=" + costPirce +
                    ", marketPrice=" + marketPrice +
                    ", isDefault='" + isDefault + '\'' +
                    ", goodsId=" + goodsId +
                    ", sellerId='" + sellerId + '\'' +
                    ", cartThumbnail='" + cartThumbnail + '\'' +
                    ", category='" + category + '\'' +
                    ", brand='" + brand + '\'' +
                    ", spec='" + spec + '\'' +
                    ", seller='" + seller + '\'' +
                    '}';
        }
    }
5. 需要注意的是在solr库的schema约束中配置域
回复数量: 0
暂无评论~~
  请勿发布不友善或者负能量的内容。与人为善,比聪明更重要!