Solr Là Gì

  -  
Tìm hiểu về Apache Solr

Cài đặt, cấu hình, một số đặc điểm chính(Phần 1)

Solr là một platform (nền tảng) mã nguồn mở dựa trên Apache Lucence có khả năng cung cấp sử dụng Lucene Java làm thư viện cho việc index( đánh chỉ số) và search( tìm kiếm) dữ liệu .Solr nhập dữ liệu dưới dạng XML thông qua HTTP, hoặc sử dụng thư viện để nhập khối lượng lớn dữ liệu. Người dùng có thể truy vấn dữ liệu này thông qua HTTP GET và nhận về một kết quả dạng XML. Solr chạy bên trong một Java servlet container như Tomcat, Jetty hay Resin.

*

Hình 2: Cài đặt thành công apache solr

Config

Có 2 file config chính là: schema.xml và solrconfig.xml nằm trong thư mục "/home/lucct/solr-4.10.1/example/solr/collection1/conf"

Schema.xml dùng để config các trường dữ liệu, cách lưu trữ dữ liệu để sau này ta lưu data vào đó.Solrconfig.xml dùng để config các chức năng (cụ thể ở đây là các request hanlders và các tính năng khác nữa).

Có thể truy cập file Solrconfig.xml bằng cách vào Admin của Solr (view-only):http://localhost:8983/solr/#/collection1/config

Các chức năng cơ bản của Solr

Khả năng tìm kiếm văn bản toàn diện(Full-Text Search) giống kiểu Google.Chỉnh sửa để hiệu năng tốt hơn.Dựa trên các chuẩn mở trong giao tiếp với các hệ thống khác – XML, JSON và HTTPQuản trị dưới dạng giao diện HTML đơn giảnThống kê dưới dạng JMXKhả năng mở rộng ra nhiều server SolrCấu hình đơn giản dễ dàng với định dạng XMLCó khả năng bổ sung các phần mở rộng(plugin) mới. Ví dụ như phân tích mở rộng tiếng Việt: Bắt lỗi chính tả, bỏ dấu,…Cho phép highlighting kết quả tìm kiếm, như cách mà google hiện thị thông tin tóm tắt về kết quả mà ở đó câu truy vấn được in đậmCó thể xây dựng rất nhiều ứng dụng khác mà một trang tìm kiếm cần như: autosuggestion, spellchecking, xây dựng tagcloud, phân loại kết quả clustering (như Bing làm), trending keywords, category navigation, các kết quả liên quan, nhóm kết quả (field collapsed) …Cho phép scale hệ thống một cách dễ dàng khi bạn có một lượng lớn dữ liệu mà không đủ chứa trên một máy chủ hay phải phục vụ rất nhiều người dùng đồng thời.Solr cũng có thể dùng như CSDL NoSQL hay như cache layer, dùng cho các listing cần performance tốt.Solr cũng sắp hỗ trợ realtime cho phép tìm kiếm ngay kết quả sau khi index.


Bạn đang xem: Solr là gì


Xem thêm: Đố Em Đang Nghĩ Gì Beat - Đố Em Biết Anh Đang Nghĩ Gì



Xem thêm: Download Trò Chơi Trúc Xanh Trên Powerpoint ×, Trò Chơi Trúc Xanh

Điều nàyđặc biệt khó khi index rất lớn. Hiện tại Solr cho phép kết quả rât nhanh, nhưng phải hy sinh thời gian index. Với dữ liệu lớn có khi bạn phải mất 30 phút chỉ để cập nhật được một tài liệu.Solr hỗ trợ rất nhiều công cụ để tinh chỉnh kết quả tìm kiếm, bằng tất cả các thông tin mà bạn cung cấp làm sao để kết quả trả về là tốt nhất. Ví dự như đánh trọng số các trường, click log, số lượt view, …

Tài liệu tham khảo