搜索速度太慢。如何使用 pg_search gem 在 Rails 应用程序中重新索引 postgres 数据库?

问题描述 投票:0回答:3

我正在我的应用程序中使用 pg_search gem 来实现搜索功能。在添加 pg_search 之前,我已经向 Postgres 数据库的表中添加了 130,000 行数据。现在,当我运行搜索时,花费的时间太长,即大约 16000 毫秒。

我正在关注 Railscasts Episode343 在 PostgreSQL 中的全文搜索

这是我的 pg_search 模型中的代码:

include PgSearch
pg_search_scope :search, :against => [:applicant, :generic_name, :trade_name, :description],
using: {tsearch: {dictionary: "english"}},
ignoring: :accents

def self.text_search(query)
    if query.present?
        rank = <<-RANK
            ts_rank(to_tsvector(generic_name), plainto_tsquery(#{sanitize(query)})) +
            ts_rank(to_tsvector(trade_name), plainto_tsquery(#{sanitize(query)}))+
            ts_rank(to_tsvector(description), plainto_tsquery(#{sanitize(query)})) +
            ts_rank(to_tsvector(applicant), plainto_tsquery(#{sanitize(query)})) 
        RANK
        where("generic_name @@ :q or trade_name @@ :q or description @@ :q or applicant @@ :q", q: query)
    else
        all
    end
end

我的服务器输出如下:

  Parameters: {"utf8"=>"✓", "query"=>"intraocular lenses"}
  Parameters: {"utf8"=>"✓", "query"=>"intraocular lenses"}
  Rendered layouts/_search.html.erb (1.5ms)
  Rendered layouts/_search.html.erb (1.5ms)
  Rendered medicaldevices/index.html.erb within layouts/application (16535.9ms)
  Rendered medicaldevices/index.html.erb within layouts/application (16535.9ms)
  Rendered layouts/_header.html.erb (1.8ms)
  Rendered layouts/_header.html.erb (1.8ms)
  Rendered layouts/_footer.html.erb (0.1ms)
  Rendered layouts/_footer.html.erb (0.1ms)
Completed 200 OK in 16574ms (Views: 60.3ms | ActiveRecord: 16510.7ms)
Completed 200 OK in 16574ms (Views: 60.3ms | ActiveRecord: 16510.7ms)

这是我用于索引的迁移文件

class AddSearchIndexToMedicaldevices < ActiveRecord::Migration

 def up
     execute "create index generic_name on medicaldevices using gin(to_tsvector('english',     generic_name))"
    execute "create index trade_name on medicaldevices using gin(to_tsvector('english', trade_name))"
    execute "create index description on medicaldevices using gin(to_tsvector('english', description))"
    execute "create index applicant on medicaldevices using gin(to_tsvector('english', applicant))"
  end

  def down
    execute "drop index generic_name"
    execute "drop index trade_name"
    execute "drop index description"
    execute "drop index applicant"
  end

end
postgresql ruby-on-rails-4 pg-search reindex
3个回答
3
投票

我想这就是你的答案(http://www.postgresql.org/docs/8.3/static/textsearch-tables.html

12.2.2。创建索引

我们可以创建一个 GIN 索引(第 12.9 节)来加速文本搜索:

CREATE INDEX pgweb_idx ON pgweb USING gin(to_tsvector('english', body));

请注意,使用了 to_tsvector 的 2 参数版本。只有指定配置名称的文本搜索函数才能在表达式索引中使用(第 11.7 节)。这是因为索引内容必须不受default_text_search_config 的影响。如果它们受到影响,索引内容可能会不一致,因为不同的条目可能包含使用不同文本搜索配置创建的 tsvector,并且无法猜测哪个是哪个。正确转储和恢复这样的索引是不可能的。

由于上面的索引中使用了 to_tsvector 的双参数版本,因此只有使用具有相同配置名称的 to_tsvector 的双参数版本的查询引用才会使用该索引。 也就是说,WHERE to_tsvector('english', body) @@ 'a & b' 可以使用索引,但 WHERE to_tsvector(body) @@ 'a & b' 不能。 这样可以确保只使用索引使用与创建索引条目相同的配置。


1
投票

塞尔吉奥, 我按照你说的方法做了,效果很好。 我必须将上面的旧代码更改为以下内容:

where("to_tsvector('english', generic_name) @@ plainto_tsquery(:q) or 
       to_tsvector('english', trade_name) @@ plainto_tsquery(:q) or 
       to_tsvector('english', description) @@ plainto_tsquery(:q) or 
       to_tsvector('english', applicant)@@ plainto_tsquery(:q)", q: query).order("#{rank} DESC")

我必须添加 planto_tsquery(q) 来搜索多词搜索。 谢谢!


0
投票

我知道我迟到了这个问题,但这对我有用,而无需在模型中创建 where 查询。事实证明 pg search 会同时在所有字段上进行动态范围搜索。所以在模型中我会有

 pg_search_scope :search_by_content, lambda { |query|
{
  against: [:column1, :column2],
  query: query,
  using: {
    :tsearch => { :prefix => true }
  }
}

并在迁移中添加

execute <<~SQL
  CREATE INDEX index_name ON model_name USING gin(
    (
      to_tsvector('simple'::regconfig, COALESCE((column1)::text, ''::text)) ||
      to_tsvector('simple'::regconfig, COALESCE(column2, ''::text))
  )
SQL
© www.soinside.com 2019 - 2024. All rights reserved.