我正在我的应用程序中使用 pg_search gem 来实现搜索功能。在添加 pg_search 之前,我已经向 Postgres 数据库的表中添加了 130,000 行数据。现在,当我运行搜索时,花费的时间太长,即大约 16000 毫秒。
我正在关注 Railscasts Episode343 在 PostgreSQL 中的全文搜索
这是我的 pg_search 模型中的代码:
include PgSearch
pg_search_scope :search, :against => [:applicant, :generic_name, :trade_name, :description],
using: {tsearch: {dictionary: "english"}},
ignoring: :accents
def self.text_search(query)
if query.present?
rank = <<-RANK
ts_rank(to_tsvector(generic_name), plainto_tsquery(#{sanitize(query)})) +
ts_rank(to_tsvector(trade_name), plainto_tsquery(#{sanitize(query)}))+
ts_rank(to_tsvector(description), plainto_tsquery(#{sanitize(query)})) +
ts_rank(to_tsvector(applicant), plainto_tsquery(#{sanitize(query)}))
RANK
where("generic_name @@ :q or trade_name @@ :q or description @@ :q or applicant @@ :q", q: query)
else
all
end
end
我的服务器输出如下:
Parameters: {"utf8"=>"✓", "query"=>"intraocular lenses"}
Parameters: {"utf8"=>"✓", "query"=>"intraocular lenses"}
Rendered layouts/_search.html.erb (1.5ms)
Rendered layouts/_search.html.erb (1.5ms)
Rendered medicaldevices/index.html.erb within layouts/application (16535.9ms)
Rendered medicaldevices/index.html.erb within layouts/application (16535.9ms)
Rendered layouts/_header.html.erb (1.8ms)
Rendered layouts/_header.html.erb (1.8ms)
Rendered layouts/_footer.html.erb (0.1ms)
Rendered layouts/_footer.html.erb (0.1ms)
Completed 200 OK in 16574ms (Views: 60.3ms | ActiveRecord: 16510.7ms)
Completed 200 OK in 16574ms (Views: 60.3ms | ActiveRecord: 16510.7ms)
这是我用于索引的迁移文件
class AddSearchIndexToMedicaldevices < ActiveRecord::Migration
def up
execute "create index generic_name on medicaldevices using gin(to_tsvector('english', generic_name))"
execute "create index trade_name on medicaldevices using gin(to_tsvector('english', trade_name))"
execute "create index description on medicaldevices using gin(to_tsvector('english', description))"
execute "create index applicant on medicaldevices using gin(to_tsvector('english', applicant))"
end
def down
execute "drop index generic_name"
execute "drop index trade_name"
execute "drop index description"
execute "drop index applicant"
end
end
我想这就是你的答案(http://www.postgresql.org/docs/8.3/static/textsearch-tables.html)
12.2.2。创建索引
我们可以创建一个 GIN 索引(第 12.9 节)来加速文本搜索:
CREATE INDEX pgweb_idx ON pgweb USING gin(to_tsvector('english', body));
请注意,使用了 to_tsvector 的 2 参数版本。只有指定配置名称的文本搜索函数才能在表达式索引中使用(第 11.7 节)。这是因为索引内容必须不受default_text_search_config 的影响。如果它们受到影响,索引内容可能会不一致,因为不同的条目可能包含使用不同文本搜索配置创建的 tsvector,并且无法猜测哪个是哪个。正确转储和恢复这样的索引是不可能的。
由于上面的索引中使用了 to_tsvector 的双参数版本,因此只有使用具有相同配置名称的 to_tsvector 的双参数版本的查询引用才会使用该索引。 也就是说,WHERE to_tsvector('english', body) @@ 'a & b' 可以使用索引,但 WHERE to_tsvector(body) @@ 'a & b' 不能。 这样可以确保只使用索引使用与创建索引条目相同的配置。
塞尔吉奥, 我按照你说的方法做了,效果很好。 我必须将上面的旧代码更改为以下内容:
where("to_tsvector('english', generic_name) @@ plainto_tsquery(:q) or
to_tsvector('english', trade_name) @@ plainto_tsquery(:q) or
to_tsvector('english', description) @@ plainto_tsquery(:q) or
to_tsvector('english', applicant)@@ plainto_tsquery(:q)", q: query).order("#{rank} DESC")
我必须添加 planto_tsquery(q) 来搜索多词搜索。 谢谢!
我知道我迟到了这个问题,但这对我有用,而无需在模型中创建 where 查询。事实证明 pg search 会同时在所有字段上进行动态范围搜索。所以在模型中我会有
pg_search_scope :search_by_content, lambda { |query|
{
against: [:column1, :column2],
query: query,
using: {
:tsearch => { :prefix => true }
}
}
并在迁移中添加
execute <<~SQL
CREATE INDEX index_name ON model_name USING gin(
(
to_tsvector('simple'::regconfig, COALESCE((column1)::text, ''::text)) ||
to_tsvector('simple'::regconfig, COALESCE(column2, ''::text))
)
SQL