Home > mailing lists

Re: pg full text search very slow for Chinese characters - Mailing list pgsql-general

From	Tom Lane
Subject	Re: pg full text search very slow for Chinese characters
Date	September 10, 2019 16:21:45
Msg-id	2533.1568132505@sss.pgh.pa.us Whole thread Raw
In response to	pg full text search very slow for Chinese characters (Jimmy Huang <jimmy_huang@live.com>)
Responses	Re: pg full text search very slow for Chinese characters
List	pgsql-general

Tree view

Jimmy Huang <jimmy_huang@live.com> writes:
> I tried pg_trgm and my own customized token parser https://github.com/huangjimmy/pg_cjk_parser

pg_trgm is going to be fairly useless for indexing text that's mostly
multibyte characters, since its unit of indexable data is just 3 bytes
(not characters).  I don't know of any comparable issue in the core
tsvector logic, though.  The numbers you're quoting do sound quite awful,
but I share Cory's suspicion that it's something about your setup rather
than an inherent Postgres issue.

            regards, tom lane

pgsql-general by date:

From: Jimmy Huang
Date: 10 September 2019, 16:20:57
Subject: Re: pg full text search very slow for Chinese characters

From: Andreas Joseph Krogh
Date: 10 September 2019, 16:42:26
Subject: Re: pg full text search very slow for Chinese characters

Re: pg full text search very slow for Chinese characters - Mailing list pgsql-general

Previous

Next