И для картинок и для семантики в базу сохраняются вектора. Картинку в вектор Саша переводил своей тулзой
https://github.com/akorotkov/imgsmlr(если просто, то сначала преобразование Фурье, потом усреднение по участкам и
получаетсяматрица 4х4) для слов можно брать https://code.google.com/p/word2vec/
On Oct 16, 2014, at 11:04 PM, Dmitry E. Oboukhov <unera@debian.org> wrote:
>> Всем привет.
>
>> Обновил патч на текущую базу кода. Взять можно на ветке в джитхабе
https://github.com/kelvich/postgresql/compare/distances?expand=1или из того письма по ссылке Олега.
>
> спасибо огромное.
>
> можно будет knn делать на этой штуковине.
>
> Народ, а скажите вот такую штуку.
>
> на докладе на митапе показывали как картинки индексируют итп.
> похожие находят.
>
> только я не очень понимаю как это к KNN привести.
>
> вот допустим у меня есть некая функция, которая вычисляет dist между
> двумя картинками
>
> select dist(img1, img2)
>
> допустим 0.52
>
> select dist(img2, img3)
>
> допустим 0.64
>
> Далее хотим это дело в cube положить
>
> но как?
>
> я игрался на том что клал в cube так:
> (предполагаем что картинкочная похожесть - один из критериев KNN)
>
> insert into ... cube(ARRAY[a,b,c,dist(img0, img_i)])
>
> такой подход работает, но очень большие трудности с выбором img0
>
> для картинок или слов - непонятно что делать опорой
>
> или есть еще какие-то варианты как в индекс складывать что-то между
> чем вычисляются расстояния, но базы нет?
>
>
>
> --
>
> . ''`. Dmitry E. Oboukhov
> : :’ : email: unera@debian.org jabber://UNera@uvw.ru
> `. `~’ GPGKey: 1024D / F8E26537 2006-11-21
> `- 1B23 D4F8 8EC0 D902 0555 E438 AB8C 00CF F8E2 6537