> да, кстати, а уж не данные в XML ли там индексируют, а?

от XML мы избавились как от страшного сна.

С точки нормализации основного каркаса данных - там все настолько
путём, что искать по совокупности критериев очень сложно.

Паспорт хранится отдельно от человека. Связываются косвенно, через
корневую таблицу объектов. Есть ещё адрес - он точно так же, отдельно
хранится и так же связывается. Адрес еще юзает дерево адресов. А в
этом дереве могут быть дубли (или вообще бред юзера, типа Москва в
городе Москва)

А теперь вот задача. Найдите документ в котором есть вот чел с такими
(на выбор) критериями. Я не ленивый программист, честно. И вроде не
тупой. Но, @ля, впадаю в кому от мысли, что нужно искать и там, и там,
и там и там. И вот так, и вот так, и вот так. Не поиск у нас есть. Но
меня он никогда не радовал.

Хочу искать просто, однотипно и в одном месте. В Гугле.

Мы сейчас прикрутили две вещи. Поиск по адресу, указываемому в виде
строки. То, что адрес оформлен в виде дерева - нам теперь по боку. И
есть еще одна проба пера - сквозной поиск документов по ФИО чела или
имени фирмы.

Поглядели на тормоза, связанные с джоинами и вот теперь я долблю идею
пар.

Кстати, я начал немного понимать идею стоп-слов, которые по идее дожны
сократить число комбинаций. Но для моего случая - когда нужно искать и
обязательно найти, если оно там есть, стоп-слова можно выявить только
на основе конкрентной статистики. Которой пока нет.

Коваленко Дмитрий.

Ответить