Возвращаясь к теме про Скрытую часть Яндекс Каталога хочу обратить внимание еще на одну особенность — «Источник»:

<urlinfo>
<url domain=»www.administrating.ru»>/</url>
<tcy rang=»2″ value=»20″/>

<topics>
<topic title=»Тема: Компьютеры» url=»http://yaca.yandex.ru/yca/cat/Computers/»/>
</topics>
<textinfo> Тема: Компьютеры Источник: Коллективный</textinfo>
</urlinfo>

Что это за тип источника? Как определяется? — По этим и другим вопросам удалось выяснить Не так уж и много:

- Найдено две ветки форума SE, затрагивающие эту тематику: Источник тИЦ (Частный, коллективный, официальный) и Я.Каталог
- Найдена одна ветка Форума Яндекса: Вопросы к разработчикам (архив 11.2000-05.2007)
- Запись в блоге Что такое тематика для Яндекса?
- Статья «Фасетная организация интернет-каталога и автоматическая жанровая классификация документов«. Единственный найденный официальный источник информации.

Тезисно, выдвигаемые гипотезы:

- В Яндексе используется фасет: «источник информации» (Официальный, СМИ (Пресса), Коллективный, Частный, Анонимный)
- Опять же, не сайты, а документы (странички). Это не к фасету было написано, а к ранжированию результатов поиска (дополнительный параметр для подсчета релевантности).
- Как я понимаю источник — это как был добавлен сайт, то есть если сайт в каталог порекомендовал сам Я или его оф. партнер, то источник официальный и так далее…

Источник информации имеет пять значений: Официальный, СМИ, Неформальный, Персональный Анонимный. С каждым из этих пяти типов источника информации связаны свои особенности подачи предоставляемых сведений – оперативность, достоверность, полнота, уникальность, объективность и т.п. Скорее всего тут в большинстве случаев идет ручной отбор, и нас мало интересует этот параметр. Но если на вас сослался официальный источник сми, типа “комсомольской правды”, а вы известны для яндекса как аноним, то само собой вы получите намного меньший вес.
© Что такое тематика для Яндекса?

Официальная версия:

Значения фасетов для ресурсов интернета проставляются вручную редакторами при описании ресурсов в каталоге «Яндекс». На март 2002 г. в каталоге содержалось описание более 43 тыс. ресурсов, т.е. сайтов или их структурных разделов.

Источник информации имеет пять значений: Официальный, СМИ, Неформальный, Персональный Анонимный. С каждым из этих пяти типов источника информации связаны свои особенности подачи предоставляемых сведений – оперативность, достоверность, полнота, уникальность, объективность и т.п.

© Фасетная организация интернет-каталога и автоматическая жанровая классификация документов.

bookmarks Яндекс Каталог   Источник