Logo GenDocs.ru

Поиск по сайту:  

Загрузка...

Поисковые системы - файл 1.docx


Поисковые системы
скачать (1339.9 kb.)

Доступные файлы (1):

1.docx1340kb.09.12.2011 06:42скачать

содержание
Загрузка...

1.docx

Реклама MarketGid:
Загрузка...
Поисковая система «Черепаха».
Относительно новая поисковая система, появилась в конце 2002 года. Отличительной особенностью Turtle является «Поиск по фрагменту», т.е. поиск с помощью технологии сравнения похожих документов с заданным фрагментом текста. Главная цель этой функции — обеспечить возможность быстрого поиска «плагиата», т.е. материалов, которые несанкционированно копируются с одного сайта на другой. Данная система имеет своего поискового робота, который автоматически добавляет сайты в собственную базу данных.

Группа компаний "Стек", имеющая прямое отношение к созданию "Рамблера", объявила об открытии ещё одного поисковика. Авторы назвали его "Черепаха", намекая на неспешность, с которой шла разработка системы. Адрес поисковика www.turtle.ru.

В "Черепахе" учтены последние достижения в области поисковых машин. При оценке важности размещённого в Сети документа поисковик принимает во внимание ссылки на него на других страницах. Очевидно, что документы, на которые много ссылок, представляют особый интерес. Оправданность такого подхода доказана успехом поисковика Google. Кроме того, на сортировку результатов поиска влияют частотность разыскиваемого слова в документе, местоположение разыскиваемого слова на странице и в разных полях HTML -тэгов.

По сравнению со своими оффлайновыми родственниками, новый поисковик действует достаточно резво и эффективно. Так на запрос "черепаха", обработанный сервером за 0,0033 секунды, Turtle выдал 53096 документов. В то же время Яндекс на аналогичную просьбу выдает 55473 результата поиска, а Rambler - 31108. Новая поисковая машина понимает 24 языка. "Скрупулезно изучая каждую ячейку паутины, Turtle выясняет, с какой частотой и по каким принципам изменяется ее содержимое, чтобы точно знать, когда вернуться за новостями. Такими характеристиками не может похвастаться ни один из старожилов зоопарка!" - сообщают создатели механизма, имея в виду под словом "зоопарк" Рунет.

Интерфейс нового поисковика достаточно лаконичен и удобен. Необычной возможностью "Черепахи" является возможность просматривать список ссылок на найденный документ и изменения, происходившие в нём за определённый период. Существует сокращённая версия "Черепахи" - www.turtilla.ru.

Создатели поисковика Turtle сообщают также, что владелец любого сайта может запретить роботам поисковой машины индексировать как ресурс в целом, так и отдельные документы. Роботы индексируют и динамические страницы, однако "Обычно мы исключаем из числа сканируемых документы, которые генерируют неоправданно большое количество новых ссылок. Кроме того, мы безжалостно "выкусываем" из URL фрагменты, которые поисковая машина считает частью, предназначенной для идентификации сессии. Мы не рекомендуем помещать в URL документа такие поля, для этого существует механизм "Cookies" - предупреждают разработчики.



Кстати, по адресу turtilla.ru расположена простая форма для поиска, наподобие ya.ru у Яндекса.

Разработчики утверждают, что «поисковик» «обладает возможностями перспективного создания тематических, территориальных коллекций и поиска по ним, а также создания ретроспективной базы данных в любой заданный промежуток времени в прошлом». Там же говорится, что «масштабируемость Turtle, построенной на принципе распредёленности ресурсов, практически не ограничена, а благодаря созданию нового программного языка и уникального программного обеспечения составляющие системы самостоятельно совершенствуются».



Поисковая система «Webalta».
Открытое акционерное общество «Вебальта» — российская IT-компания. Основана 25 августа 2005 года. Компания специализируется на разработке инновационных решений в области поиска информации, интернет-рекламы и развлечений.

Одной из уникальных инноваций, созданных специалистами компании, является публикуемый Webalta индекс Уровня доверия к сайтам. Помимо входящих ссылок и цитат, индекс учитывает и множество других факторов, вплоть до времени регистрации доменного имени и репутации компании, на чьих серверах физически размещены страницы сайта.

Создание и обкатка поисковой машины велись на редкость интенсивно. Разработкой занимались специалисты с солидным опытом успешных интернет-проектов. Менее чем за год компании удалось подготовить к выходу в свет продвинутый поисковик общего назначения. При этом финансирование проекта на 100% осуществлялось самой компанией.

Сервис был запущен в конце 2005 года. Компанией было сделано немало громких зявлений, однако по настоящему соствить сколько нибудь заметную конкуренцию ни Яндексу, ни Рамблеру, ни Google у Вебальты пока не получается. Трафик с этой поисковой системы не превышает одного процента.

И этому есть свои причины.

Во-первых, вебальта не очень популярна. Многи пользователи даже не подозревают о ее существовании. То есть, необходима более агрессивная рекламная политика.

Во-вторых, размер индекса у Вебальты очень маленький. То есть, велика вероятность, что самый необходимый пользователю сайт не был проиндексирован. Соостветсвенно качество выдачи поисковых результатов хуже чем у конкурентов.

Однако, несмотря не на что, Webalta не теряет надежды и пытается расширить свое влияние и популярность. Для этого используются различные способы и любые подходящие моменты.

Новая поисковая система - полностью российский проект. К тому же, "от и до" оригинальная разработка специалистов Webalta. Для повышения точности ответов на запросы пользователей использован целый ряд ноу-хау. Это и учёт русской морфологии, и новый механизм индексирования документов, и модернизированная процедура отбора и сортировки результатов. Высокая частота обновления поисковой базы обеспечивает актуальность найденной с помощью Webalta информации. До 6 июля 2006 года поисковая система Webalta находилась в стадии закрытого тестирования, в котором принимали участие более 10 000 человек.

На момент перехода к публичному тестированию в поисковике Webalta доступно для поиска 227 089 270 документов, общим объёмом 6 181Гб.






Поисковая система Yahoo

      Yahoo был основан в 1994, и на сегодняшний день это самый старый и наиболее полный каталог интернет-ресурсов.

      Удивительно, но эта невероятно популярная система, обслуживающая миллионы запросов ежедневно, зародилась как простая коллекция закладок, которую пополняли всего 2 человека - Дэвид Фило и Джерри Янг.

      ^ Yahoo является наиболее популярным поисковым средством. Секрет успеха Yahoo заключается в людях. Yahoo имеет около 150 редакторов, для того чтобы составлять и редактировать содержимое своих каталогов. Yahoo имеет базу данных в более чем 1 млн. проиндексированных сайтов. Также, в случае нехватки своей собственной базы данных, Yahoo использует базу данных Google (до июля 2000 года Yahoo пользовался базой данных Inktomi).



Поисковая система GoGo.ru
      Компания Mail.Ru объявила о запуске бета-версии собственной поисковой системы GoGo.Ru. Поисковый алгоритм был полностью разработан программистами компании. Впервые в российском Интернете на проекте реализован поиск по видео.

      Компания Mail.Ru объявила о запуске в тестовую эксплуатацию собственной поисковой технологии, на разработку которой было потрачено более 1 года. Вложения в проект составили более 700 тыс. долларов. Проект выходит на рынок под независимым брендом - GoGo.Ru (http://www.gogo.ru).

      Цель проекта – создание поискового сервиса нового поколения, что, по мнению разработчиков, предполагает несколько важных особенностей:

      - максимально доступный, визуально привлекательный, удобный и понятный интерфейс (дружелюбный дизайн, крупный шрифт, возможность получить дополнительную информацию с сайта, не переходя на него и т.п.);

- специальные инструменты, позволяющие пользователю осуществлять фильтрацию контента в зависимости от его потребностей;

- равные возможности для поиска различных типов информации – текстов, фото, видео, вопросов и ответов на естественном языке и т.п.

  GoGo.Ru представляет собой попытку не только обеспечить высокую релевантность результатов поиска, но и предугадать текущие и потенциальные нужды пользователя и его представления об идеальном поисковом сервисе.

  Разработчики GoGo.Ru предложили новый подход в работе с поисковой информацией - помимо традиционной сортировки при помощи общих алгоритмов определения релевантности, пользователю предоставляется возможность отфильтровать результаты поиска в зависимости от его целей.

 На первом этапе в текстовом поиске существует 3 фильтра, подразделяющих источники информации на 3 типа: информационные, коммерческие и пользовательские (блоги, форумы). Например, если пользователь ищет информацию справочного характера, то логично будет воспользоваться вкладкой «информационные», если его интересуют в первую очередь товарные предложения – скорее подойдет раздел «коммерческие», ну а для того, чтобы узнать мнение других пользователей о чем-то лучше выбрать «блоги, форумы». При этом принадлежность какого-либо источника к тому или иному типу определяется системой автоматически.

Еще одним инновационным шагом стала разработка первого в России поиска по видеороликам. На данный момент поисковый механизм GoGo.Ru индексирует видео на наиболее популярных российских видеохостингах – Видео@Mail.Ru, Rutube.ru, Loadup.ru и Rambler Vision, в дальнейшем в список войдут другие популярные сайты для хранения видео, в том числе и западные.

Поиск по изображениям также реализован с применением инновационного подхода – при поиске картинок GoGo.Ru пытается отделять фотографии от других картинок и позволяет выбрать необходимый размер изображения.

И, наконец, GoGo.Ru интегрирован с крупнейшим в России социальным поиском – проектом Ответы@Mail.Ru и позволяет осуществлять полнотекстовый поиск по контенту проекта, на текущий момент накопившему базу знаний, составляющую около 45 миллионов ответов на 5 миллионов вопросов. Объем первоначальной базы документов, индексируемых GoGo.Ru, составляет более полутора миллиардов единиц. В дальнейшем эта база будет постоянно увеличиваться.


^



Писковая система Poisk



POISK.com v.2.0 - это каталог сайтов и полнотекстовая поисковая система, позволяющая пользователям находить нужную информацию на сайтах белорусского интернета.

Одна из особенностей проекта - поиск по динамическим ресурсам: новости, форумы, доски объявлений.

Кроме того, POISK.com позволяет веб-мастерам устанавливать на свои сайты специальные формы для поиска как в базе POISK.com, так и на самом сайте веб-мастера.

POISK.com v.2.0 - не только поисковый сервис, но и серьезная рекламная площадка. Рекламными местами на страницах проекта управляет система на базе "движка" AdRevolver, интегрированная с одной из самых современных белорусских баннерных сетей - "Красной Баннерной". Эта система, не имеющая сегодня аналогов в Беларуси, обеспечивает контекстную привязку демонстрирующихся баннеров к тематике запроса.

История проекта началась осенью 1999 года. Проект был основан Сергеем Осиповым (rg.by), Олегом Тишковым (belarusmedia.com) и Алексеем Колбом (nsys.by). В мае 2000 года POISK.com v.1.0 стал лауреатом международного фестиваля Золотой Волк, а в сентябре 2000 победил на Белорусском Интернет-Фестивале в номинации "Поисковые системы и каталоги".

В начале 2001 года POISK.com был полностью выкуплен компанией Red Graphic и кардинально переработан. От предыдущей версии POISK.com в неизменённом виде сохранился только логотип.

Poisk.com v.2.0. стал победителем VI Фестиваля региональной рекламы "Да...Ёж!" в феврале 2002 (3 место в номинации "Реклама в интернете"). В мае 2002 года проект завоевал 2-е место в категории "Информационные ресурсы" конкурса веб-дизайна и интернет-рекламы III Киевского международного фестиваля рекламы. А баннеры, созданные дизайнерами Red Graphic для проекта Poisk.com, заняли на этом престижном фестивале 2-e место в категории "Баннеры".







Писковая система Mavicanet

Mavicanet – это:

- Каталог ресурсов Сети, редактируемый людьми — добровольными редакторами. Это не более чем система самопомощи.

- Многоязычный Каталог, рассчитанный на все языковые ресурсы Интернета.

- Каталог, сделанный читателями для читателей, с максимальным вниманием к нуждам пользователя. Это система поиска информации в Сети.

Вы можете на Mavicanet:

- искать и находить информацию на различных языках;

- добавить сайт;

- поместить уже имеющиеся в Каталоге сайты в новые категории.

Каждый пользователь может выступить как эксперт в своей области. В Каталог все время приходят новые эксперты, чтобы упорядочить различные области знания. Каждый пользователь улучшает Каталог, делает поиск легче.

Каталог поддерживает несколько языков, и количество поддерживаемых языков постоянно растет. Это значит, что интерфейс каталога, названия управляющих элементов, названия категорий переведены на соответствующий язык, и сайты можно описывать на этом языке. Язык просмотра Каталога можно переключить на любой странице, чтобы все время работы с каталогом находиться в родной языковой среде.

В данном Каталоге у одного сайта может быть несколько описаний на разных языках. Основными являются описания на языке самого сайта и английское описание, но можно добавить и описания на других поддерживаемых языках. Полные названия языков на английском рядом с описанием сайта указывают, на каких языках это описание можно прочесть. Если нажать на такое название, страница перестроится на выбранный язык.

Каталог представляет собой довольно сложную математическую структуру — направленный граф. Эта структура получила оригинальное название — "мангры", т. е. деревья, сросшиеся ветвями. Это значит, что у одной дочерней категории может быть несколько родительских. Поэтому к одной категории может вести несколько путей (написаны сверху, над названием данной категории). Такая структура дает пользователю дополнительные возможности при навигации по Каталогу.

Пользователь может искать информацию в Каталоге, пользуясь путями (над названием выбранной категории), дополнительными связями (типа "Смотрите также" — под списком категорий) и выходом в сестринские категории. Сестринские категории — это те, которые являются дочерними к родительским категориям той, которую Вы смотрите. Нажав на название просматриваемой категории, пользователь увидит список ее "сестер".

Еще одно средство навигации по Каталогу — фильтры. Если Вам нужна информация только в одном определенном аспекте — например, новости, или справочная информация, или предложения о работе в различных областях, Вы можете выбрать соответствующий фильтр. Тогда во всех разделах Каталога будут 

видны только те сайты, которые содержат информацию по интересующему Вас аспекту.

В Каталоге предусмотрены различные виды сортировки сайтов в категориях. В окне под выбором фильтров есть возможность выбрать несколько различных сортировок. Первая сортировка обладает приоритетом над последующими — значит, можно отсортировать сайты, например, по качеству (оценке, данной редакторами), а внутри каждого качества — по алфавиту.

Пользователь может добавить сайт в любую категорию. Пользователь может добавить новую привязку к категории для любого сайта, находящегося в каталоге. Ведь сайты многогранны, в них содержится самая разная информация.




Скачать файл (1339.9 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации
Рейтинг@Mail.ru