СОВРЕМЕННЫЕИНФОРМАЦИОННО-ПОИСКОВЫЕСИСТЕМЫ.
НазареразвитиякомпьютерныхтехнологийиИнтернетавопроспоисканужнойинформациинасайтахнестоялтакостро,таккаксайтоввтовремяпоотношениюксегодняшнимднямбылосовсемнемного.Втегодыпоискосуществлялсяпотематическимкаталогамсайтов,иэтогобылодостаточно.Первымтакимкаталогомв1994годусталYahoo.Тогдаэтотресурсещенебылпоисковоймашиной,апредставлялсобойкаталогзарегистрированныхнанемсайтов.Такжестоитотметить,чтоИнтернетомпользовалисьвосновномсотрудникинаучныхорганизацийипреподавателиуниверситетов.ШирокаяаудиториявоВсемирнуюпаутинупоканепопала. Прорывначалсявовторойполовине1990-хгодов.В1995годупоявилисьпервыеполноценныепоисковыесистемы–LucosиAltavista.В1997годупоявилисьGoogleиYandex–сегодняшниелидерысредипоисковыхсистемвРоссииивмире. Далее–долгийпутьсовершенствованияалгоритмовпоиска,созданиесвоихбазданных.Витогеоказалось,чтоуспешноэтизадачимогутрешатьлишьединицы–насегодняшнийденьтолькотрипоисковыхсистемызарубежомобладаютсвоимиалгоритмамипоискаиинформационнымибазами-Google,Yahoo,MSNSearch.ВРоссииэто–ЯндексиSearch.Mail.ru.Поисковаясистемасостоитизследующихкомпонентов: · WEB-сервер:компьютер,вкоторомнаходитсяпоисковаямашина; · паук–программа,разработаннаядлясканированияиработающаясHTML-кодомстраницынапрямую,скачиваетеевбазуданныхпоисковоймашины; · путешествующийпаук–программадляанализавнешнихссылокстраниц; · индексатор–анализируетHTML-код,т.еиндексируетскачанныеWEB-страницы; · базаданных–здесьхранятсязакаченныеWEB-страницы; · поисковыйдвижок,которыйвыдаетрезультаты,–именноэтапрограммарешаетпорядоксоответствияWEB-страницзапросампользователей,т.еформируетвыдачу.
ФОРМУЛИРОВАНИЕЗАПРОСОВВИПС. Благодарявнедрениюновыхязыковыхтехнологийпоисковыесистемысталигораздолучшепониматьпользователя.Поисковикимогутискатькакзапрашиваемоеслово,такиегословоформы.Этопозволяетделатьболееточнымирезультатыпоиска.Конечно,страницысословоформаминебудутвчислепервыхрезультатовпоиска,ноэлементыискусственногоинтеллектаналицо.Этотфактнеобходимоучитыватьприпостроениипоисковыхзапросов. Следуетпомнитьотом,чтопоисковыесистемыприобработкезапросанеучитываютположениерегистрасимволов,знакипрепинания,таккакониигнорируютсяпоисковымисерверами.Однакоприпостроениирасширенныхзапросов,дающихболееточныерезультатыпоиска,традиционныезнакипрепинанияиспользуются.Большинствопоисковыхсистемможетборотьсясопечатками. Основнаязадачапользователяприсоставлениипоисковогозапроса—выделитьключевыеслова,задачапоисковогосервера—наилучшимобразомобработатьвведенныйзапрос.Вотнесколькоправилсоставлениязапросов: • выбиратьнеобходимотолькосамыеважныеключевыеслова,касающиесярассматриваемойтемы; • количествословдолжнобытьоптимальным(неслишкоммного,ноинеслишкоммало); • приотрицательныхрезультатахпоиска,необходимоиспользоватьболее«мягкие»условиядляпоследующегозапросаилииспользоватьальтернативнуюпоисковуюсистему(таккакмеханизмыработыпоисковиковотличаютсядруготдруга,тоирезультатытакжемогутразличаться); • дляобеспеченияболееэффективногопоисканеобходимоиспользоватьвозможностирасширенногопоискасуказаниеммножестваразличныхпараметров,атакжепоискасиспользованиемязыказапросов.
DATAMINING Развитиеметодовзаписиихраненияданныхпривелокбурномуростуобъемовсобираемойианализируемойинформации.Объемыданныхнастольковнушительны,чточеловекупростонепосилампроанализироватьихсамостоятельно,хотянеобходимостьпроведениятакогоанализавполнеочевидна,ведьвэтих"сырых"данныхзаключенызнания,которыемогутбытьиспользованыприпринятиирешений.Длятогочтобыпровестиавтоматическийанализданных,используетсяDataMining. DataMining–этопроцессобнаруженияв"сырых"данныхранеенеизвестныхнетривиальныхпрактическиполезныхидоступныхинтерпретациизнаний,необходимыхдляпринятиярешенийвразличныхсферахчеловеческойдеятельности.DataMiningявляетсяоднимизшаговKnowledgeDiscoveryinDatabases. Информация,найденнаявпроцессепримененияметодовDataMining,должнабытьнетривиальнойиранеенеизвестной,например,средниепродажинеявляютсятаковыми.Знаниядолжныописыватьновыесвязимеждусвойствами,предсказыватьзначенияоднихпризнаковнаосноведругихит.д.Найденныезнаниядолжныбытьприменимыинановыхданныхснекоторойстепеньюдостоверности.Полезностьзаключаетсявтом,чтоэтизнаниямогутприноситьопределеннуювыгодуприихприменении.Знаниядолжныбытьвпонятномдляпользователянематематикавиде.Например,прощевсеговоспринимаютсячеловекомлогическиеконструкции"если…то…".Болеетого,такиеправиламогутбытьиспользованывразличныхСУБДвкачествеSQL-запросов.Вслучае,когдаизвлеченныезнаниянепрозрачныдляпользователя,должнысуществоватьметодыпостобработки,позволяющиепривестиихкинтерпретируемомувиду. Алгоритмы,используемыевDataMining,требуютбольшогоколичествавычислений.РаньшеэтоявлялосьсдерживающимфакторомширокогопрактическогопримененияDataMining,однакосегодняшнийростпроизводительностисовременныхпроцессоровснялостротуэтойпроблемы.Теперьзаприемлемоевремяможнопровестикачественныйанализсотентысячимиллионовзаписей.
Популярное: Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы... Почему стероиды повышают давление?: Основных причин три... Почему человек чувствует себя несчастным?: Для начала определим, что такое несчастье. Несчастьем мы будем считать психологическое состояние... ![]() ©2015-2024 megaobuchalka.com Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (354)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |