Пошук навчальних матеріалів по назві і опису в нашій базі:

Оцінка ефективності функціонування сучасних інформаційно-пошукових систем інтернету




32.4 Kb.
НазваОцінка ефективності функціонування сучасних інформаційно-пошукових систем інтернету
Дата конвертації19.11.2012
Розмір32.4 Kb.
ТипДокументы

ОЦІНКА ЕФЕКТИВНОСТІ ФУНКЦІОНУВАННЯ СУЧАСНИХ ІНФОРМАЦІЙНО-ПОШУКОВИХ СИСТЕМ ІНТЕРНЕТУ

Ганжа С.М.1, Гуртовий С.В. 1, Ганжа Ю.С.2

Технологічний інститут СНУ ім. В. Даля (м. Сєвєродонецьк)1

Харківський національний університет радіоелектроніки2


Завданням було оцінити ефективність функціонування інформаційно-пошукових систем, базуючись на результатах якої, надалі буде побудована система для ділової розвідки по відкритих джерелах.

Використана нами концепція тестування укладалася в обчисленні двох величин - релевантності й глибини пошуку для перших 10 сторінок, видаваних інформаційно-пошуковою системою (ІПС).

Релевантність визначалося як відношення знайдених релевантних документів до десяти перших розглянутих результатів. Тестові варіанти містили запити, релевантність яких не можна було визначити без участі користувача: по ступеню відповідності інформації з документа й реальної інформаційної потреби користувача; по ступеню близькості предмета (тематики) інформаційної потреби й знайденого документа; по ступеню корисності інформаційного ресурсу для завдання, розв'язуваного користувачем, з погляду тимчасових витрат, способу взаємодії користувача із системою й т.п. .

Під глибиною користувальницького пошуку розуміється сума двох величин D = m + c, де m – відстань від першого результату до релевантного, а с – кількість кликів «мишею», що знадобилися для виходу на релевантну сторінку. Максимально кращий результат D = 1 досягається при m = 1 (релевантний документ перебуває на першому місці в списку) і c = 0 (користувач одержує необхідну інформацію із фрагмента тексту). Під кликами розумілися саме переходи зі сторінки на сторінку за допомогою кликів миші; використання скролера або клавіш «page up», «page down» не враховувалося. Кожна ІПС оцінювалася по сумі величин D для перших десяти результатів. Якщо релевантні документи не були знайдені в перших десяти результатах, то дана ІПС одержувала максимальну кількість балів – D = (m = 10) + (c = 10) = 20, що було найгіршим результатом, оскільки оцінка проводилася по регресивній шкалі. Для знаходження релевантного документа робилося не більше 10 кликів. Якщо після 10 кликів релевантний документ не був знайдений, системі приписувалася максимальна кількість балів. Оскільки на сторінці могло бути досить багато (до декількох десятків) посилань на інші сторінки, були сформульовані наступні правила переходу по посиланнях. Першим відкривалося посилання, у якому зустрічалися всі знаменні слова запиту + термін, що відображає умови релевантності. Також пріоритетом користувалися посилання, у яких використовувалася більша кількість ключових слів запиту. Якщо ключові слова запиту не використовувалися в посиланнях, то вони відкривалися послідовно, до 10 кликів. Якщо при переході по посиланнях відкривалася сторінка іншої пошукової системи й потрібно було вказувати ключовий термін для подальшого пошуку, то це розглядалося як негативний результат .

При складанні тестових запитів, були враховані різні варіанти можливих запитів, що включають у себе перевірку обробки запитів з урахуванням морфології, орфографії, семантичних мереж, і ряд запитів, заданих природною мовою. До запитів, пошук по яких був заданий по ключових словах, були додані логічні оператори, стоп-слова, різні формати написання дат, числових значень і види регістрів.

Дані запити можна розділити на запити, що припускають однозначну інтерпретацію релевантності, і запити, що припускають багатозначне трактування релевантності. При визначенні релевантності документів, знайдених по таких запитах, релевантними вважалися документи, що містять будь-який опис зазначених у запиті об'єктів.

У тестуєму групу були включені 17 ІПС (Google, Yandex, Nigma, Asknet, Rambler, Mail, Msn, Aport, Yahoo, Altavista, Meta, Alltheweb, Lupa, Ask, Mediumsearch, Goon, Metabot).

Проведене тестування показало неадаптуємість більшості іноземних систем стосовно російської мови, задовольняючи тільки формалізовану інформаційну потребу. Кращі результати тестування показали ІПС Nigma і Yandex. Варто відзначити, що інтелектуальні можливості Yandex набагато вище Nigma ( що включають у себе пріоритет джерел інформації, введення статистики запитів, набагато більше великий розширений пошук), що робить її найбільш ефективної. На наступний рівень можна поставити ІПС: Google, AskNet, Yahoo. Можливості Google, включені в розширений пошук, дозволяють досягти більш високих результатів, однак аналіз статистики запитів великої кількості користувачів до відомих ІПС показав, що середня довжина запиту не перевищує двох слів, і користувачі, як правило, використовують найпростішу форму запиту. Тому не можна розраховувати на те, що користувач пошукової системи буде формулювати досить складні ефективні запити . ІПС Asknet адаптована здебільшого на природні запитанння, не маючи у своєму арсеналі розширеного пошуку й включення в запит операторів, також істотним недоліком є невідома кількість знайдених сторінок, що робить невидимим границі при звуженні пошуку. В інших системах слід зазначити погану індексацію й неможливість аналізувати джерела, тому що більша кількість результатів є рекламою.

Схожі:

Оцінка ефективності функціонування сучасних інформаційно-пошукових систем інтернету iconПошук у Всесвітній мережі
Призначення пошукових систем. Принципи пошуку інформації. Правила роботи з пошуковою системою. Найпоширеніші служби Інтернету
Оцінка ефективності функціонування сучасних інформаційно-пошукових систем інтернету icon«Порівняння можливостей різних пошукових систем для отримання інформації з права»
Різні друковані довідники застарівають ще до виходу в світ. Єдиним надійним способом пошуку інформації є використання різних пошукових...
Оцінка ефективності функціонування сучасних інформаційно-пошукових систем інтернету iconОцінка в задачах проектування систем
Тенденції розвитку сучасних інформаційних технологій приводять до постійного зростання складності інформаційних систем (ІС), що створюються...
Оцінка ефективності функціонування сучасних інформаційно-пошукових систем інтернету iconДокументування громадян та створення і забезпечення функціонування інформаційно-телекомунікаційних систем консульської служби
Документування громадян та створення і забезпечення функціонування інформаційно-телекомунікаційних систем консульської служби за...
Оцінка ефективності функціонування сучасних інформаційно-пошукових систем інтернету iconАналітична таблиця функціонування науково-пошукових організацій навчально-виховних закладів Самарського району за напрямками діяльності
В цілому, за поданням інформації навчально-виховних закладів до участі в конкурсі-захисті науково-пошукових робіт та навчально-пошукових...
Оцінка ефективності функціонування сучасних інформаційно-пошукових систем інтернету iconЛабораторна робота №3 вивчення пошукових систем І програм для знаходження інформації в інтернеті завдання для виконання
У будь-якій з відомих пошукових систем здійснити пошук інформації (перелік тем вказаний нижче). При пошуці максимально використати...
Оцінка ефективності функціонування сучасних інформаційно-пошукових систем інтернету iconОцінка ефективності реклами як причинно-наслідкові маркетингові дослідження
Визначені критерії рекламної ефективності. Розкрита специфіка маркетингових досліджень з метою оцінки рекламної ефективності
Оцінка ефективності функціонування сучасних інформаційно-пошукових систем інтернету iconМеханізм побудови конкурентоспроможних національних інноваційних систем китаю та індії
У статті здійснюється порівняльний аналіз особливостей та ефективності функціонування національних інноваційних систем Китаю та Індії....
Оцінка ефективності функціонування сучасних інформаційно-пошукових систем інтернету iconПаспорт бюджетної програми на 2012 рік
Документування громадян та створення і забезпечення функціонування інформаційно-телекомунікаційних систем консульської служби
Оцінка ефективності функціонування сучасних інформаційно-пошукових систем інтернету icon1. загальна характеристика тов «ларос» формування функцій менеджменту на підприємстві
Відповідно до цього, управлінський контроль комерційної організації орієнтований головним чином на забезпечення основних показників...
Додайте кнопку на своєму сайті:
ua.convdocs.org


База даних захищена авторським правом ©ua.convdocs.org 2014
звернутися до адміністрації
ua.convdocs.org
Реферати
Автореферати
Методички
Документи
Випадковий документ

опубликовать
Головна сторінка