Про пошукових системах інтернету бізнес на інформації


Пошук - один з неодмінних атрибутів нашого життя. Ось навіть і прислів'я про це є: "Риба шукає де глибше, а людина - де краще". Так в пошуках все життя і проходить. Те шукаємо товар дешевше, то роботу подорожче, то відпочинок поувлекательнее, то компанію веселіше, і так весь час . Одне знайшли - інше загубили, а там знову за пошуки третього беремося ... Здогадалися, про що мова піде? Ну звичайно, про пошук. Тільки з інтернетівський специфікою. Тобто про пошук в Мережі, точніше - про пошукових машинах, які цей самий пошук і полегшують.

Для чого вони потрібні
Для чого взагалі потрібні ці самі пошукові машини, зможе відповісти кожен, хто хоч раз у житті намагався що-небудь відшукати в неосяжних просторах комп'ютерної Всесвіту.

Ну а тим, хто ще не намагався, цікаво, напевно, буде дізнатися, що на сьогоднішній день ніхто не може сказати з абсолютною точністю, скільки всього існує Web-сторінок у Всесвітній Павутині. За останніми даними, отриманим досліджують Мережа вченими (виявляється, і такі є), в даний час приблизний обсяг Інтернету становить 550 мільярдів сторінок. Іншими словами, на кожного жителя Землі припадає близько 100 сторінок. А якщо врахувати, що далеко не всякий землянин долучився до Мережі, то і того більше. Природно, що самостійно розібратися з цими "покладами" інформації немає ніякої можливості.

Втім, процес нескінченного подорожі по посиланнях з сайту на сайт - заняття вельми і вельми захоплююче. Така розвага має масу шанувальників і навіть отримало свою власну назву - веб-серфінг. Те саме серфінгу справжньому, забава ця не з дешевих. По-перше, потрібні певні кошти для оплати Інтернет-трафіку (часу підключення до Мережі), а по-друге, потрібна маса вільного часу, який не шкода буде витратити на подібний "відпочинок". Тож таки основна маса користувачів звертається до Інтернету для отримання якої-небудь конкретної інформації. В цьому випадку, спроби знайти шукане методом "наукового тику" приречені на провал. Це тільки Мюнхгаузен міг, вистріливши в небо, отримати печеню з випадково пролітала повз качки. У реальності все йде по-іншому.

Про каталогах і пошукових машинах
В Інтернеті, як відомо, можна відшукати практично будь-яку інформацію. От тільки зробити це не так-то просто. Адже з точки зору пошуку інформації Мережа являє собою щось на зразок величезної бібліотеки, де на стелажах в безладді навалено окремі сторінки і більш солідні фоліанти (сайти), які містять шукану інформацію. Те, що вона (інформація тобто) тут десь є, не викликає жодних сумнівів. От тільки де? Невідомо. Ось тут-то і виникає питання, що мучить своєї нерозв'язні російську інтелігенцію, - "що робити?" Відповідь проста - робити треба те ж саме, що роблять у звичайній бібліотеці, коли потрібно знайти необхідну книгу: слід звернутися до бібліотечного каталогу. Для цього існують спеціальні Інтернет-ресурси, що виконують роль своєрідних "бібліотечних" каталогів і навіть "бібліотечних колекторів", збирають дані про публікованих матеріалах і складових їх анотовані списки. Це власне каталоги ресурсів Інтернету та пошукові машини, або, просто, "іскалкі" або "пошукачі" .

Між цими двома видами мережевих «всезнайок» є достатньо велика різниця. Каталог посилань, як і випливає з назви, являє собою упорядковану за темами колекцію посилань на численні Інтернет-сторінки і сайти. Каталог, як правило, складається і підтримується фахівцями технічної служби відповідного ресурсу , які самостійно і (або) за заявками власників сайтів поповнюють перелік посилань і складають огляди Web-сторінок, що включають короткий опис ресурсу, його адресу в Інтернеті і певні ключові слова. Останні використовуються пошуковою програмою, яка, як правило, входить до складу каталогу. За цим словам сайт може бути знайдений серед інших ресурсів, опису яких є в базі даних Інтернет-каталогу. Прикладом такого роду Інтернет-ресурсу є досить відомий в Рунеті каталог посилань List.RU (http://www.list.ru).

На відміну від каталогу, пошукова машина не залежить від людини (це ж машина!). Пошуковик включає в себе три основних компоненти. По-перше, програму-робота, безперервно переглядати Мережа або певну її частину (наприклад, російськомовні ресурси) в пошуках нових сайтів, а також з метою перевірки існування раніше знайдених ресурсів. По-друге, так званий "індекс" - базу даних, в якій зберігаються відомості про знайдені Інтернет-ресурсах. І по-третє, власне пошукову систему - неодмінний елемент пошукача. Саме пошукова програма здійснює пошук за індексом з урахуванням заданих користувачем критеріїв запиту.

Втім, нам з вами, як користувачам, не настільки вже й важливо знати про технічні подробиці функціонування подібних систем. От тільки, напевно, варто спростувати битующій серед частини користувачів стійкий міф про те, що пошукова машина, для того щоб знайти необхідну інформацію, "перелопачує" весь Інтернет. Насправді за запитом користувача пошук ведеться за ключовими словами в індексному базі. До речі, підтвердженням цього служать часом з'являються в результатах пошуку "мертві" посилання на вже неіснуючі ресурси.

Індексна база пошукової машини, як правило, має даних про набагато більшому числі Web-сторінок у порівнянні з каталогом Інтернет-ресурсів. Відбувається це через те, що програма-робот в стані "обнишпорювати" Мережа та індексувати сторінки практично без перерви. Працівникам же Інтернет-каталогу потрібен відпочинок і воліють вони працювати не більше восьми годин на добу. Зате пошук з використанням каталогу Інтернет-ресурсів часто дозволяє швидше знайти шукану інформацію в силу того, що при складанні описів експерт точніше може підібрати ключові слова, які будуть використовуватися при пошуку.

Розглянемо це на наступному прикладі. Припустимо, що для майбутнього торжества знадобилося підготувати привітання. Та не яке-небудь, а поетичне. Що робить у цьому випадку людина, що не має доступу в Мережу? Правильно - пише сам або підшукує небудь підходяще в книгах. А що робить "людина з Інтернетом"? Цілком імовірно, що починає шукати те ж саме в Мережі.

Отже, вводимо в якості ключового слова "привітання" і звертаємося до каталогу List.RU (http://www.list.ru). Через пару секунд на екрані виникають посилання на відповідні розділи каталогу ("Свята", "Поздоровлення і вітальні листівки "," Тости і побажання "і так далі). Вибравши необхідний розділ, можна виявити посилання на масу ресурсів, що відносяться до святкової тематики. Потрібно тільки точно уявляти собі, що ж власне потрібно знайти.
Тепер звернемося до пошукової машини. Наприклад, Яndex (http://www.yandex.ru) видає за запитом "привітання" посилання на 108860 сторінок або 3492 сервера. Матеріалів помітно більше - то-то роздолля для пошуків! Але ... Серед першого десятка є посилання на прес-службу Президента РФ і різного роду президентські поздоровлення, згадуються приватні поздоровлення різних форумів, а також інші документи, так чи інакше відносяться до привітань. Безумовно, є і посилання на вітальні ресурси. Одним словом, розкид результатів пошуку великий, а терпіння переглянути всі 108 860 посилань навряд чи у кого вистачить.

У наявності споконвічна боротьба між якістю і кількістю. Що краще, звичайно, кожен ешает сам. Ми ж з вами сьогодні поставимо в главу кута кількість і звернемося до пошукових машин, залишивши розгляд каталогів посилань на інший раз.

Пошуковики Рунета
Давайте почнемо з пошукової машини Rambler (http://www.rambler.ru), однієї з найстаріших в Рунеті. Дослідники стверджують, що до 90% користувачів російськомовного Інтернету хоча б один раз на місяць користуються послугами системи Rambler. Не станемо сперечатися. Щодня в базу даних цього пошуковика вноситься до 60 тисяч змін і поповнень, які відображають постійно змінюється картину стану Рунета. Подібна оперативність гарантує користувачам коректність видаються системою посилань і забезпечує постійне поповнення бази відомостями про всі новинки, що з'являються в російськомовній частині Мережі.

Ознайомившись з "технічними подробицями", звернемося тепер до практичних питань використання пошукової системи. Як показує досвід, найбільш популярним способом роботи з пошукачем є подача запиту, що складається з одного слова. Цьому є кілька причин. З одного боку, в силу одвічної людської ліні багато роблять "як простіше", з іншого - часто просто не здогадуються про те, що запит може виглядати якось по-іншому.
А між тим, Rambler містить спеціальний розділ ("Розширений пошук" - http://www.rambler.ru/doc/advanced.shtml), що дозволяє задавати більш точні налаштування параметрів запиту. Наприклад, можна визначити, де повинно знаходитися шукане слово ( в документах, в їхніх назвах, в заголовках документів і т. д.), уточнити мову документів, за якими здійснюється пошук, і навіть вказати системі, чи потрібно шукати однокореневі слова або пошук слід обмежити лише словом в тому вигляді, як воно написано в рядку запиту. Якщо в пошуковій формі зазначено декілька ключових слів, то можна вимагати, щоб Rambler повертав лише ті документи, де ці слова знаходяться на мінімальній відстані один від одного (режим "Обмежити відстань між словами"). На додаток до цього, особлива опція дозволяє виключати з результатів пошуку документи, що містять певні слова.

Дивіться також


21 ноября 2024 года

Можливо Вас зацікавить

Маргарет Тетчер нездоланне честолюбство

Залізна Леді була самої владної жінкою в світі протягом десяти років починаючи з вісімдесятих цього століття; в

View

Магнітне мило для очищення нафтових забруднень

Вчені з Брістольського університету (Велика Британія) створили перший у світі магнітне мило. Цей винахід може призвести до появи принципово нових

View

Надувний екран для домашнього кінотеатру

З наближенням літа, ніхто не думає про те, щоб сидіти вдома і дивитися телевізор, всім хочеться на повітря,

View

Модні милиці

Ідея створення красивих і модних, можна сказати, дизайнерських милиць прийшла в голову Лорі Джонсон (Laurie

View

Робота програміста для аутиста

Схоже, що в Массачусетському технологічному інституті вже давно працюють аутисти та нейротіпікі (так ще називають синдром Аспергера).

View

Знімний мотор для велосипеда

Бізнес-ідей, як б то ні було пов'язані з велосипедами, дуже багато. І тому підтвердження раннє описані бізнес-ідеї в нашому списку. Серед

View

Google пропонує пограти в Lego

Підрозділи компанії Google в Австралії та Новій Зеландії збирають нагороди за свій проект «Будуйте з Chrome» (Build with Chrome), який

View

Провокаційна соціальна реклама

Громадська організація «Армія спасіння» провела провокаційну соціальну рекламу з метою нагадати благополучним канадцям про існування проблеми бездомних людей

View