Як використовувати Google для пошуку інформації про конкурентів

26 серпня 2020, 16:40

3088

Автор:

Олена Баконіна, головний редактор ЮРЛІГА

Пошук у Google - інструмент бізнес-розвідки для вивчення минулого партнерів і кандидатів на посаду, моніторингу конкурентів і розслідування правопорушень. Використовується для отримання чутливої інформації з відкритих джерел. У статті розглянемо оператори розширеного пошуку, сервіси автоматизації пошуку, й повернемося до минулого за допомогою Wayback Machine.

Стратегія і логіка пошуку

Логіка побудови запитів безпосередньо впливає на якість результатів. Керівник проєкту BBC Academy Investigations Support Пол Майєрс у майстер-класі з пошуку пише: "Для ефективного пошуку потрібна стратегія і правильні ключові слова. Під час пошуку дивіться на кількість результатів. Якщо їх занадто багато, тоді потрібно більше додаткових ключових слів". Щоб продемонструвати логіку побудови запитів, Маєрс наводить приклад пошуку порівнянь відомих вбивств. Ключові слова “Kennedy” і "Lennon" ведуть до 13,7 млн результатів, у тому числі до тренерів футбольного клубу “Селтік” Ніла Леннона і Джона Кеннеді. Але додайте слово “Caesar” - і видача звузиться до 2,5 млн результатів, які сфокусовані тільки на порівнянні вбивств, тому що, як пояснює Маєрс, “з якої ще причини ці три прізвища могли б з'явитись на одній сторінці?” Мабуть, якщо б одним із тренерів або футболістів “Селтік” була людина із прізвищем Цезар.

Також для уточнення результатів пошуку слова виділяють лапками, щоб Google не шукав синоніми, або добавляють знак “-” перед словом, щоб виключити недоречні результати.

Оператори пошуку в Google

Якщо ключові слова все ще дають мільйони результатів, спробуйте використовувати оператори розширеного пошуку Google Dorks, щоб звузити пошук і знайти:

- Людину

“john” “kennedy” site:linkedin.com - шукає в LinkedIn точні збіги імені й прізвища, у будь-якій комбінації

“john kennedy” -site:linkedin.com - точний збіг імені, виключає результати в LinkedIn

allinurl:john kennedy site:nytimes.com - сторінки на сайтах новин, які містять «john» і «kennedy» в URL

- Адреси e-mail:

HR “email” site:example.com filetype:csv | filetype:xls | filetype:xlsx - списки контактів HR у заданому домені; для оператора filetype: існує кратка форма - ext:

“*@example.com” site:example.com - всі e-mail у заданому домені

За допомогою Google Dorks знаходяться документи, залишені у загальному доступі через необережність їх авторів, а отже проіндексовані пошуковим механізмом Google:

- Резюме:

“CV” filetype:docx | filetype:pdf “john” “kennedy” - шукає резюме у форматах .docx або .pdf, що містять “CV” в імені файлу

- Документи в Google Docs, у яких не встановлені налаштування конфіденційності:

site:docs.google.com “company name”

- Презентації та інфографіка компанії:

site:slideshare.net “company name” - у разі безкоштовного використання сервісів створення презентацій, блок-схем і діаграм, таких як Slideshare, Prezi, Emaze, Gliffy, файли мають загальний доступ та індексуються Google.

- Журнали помилок і журнали доступу, виявлені у загальнодоступному HTTP-просторі відкривають шлях до чутливих даних серверу:

allintext:username filetype:log - шукає файли *.log, у яких міститься “username”

Щоб переглянути збережену копію видаленої сторінки, у Google Chrome вибираємо опцію “Cached” напроти результату пошуку. Або застосовуємо оператор пошуку cache:example.com.

Вже відчуваєте себе хакером? На порталі Google Hacking Database - актуальні приклади комбінацій операторів для пошуку незахищених сторінок; файлів, які містять паролі й дані авторизації; пристроїв, підключених до інтернету.

Машина часу

Середня тривалість життя веб-сторінки - близько ста днів. Пост Стрєлкова 17 липня 2014 р. ВКонтакте «Ми щойно збили літак» протримався дві години. Коли з'ясувалось, що збитий літак - Боінг MH17, пост видалили, але інтернет-архів зберіг його копію. “Саме тому ми існуємо” - написали автори проєкту Wayback Machine у Facebook, і опублікували статтю про збитий Боїнг [1].

Мета проєкту Wayback Machine - «універсальний доступ до всіх знань» завдяки збереженню архівних копій веб-сторінок, яких більше не існує. Сервіс компанії Internet Archive містить 445 млрд веб-сторінок і стане в нагоді, якщо пошук кешованої сторінки в Google не дав результатів. У конкурентній розвідці використовується для огляду історії компанії, для пошуку попередніх проєктів, власників або інвесторів.

Не тільки веб-сторінки: Бібліотека Internet Archive включає 20 млн текстів у відкритому доступі, 2 млн записів теленовин, 3,5 млн зображень, включаючи мапи і астрономічні фото.

Прийміть до уваги, що Wayback Machine не робить знімків сторінок кожен день. Якщо знайшли компрометуючу інформацію, яка найближчим часом зникне, рекомендується для підстраховки робити скріншоти або архівувати сайт вручну. Для цих задач підходить і Wayback Machine, альтернатива - Archive.today, зберігає текстову і графічну копії сайту.

Старосєк Артем, CEO в ресерч компанії Molfar.bi

Backlinks

Пошук зворотних посилань (backlinks) допоможе знайти новини про компанії, людину, взаємопов'язані проєкти або події; ресурси, на яких згадуються конкуренти, але не згадується ваша компанія. Для пошуку веб-сайтів, які посилаються на цільовий домен або сторінку, використовується оператор:

site:* example.com -site:example.com

Сервіси пошуку зворотних посилань Open Site Explorer, Backlink Checker, SEMrush надають докладний звіт про ресурси, які мають посилання на цільову сторінку, а також рейтинг даних ресурсів у пошуковій видачі.

Автоматизація пошуку

Не хочете запам'ятовувати оператори і комбінації? Сервіси SearchDiggity і Pentest Tools спрощують роботу з Google Dorks - у них міститься набір заготовлених шаблонів для пошуку.

Ще один інструмент автоматизації - Кастомна пошукова система Google. Дозволяє включити у пошук конкретні сайти і вказати мітки для фільтрації результатів у видачі. Наприклад, розділити результати під час пошуку вакансій і резюме. Для каталогів work.ua/jobs і rabota.ua/вакансии ставимо мітку “vacancies”, для каталогів work.ua/resumes і rabota.ua/резюме - мітку “resume”. У видачі результати пошуку в цих каталогах будуть розподілені по вкладках “vacancies” і “resume”.

Кастомна пошукова система використовується замість оператора site: у випадку систематичного звернення до одних і тих самих ресурсів.

Як бачите, існує ряд механізмів, які використовують пошук Google для отримання чутливої інформації про компанію або людину. Із розвитком веб-технологій приховати цифрові сліди стає важче. А помилки користувачів і веб-майстрів допомагають ресерчерам знайти ціль.

Головна

Інтерв'ю

Як використовувати Google для пошуку інформації про конкурентів

Залиште коментар

Увійдіть щоб залишити коментар

Увійти

Підпишіться на розсилку

Головні новини і аналітика для вас по буднях