Как искать информацию в веб-кэше Google (Инструкция). Что такое кэш страницы и для чего он нужен? Как найти в кэше Google, Yandex

Как искать информацию в веб-кэше Google (Инструкция). Что такое кэш страницы и для чего он нужен? Как найти в кэше Google, Yandex

03.09.2019

Сервисы и трюки, с которыми найдётся ВСЁ.

Зачем это нужно: с утра мельком прочитали статью, решили вечером ознакомиться внимательнее, а ее на сайте нет? Несколько лет назад ходили на полезный сайт, сегодня вспомнили, а на этом же домене ничего не осталось? Это бывало с каждым из нас. Но есть выход.

Всё, что попадает в интернет, сохраняется там навсегда. Если какая-то информация размещена в интернете хотя бы пару дней, велика вероятность, что она перешла в собственность коллективного разума. И вы сможете до неё достучаться.

Поговорим о простых и общедоступных способах найти сайты и страницы, которые по каким-то причинам были удалены.

1. Кэш Google, который всё помнит

Google специально сохраняет тексты всех веб-страниц, чтобы люди могли их просмотреть в случае недоступности сайта. Для просмотра версии страницы из кеша Google надо в адресной строке набрать:

http://webcache.googleusercontent.com/search?q=cache:http://www.iphones.ru/

Где http://www.iphones.ru/ надо заменить на адрес искомого сайта.

2. Web-archive, в котором вся история интернета

6. Archive.is, для собственного кэша

Если вам нужно сохранить какую-то веб-страницу, то это можно сделать на archive.is без регистрации и смс. Еще там есть глобальный поиск по всем версиям страниц, когда-либо сохраненных пользователями сервиса. Там есть даже несколько сохраненных копий iPhones.ru.

7. Кэши других поисковиков, мало ли

Если Google, Baidu и Yandeх не успели сохранить ничего толкового, но копия страницы очень нужна, то идем на seacrhenginelist.com , перебираем поисковики и надеемся на лучшее (чтобы какой-нибудь бот посетил сайт в нужное время).

8. Кэш браузера, когда ничего не помогает

Страницу целиком таким образом не посмотришь, но картинки и скрипты с некоторых сайтов определенное время хранятся на вашем компьютере. Их можно использовать для поиска информации. К примеру, по картинке из инструкции можно найти аналогичную на другом сайте. Кратко о подходе к просмотру файлов кэша в разных браузерах:

Safari

Ищем файлы в папке ~/Library/Caches/Safari .

Google Chrome

В адресной строке набираем chrome://cache

Opera

В адресной строке набираем opera://cache

Mozilla Firefox

Набираем в адресной строке about:cache и находим на ней путь к каталогу с файлами кеша.

Что делать, если вообще ничего не помогло

Если ни один из способов не дал результатов, а найти удаленную страницу вам позарез как надо, то остается только выйти на владельца сайта и вытрясти из него заветную инфу. Для начала можно пробить контакты, связанные с сайтом на

20 июня 2012 в 18:28

Достаём потерянные статьи из сетевых хранилищ

  • Разработка веб-сайтов

Решение рассматривается (пока) только для одного сайта - того, на котором мы находимся. Идея появилась в результате того, что один пользователь сделал юзерскрипт, который переадресует страницу на кеш Гугла, если вместо статьи видим «Доступ к публикации закрыт». Понятно, что это решение будет работать лишь частично, но полного решения пока не существует. Можно повысить вероятность нахождения копии выбором результата из нескольких сервисов. Этим стал заниматься скрипт HabrAjax (наряду с 3 десятками других функций). Теперь (с версии 0.859), если пользователь увидел полупустую страницу, с которой можно перейти лишь на главную, в личную страницу автора (если повезёт) и назад, юзерскрипт предоставляет несколько альтернативных ссылок, в которых можно попытаться найти потерю. И тут начинается самое интересное, потому что ни один сервис не заточен на качественное архивирование одного сайта.

Кстати, статья и исследования порождены интересным опросом и скриптом пользователя - комментарий .

Требуется, конечно, более качественный сервис, поэтому, кроме описания нынешней скромной функциональности (вероятность найти в Гугл-кеше и на нескольких сайтах-копировщиках), поднимем в статье краудсорсинговые вопросы - чтобы «всем миром» задачу порешать и прийти к качественному решению, тем более, что решение видится близким для тех, кто имеет сервис копирования контента. Но давайте обо всём по порядку, рассмотрим все предложенные на данный момент решения.

Кеш Гугла

В отличие от кеша Яндекса, к нему имеется прямой доступ по ссылке, не надо просить пользователя «затем нажать кнопку „копия“». Однако, все кеширователи, как и известный archive.org, имеют ряд ненужных особенностей.

1) они просто не успевают мгновенно и многократно копировать появившиеся ссылки. Хотя надо отдать должное, что к популярным сайтам обращение у них частое, и за 2 и более часов они кешируют новые страницы. Каждый в своё время.

3) поэтому результат кеширования - как повезёт. Можно обойти все такие кеширующие ссылки, если очень надо, но и оттуда информацию стоит скопировать себе, потому что вскоре может пропасть или замениться «более актуальной» бессмысленной копией пустой страницы.

Кеш archive.org

Он работает на весь интернет с мощностями, меньшими, чем у поисковиков, поэтому обходит страницы какого-то далёкого русскоязычного сайта редко. Частоту можно увидеть здесь:
Да и цель сайта - запечатлеть фрагменты истории веба, а не все события на каждом сайте. Поэтому мы редко будем попадать на полезную информацию.

Кеш Яндекса

Нет прямой ссылки, поэтому нужно просить (самое простое) пользователя нажать на ссылку «копия» на странице поиска, на которой будет одна эта статья (если её Яндекс вообще успел увидеть).

Как показывает опыт, статья, повисевшая пару часов и закрытая автором, довольно успешно сохраняется в кешах поисковиков. Впоследствии, скорее всего, довольно быстро заменится на пустую. Всё это, конечно, не устроит пользователей веба, который по определению должен хранить попавшую в него информацию.

Из живых я нашёл пока что 4, некоторые давно существовавшие (itgator) на данный момент не работали. В общем, пока что они почти бесполезны, потому что заставляют искать статью по названию или ключевым словам, а не по адресу, по которому пользователь пришёл на закрытую страницу (а по словам отлично ищет Яндекс и не только по одному их сайту). Приведены в скрипте для какой-нибудь полезной информации.

Задача

Перед сообществом стоит задача, не утруждая организаторов сайта, довести продукт до качественного, не теряющего информацию ресурса. Для этого, как правильно заметили в комментариях к опросу, нужен архиватор актуальных полноценных статей (и комментариев к ним заодно).

В настоящее время неполное решение её, как описано выше, выглядит так:

Если искать в Яндексе, то подобранный адрес выведет единственную ссылку (или ничего):


Нажав ссылку «копия», увидим (если повезёт) сохранённую копию (страница выбрана исключительно для актуального на данный момент примера):

В Гугле несколько проще - сразу попадаем на копию, если тоже повезёт, и Гугл успел сохранить именно то, что нам надо, а не дубль отсутствующей страницы.

Забавно, что скрипт теперь предлагает «выбор альтернативных сервисов» и в этом случае («профилактические работы»):

Жду предложений по добавлению сервисов и копировщиков (или хотя бы проектов) (для неавторизованных - на почту spmbt0 на известном гуглоресурсе, далее выберем удобный формат).

UPD 23:00: опытным путём для mail.ru было выяснено строение прямой ссылки на кеш:
"http://hl.mailru.su/gcached?q=cache:"+ window.location Знатоки или инсайдеры, расскажите, что это за ссылка, насколько она стабильна (не изменится ли, например, домен 3-го уровня), что значит приставка «g»-cached? Значит ли это кеш Гугла или это кеш движка Gogo?

Категория ~ Браузер – Игорь (Администратор)

Google достаточно часто обновляет свой браузер Chrome. Но, на момент написания этого совета, в нем до сих пор нет настройки для задания ограничения размера кэша. А ведь кэш может очень сильно разрастись, если его периодически не чистить. Вы можете сильно удивиться, узнав сколько места занимает кэш. Например, на текущий момент времени кэш моего браузера занимает 423 Мб. Согласитесь, что это не совсем уж маленькая цифра. По умолчанию весь кэш находится в папке "C:\Users\{Пользователь}\AppData\Local\Google\Chrome\User Data\Default", где "{Пользователь}" - это ваш пользователь. Просто посмотрите на размер этой папки.

Конечно, ограничить размер можно при помощи специальных параметров, которые необходимо прописать в ярлык для запуска, но это не совсем то, что хотелось бы. Если вам интересно, то сделать это можно при помощи следующих параметров: –disk-cache-dir=”c:\cache” –disk-cache-size=102345678. Где параметр "–disk-cache-dir" - задает место хранения кэша. А параметр "–disk-cache-size" - максимальный размер в байтах.

Примечание: кэш так же стоит чистить в случаях, если у вас возникают проблемы с отображением ваших любимых сайтов. Если не вдаваться в технические подробности, то основная проблема в том, что часть элементов сайта обновилась, но при этом браузер при загрузке сайта по прежнему загружает элементы из кэша.

Просмотр кэша при помощи "about:cache"

Есть несколько различных способов для просмотр кэша. Сам браузер имеет специальную команду для просмотра кэша. Введите в адресной строке "about:cache" (без кавычек и без пробелов, но с двоеточием). Содержимое кэша отобразиться в окне браузера. Если у вас достаточно большой кэш, то эта операция может занять некоторое время. Конечно, это не самый удобный способ просмотра, и он больше подойдет технически подкованным пользователям. Но, тем не менее, это все же способ.

Очистка кэша из браузера

Вы можете очистить кэш за определенный период времени из панели инструментов Chrome.

  1. Откройте выпадающее меню. Значок из трех полосок
  2. Наведите мышку на "Инструменты"
  3. Выберите пункт "Удаление данных о просмотренных страницах..."
  4. В появившемся меню выберите период, за который необходимо очистить данные
  5. Выберите необходимые данные для очистки. Для тех данных, которые вы хотите сохранить, снимите галочки
  6. Нажмите кнопку "Очистить историю"

Просмотр кэша с помощью программы ChromeCacheView от NirSoft

ChromeCacheView это небольшая бесплатная утилита, которая позволяет просматривать и выборочно копировать записи кэша браузера Chrome. Она так же позволяет посмотреть информацию о каждом файле кэша. Скачать эту утилиту вы можете по этой ссылке . Программа не требует установки и прекрасно работает в Windows XP, Vista и 7.

Довольно часто на всевозможных форумах сталкиваюсь с вопросом «где находится кэш браузера» . Так как данный вопрос тесно с связан с тематикой нашего сайта, я не мог обойти его стороной и решил в сегодняшней статье рассказать где хранится кэш самых популярных браузеров установленных в операционной системе Windows 7, 8, 10.

Вас может заинтересовать статья « «, в который мы подробно рассказывали как автоматический, после окончания работы в интернете очищать историю посещенных сайтов

Кэш браузера Opera

C:\Users\Admin\AppData\Local\Opera Software\Opera Stable\Cache

Кэш браузера Google Chrome

C:\Users\Admin\AppData\Local\Google\Chrome\User Data\Default\Cache
C:\Users\Admin\AppData\Local\Google\Chrome\User Data\Profile 1\Cache

Кэш браузера Mozilla Firefox

C:\Users\Admin\AppData\Local\Mozilla\Firefox\Profiles\zxcvb5678.default\cache2\entries

Кэш браузера Яндекс Браузер

C:\Users\Admin\AppData\Local\Yandex\YandexBrowser\User Data\Default\Cache

Кэш браузера Internet Explorer

C:\Users\Admin\AppData\Local\Microsoft\Windows\INetCache\
C:\Users\Admin\AppData\Local\Microsoft\Windows\Temporary Internet Files\

Вся информацию актуальна для версий установленных с помощью инсталяционного файла. Кэш портабельных версий браузера (не требующих установки) может располагаться в других папках.

Воспользуйтесь программой , если вам необходимо восстановить удаленный кэш. Также используя форму поиска на сайте, по словам «кэш браузер» вы найдете большое количество программ работающих с кешем различных браузеров.

У самого значимого в мире поисковика «все ходы записаны» — информация, попавшая в поле зрения поисковых роботов Google, раз и навсегда сохраняется в виде сохранённой копии. Эта копия иногда очень нужна веб-журналистам — чтобы получить важные, но уже удалённые сведения. Но как получить к ним доступ? Как осуществлять поиск по кэшу Google?

Если вы ищете что-то через Google, то найти сохраненную копию можно и через обычный интерфейс поисковика. Нажмите на зелёный треугольничек справа от ссылки на сайт, затем — на надпись «Сохраненная копия». Нажмите на неё — и посмотрите резервную копию имеющейся информации, которая попала в цепкие лапы «гугла».


Поиск через адресную строку

Есть два способа:

Способ №1

Введите в адресную строку своего веб-браузера (Ghrome, Safari, Mozilla, Internet Explorer, Opera и т.д.) следующую информацию:

http://webcache.googleusercontent.com/search?q=cache:http://сайт Вместо сайт подставьте нужный вам сайт.

При желании можно посмотреть версию страницы без графики (только текст, своего рода режим Readability). Для этого достаточно нажать на «Текстовая версия» в правом верхнем углу экрана.

Способ №2

В браузере перед адресом страницы допишите слово «cache: ». В результате вместо самой страницы откроется её копия в кэше Google. Например:

Важно: Google в вашем браузере должен быть поиском по умолчанию. Если у вас не так — вводите «cache: » и адрес страницы в поисковой строке на google.com.

Вот и всё! Теперь вы можете искать в веб-кэше Google всё, что захотите — и когда захотите.

P.S. Хотите, чтобы запрос на кэш Google всегда был под рукой? Добавьте эту страницу в закладки. Как это сделать быстро и эффективно? Для Мас работает сочетание клавиш Cmd + D, для Windows — Ctrl + D.



© 2024 beasthackerz.ru - Браузеры. Аудио. Жесткий диск. Программы. Локальная сеть. Windows