Часто бывает так, что испытываешь какие то затруднения, но еще не осознал проблему, а значит и не ищешь способ ее решения. Так же было и у меня с сохранением всего того нужного и полезного, что удавалось найти в Интернет так, чтобы потом легко можно было бы найти ту или иную понадобившуюся информацию.
До некоторого времени радовало, что у браузеров появилась, наконец, возможность сохранять просматриваемые страницы целиком с картинками и стилями страниц, однако долго радоваться не получилось: каждая страница сохранялась в виде связки html-файла (суть — текстовый файл с кодом html-разметки) и папки, содержащей огромное количество файлов графики, стилей и подчас еще чего-то.
Появилась, правда, и возможность сохранять страницу в виде одного файла в формате mht, однако на тот момент этот файл открывался только с помощью Internet Explorer (IE), а закодированная в нем графика, видимо в формате Base64, используемом также при кодировании файлов во вложении писем, резко увеличивалась в размере в силу специфики своего текстового формата. Но что делать, когда таких файлов становится много, а их имена подчас настолько длинные, что порой плохо воспринимаются даже файловой системой?
Решение нашлось неожиданно. В один прекрасный день я совершенно случайно наткнулся на очередное расширение к Firefox, кардинально решающее все эти проблемы. Firefox — это веб-браузер, выпускаемый сообществом Mozilla уже несколько лет. Вообще говоря, Firefox славится открытостью своей архитектуры, которая подразумевает, что любой желающий может, изучив соответствующую документацию, начать создавать свои собственные дополнения к нему, они же — расширения его функционала. Раз можно — значит создают, и создают в огромных количествах. При этом создана и поддерживается отлаженная система сбора, классификации и представления конечным пользователям этих расширений, облегчающая поиск в этом многообразии того, что нужно, позволяющая оценить популярность и уровень поддержки разработчиком, почитать отзывы пользователей.
Найденное чудесное дополнение называлось ScrapBook, своим названием уже намекая на то, что оно может делать с содержимым страниц. Правильно — может подшивать его в книги. Но оказалось, что делает он это даже лучше, чем можно было бы ожидать.
ScrapBook позволяет сохранять страницы для последующего просмотра не выходя из браузера, сохранять не куда попало (хотя и так можно), а сразу же раскладывать по папкам, легко создаваемым рядом в его окошке в виде дерева. Более того, не обязательно сохранять страницы целиком — можно выделить любой ее фрагмент, обойдя меню и рекламу, и сохранить только полезную часть. Если ненужное на странице не удалось обойти при выделении, потом этот фрагмент в большинстве случаев можно удалить в уже сохраненной версии. Если же сохраненные фрагменты страниц окажутся слишком мелкими, позже их можно будет слить в одну страницу для более удобного просмотра. ScrapBook заботливо сохраняет не только страницу или ее часть, но и URL, с которого она была прочитана, позволяющий в любой момент времени проверить ее свежую версию.
Избирательное сохранение информации из открытых страниц оказалось не единственной добродетелью ScrapBook — он также дает возможность добавлять свои пометки и комментарии к сохраненным текстам — выделить цветными маркерами любые значимые места, чтобы позже не выискивать их в длинном тексте.
Как и где ScrapBook сохраняет страницы?
Хранит он их вполне разумно — в специально созданной папке внутри профиля пользователя ScrapBook автоматически создает единственный xml-файл, содержащий общую информацию о сохраненных страницах, папках и их взаимной вложенности, а для каждой сохраняемой страницы или ее фрагмента также создает папку с уникальным и коротким именем, состоящим из даты и времени — просто и разумно. Поскольку в названии год стоит перед месяцем, а месяц — перед числом, папки одинаково сортируются как по дате создания, так и по имени. О том, зачем это может понадобиться — чуть позже.
К слову сказать, это хранилище можно перенести в любое другое место, например, с системного диска C, на котором обычно хранятся пользовательские профили Windows, на диск D, на случай какой-нибудь неприятности, из-за которой диск C придется форматировать, а систему восстанавливать (почти так же, как и в знаменитом фильме Леонида Гайдая Жорж Милославский устами Леонида Куравлева рекомендует гражданам хранить деньги в сберегательной кассе, так и здесь нелишне напомнить, что ни в коем случае не следует хранить свои данные, если было бы жаль их потерять, на том же диске, на котором установлена операционная система).
И это еще не все. Обычно вид веб-страницы почти целиком определяется так называемыми стилями, присвоенными ее элементам. Стили эти, или другими словами — наборы атрибутов, описывающие способ их отображения, хранятся в файлах с расширением css и при просмотре страниц подгружаются в браузер вместе с самой страницей. Так вот, все описания стилей, часто хранящиеся в многочисленных css-файлах, ScrapBook собирает в один общий css-файл и даже снабжает комментарием, из какого именно файла та или иная декларация стиля была взята (обычному пользователю это не нужно, а вот веб-разработчику очень даже может пригодится). Более того, он умеет сохранять даже те стили, которые по непонятной причине пропускаются самими браузерами про сохранении страниц с помощью команды «Сохранить как…» — обычно это css-файлы, подключаемые к странице с помощью команды import.
Можно ли перенести сохраненные страницы на другой компьютер? Да, легко. Если нужно сохранить отдельно взятую страницу, то это делается через меню инструментов ScrapBook с помощью экспорта. Если же нужно синхронизировать данные ScrapBook на разных компьютерах, то также можно воспользоваться функциями экспорт/импорт, но гораздо проще просто вручную перенести более свежий xml-файл и все новые папки с сохраненными страницами. Как мы уже знаем, их названия — это даты, легко позволяющие найти недавно добавленные.
У ScrapBook есть еще немало полезных свойств и особенностей, среди которых встроенная русификация этого расширения, возможность поиска среди сохраненных страниц и многое другое — все заинтересовавшиеся им могут сами их исследовать.
Понятное дело, что ScrapBook — не единственное из решений, позволяющих организовать в удобном виде все найденное в Интернет, надеюсь, что в следующий раз удастся рассказать и о других, но то, что его смело можно отнести к категории MUST HAVE, пока не вызывает у меня сомнений, спасибо разработчикам из страны восходящего солнца!
Update: Данное расширение более не существует, увы. Ему на замену пришло WebScrapBook.