Интернет-разведка. Руководство к действию

ОглавлениеДобавить в закладки К обложке

Как в точности сохранить информацию, найденную на сайтах в Интернете

Периодически специалист конкурентной разведки сталкивается с необходимостью сохранения информации, найденной в Интернете. Это требуется, как правило, в целом ряде случаев.

– Когда нет времени внимательно изучать собранный материал, но хотелось бы к нему вернуться позже.

Когда есть вероятность, что страница будет изменена (например, в случае размещения на ней компрометирующей информации, либо утечки данных, либо если речь идет о странице новостей компании). Тогда, чаще всего, необходимо не просто зафиксировать изображение, размещенное на ресурсе, но и заверить его нотариально. И в крупных городах уже появились нотариусы, которые могут справиться с такой задачей.

Когда вместе с данными требуется предоставить сырой материал – на случай, если понадобится объяснить, на каком основании были сделаны те или иные выводы.

Когда компания составляет архив сайтов – свой или посторонней организации – с целью мониторинга изменений на копоративном портале и хочет иметь возможность поднять этот архив за любой период.

Когда архивная копия делается «на будущее» без явной цели, но специалист конкурентной разведки считает, что нетекстовая информация с сайта может пригодиться ему в будущем.

Вот основные способы создания архивных копий внешнего вида страниц сайтов.

1. Сохранение страницы из браузера штатными средствами операционной системы.

Для этого достаточно в верхней панели браузера выбрать команды «Файл» > «Сохранить как» и задать имя файла. Как правило, страница сохраняется в виде файла и связанной с ним папки. В случае если, например, документ будет случайно переименован в неоткрытом состоянии, потеряется его связь с папкой. Нам известно также немало случаев, когда папка просто случайно стиралась, что также лишало возможности полноценно просматривать содержимое страницы.

2. Сохранение страницы с помощью текстового процессора Word.

Содержимое страницы сначала копируется в буфер (например, с помощью последовательности команд «Правка» > «Выделить все» > «Правка» > «Копировать»). Затем открывается программа Word, в нее скопированная страница вставляется из буфера с помощью команд «Правка» > «Вставить».

Такой метод при всей простоте исполнения не лишен недостатков. Во-первых, страница, снабженная гиперссылками, достаточно долго вставляется из буфера в документ Word. Во-вторых, результат довольно сильно оличается от оригинала, и в первую очередь страдает взаимное расположение текста, таблиц и изображений на странице, так как Word не вполне корректно отображает таблицы. На сленге специалистов это обычно называется «Слетели таблицы», поскольку самое сложное в создании страниц – это расположение таблиц, текста и изображений таким образом, чтобы их компоновка на странице совпадала с первоначальным замыслом.

3. Создание PDF-файла из веб-страницы.

Для того, чтобы сделать pdf-файл, требуется программа Adobe Acrobat Professional (не следует путать ее с бесплатной программой Acrobat Reader, предназначенной только для чтения pdf-файлов, а не для их создания и изменения). Сайт программы Adobe Acrobat Professional находится по адресу http://www.adobe.com/products/ acrobatpro/main.html.

Это достаточно удобный метод сохранения веб-страниц, который можно рекомендовать к практическому применению. Изображение при использовании Adobe Acrobat Professional получается корректным. Существенный минус данного решения – цена программы, достигающая нескольких сотен долларов. Кроме того, иногда случается так, что на некоторых страницах Интернета возникают проблемы с кодировкой и это делает конечный текст нечитаемым.

Избежать последней проблемы поможет следующее решение. Не следует пользоваться встроенной функцией и назначать адрес сохраняемой страницы непосредственно в меню программы Adobe Acrobat Professional, потому что именно в этом случае чаще всего и возникает проблема кодировок. Вместо этого, следует открыть страницу в браузере Internet Explorer и воспользоваться встроенным в него плагином Adobe Acrobat Professional. Тогда страница будет отображена корректно, разве что может смениться тип шрифта – например, вместо шрифта Arial, содержащегося на странице, в PDF-файле окажется Times New Roman. Официальное представительство компании Adobe пытается научить пользователей преодолевать проблему с отображением шрифтов: для этого надо попытаться изменить настройки программы, – однако сделать это максимально доступно ему пока не удалось. Даже элементарное объяснение способа занимает несколько минут, так что воплотить его в жизнь неподготовленному пользователю непросто. Именно поэтому мы применяем приведенный выше метод, а не тот, который пытаются популяризировать в официальном представительстве.


Логин
Пароль
Запомнить меня