Сканирование документов, фотографий

Сканирование документов, фотографий

При работе с электронными официальными бумагами между партнерами можно установить свои требования к правилам оформления документов, в том числе к сканам бумажных оригиналов. А вот при взаимодействии с официальными органами власти придется соблюдать требования чиновников. Надо отметить, что на законодательном уровне пока нет единых требований к сканированным бумагам, поэтому такие правила устанавливаются в каждом конкретном ведомстве самостоятельно.

Так, например, для подачи сканов в Арбитражный суд нужно учитывать, что документы, подаваемые через сайт, должны быть переведены в электронный вид в формат PDF. Цвет скан-копии должен быть черно-белый или серый. Если подписи в бумажном документе выполнены синей ручкой, важно, чтобы при сканировании такого документа было выбрано черно-белое решение. Кроме того, разрешение скана должно быть не менее 200 точек на дюйм (DPI). Очень важным является размер одного файла – он не должен превышать 10 Мб. Само собой, скан должен хорошо читаться, т. е. все надписи, печати, подписи должны быть различимы. При этом в каждом направленном вложении должно быть не более одного документа, такой файл должен иметь название, отражающее суть вложенного документа, и содержать количество страниц в нем. Например, название может быть таким: «Договор 15 от 12.12.2016 года 7л.pdf».

Требования к файлу

Единый портал государственных услуг, который на сегодняшний день позволяет компаниям решить многие свои вопросы не выходя из офиса, принимает сканированные документы, которые соответствуют определенным требованиям. Так, оцифровка бумаги должна включать в себя формирование электронных копий документов в формате TIFF, PDF. Кроме того, страницы, содержащие черно-белые и серые иллюстрации, сканируются в режиме 8-bit Grayscale (256 градаций серого) с разрешением 150 DPI или 300 DPI. Учтите, что страницы, содержащие цветные иллюстрации, сканируются в формате RGB (цветной режим) с разрешением 150 DPI или 300 DPI. Настройки яркости и контрастности производятся для достижения наилучшего результата в части четкости и цветности изображения и для оптимальной эффективности распознавания типографского текста. К тому же сканы должны открываться на просмотр стандартными средствами, предназначенными для работы с ними в среде операционной системы MS Windows 2000/XP/Vista/7/8 без предварительного вывода на экран каких-либо предупреждений или сообщений об ошибках. Не допускается в файлах устанавливать опцию запрета печати содержимого, также нельзя делать в них защиту паролем на открытие.

Обратите внимание

В письме ФНС от 9 февраля 2016 года № ЕД-4-2/1984@ указано, что на сегодняшний день возможность отправки документов в xml-формате установлена только для некоторых видов бумаг. В том числе для счетов-фактур; журнала учета полученных и выставленных счетов-фактур; книги покупок и книги продаж и дополнительных листов к ним, если они есть.

Учтите, в качестве основных форматов представления цифровых образов отсканированных документов должны использоваться TIFF и PDF. Использование других форматов не рекомендуется. Документы, состоящие из нескольких страниц, должны сканироваться в многостраничном режиме. То есть после оцифровки должен получиться один файл, содержащий образы всех страниц документа. В случае если документ состоит из одной бумажной страницы, допускается использовать формат JPEG. Формат PDF применяется для полного представления документа в электронном виде.

Мнение налоговиков

Особое мнение по вопросу цифровых документов имеется и у налоговых органов. Разрешено предоставить сканы от организации в порядке, определенном статьей 93 Налогового кодекса, в электронной форме (сканирование с сохранением реквизитов) по установленным форматам при условии заверения усиленной квалифицированной проверяемого лица или его представителя (абз. 4 п. 2 ст. 93 НК РФ). В письме ФНС от 9 февраля 2016 года № ЕД-4-2/1984@ указано, что на сегодняшний день возможность отправки документов в xml-формате установлена только для некоторых видов бумаг. Во-первых, это счет-фактура, в том числе корректировочный; журнал учета полученных и выставленных счетов-фактур; книга покупок и книга продаж и дополнительные листы к ним, если они есть. Во-вторых, это товарная накладная () и акт приемки-сдачи работ (услуг) (форматы рекомендованы приказом ФНС от 21 марта 2012 г. № ММВ-7-6/172@). В-третьих, документы о передаче товаров при торговых операциях, формат которых утвержден приказом ФНС от 30 ноября 2015 года № ММВ-7-10/551@. И в-четвертых, это бумаги о передаче результатов работ или оказании услуг, их формат утвержден приказом ФНС от 30 ноября 2015 года № ММВ-7-10/552@.

Формат описи

Приказом ФНС от 29 июня 2012 года № ММВ-7-6/465@ «Об утверждении формата описи документов, направляемых в налоговый орган в электронном виде по телекоммуникационным каналам связи» разработан формат описи. Речь идет о списке документов, направляемых инспекторам в электронном виде по ТКС, который включает и форматы, указанные в описи, и документы, представленные в виде скан-образов. Возможность их представления в виде сканированных копий установлена для следующих документов: договор, в том числе дополнения и изменения; спецификация, калькуляция, расчет цены и стоимости; акт приемки-сдачи работ и услуг; счет-фактура, в том числе корректировочный; товарно-транспортная накладная; товарная накладная ТОРГ-12; грузовая таможенная/транзитная декларация, в том числе добавочные листы к ним. На данный момент указанный перечень документов является исчерпывающим.

Проект приказа

Если документы составлены по форматам, установленным ФНС, они могут быть направлены в инспекцию в электронном виде с использованием любого программного обеспечения, в том числе с использованием системы электронного документооборота «Контур-Архив». ФНС уже разработала требования к формату материалов, составленных на бумажном носителе, и представляемых сканов. Эти требования касаются представления документов инспекторам по запросу согласно пункту 2 статьи 93 НК РФ. В настоящее время подготовлен проект приказа Службы, которым планируется утвердить требования к формату сканов.

Планируется установить следующие требования: документ, оформ-ленный на бумаге и истребованный ревизорами, преобразуется в электронный образ путем сканирования с сохранением реквизитов документа. Сам скан формируется в виде файлов изображений в формате TIFF, JPG, PDF, PNG. При этом сканирование должно производиться с разрешением не менее 150 и не более 300 DPI (точек на дюйм) с использованием 256 градаций серого цвета.

Обратите внимание

5 Мб и не более должен быть суммарный размер всех передаваемых файлов в рамках одного заявления.

Сканирование должно обеспечивать возможность свободного чтения текста, всех реквизитов, дат, виз, резолюций, иных надписей, печатей, штампов и отметок. А электронный образ надо направлять в инспекцию с использованием технологического XML-файла, формат которого устанавливается ФНС.

Направляемые ревизорам документы должны быть заверены усиленной квалифицированной электронной подписью проверяемого лица или его представителя. Имя представляемого файла электронного образа должно будет иметь следующий вид: KD_O_P_N1_GGGGMMDD_N2, где:

  • KD – префикс, принимающий четырехзначное значение, равное 1101 (истребованные документы);
  • О – идентификатор отправителя, имеет вид: девятнадцатиразрядный код (ИНН и КПП организации) – для организаций, двенадцатиразрядный код (ИНН физлица, при отсутствии ИНН – последовательность из двена-дцати нулей) – для физлиц;
  • P – идентификатор конечного получателя, четырехразрядный код налогового органа в соответствии с СОНО;
  • GGGGMMDD – дата формирования файла;
  • N1, N2 – идентификационные номера файла (GUID).

В фотоархиве у любого фотографа хранятся фотографии, напечатанные на бумаге. Для того чтобы их эффективно хранить или использовать для каких-либо целей, их нужно оцифровать при помощи сканера. Для этого надо знать, как правильно сканировать и сохранять такие фотографии.

Правильно сканировать фотографии нужно сразу, так как может больше не быть такой возможности. Ошибки сканирования могут Вам обойтись дорого, особенно если речь идет о сотнях и тысячах фотографий. О том, как правильно сканировать фотографии и пойдет речь дальше.

Сканировать фотографии можно самому, а можно доверить специалисту в ближайшей фотолаборатории, но в любом случае нужно понимать, как и для каких целей, Вы будете сканировать свои фотографии. Для разных целей это делается по-разному. Выбор цели сканирования фотографий – это первый этап, с которого сканирование начинается.

Цели сканирования фотографий

Цели сканирования фотографий могут быть разными. В зависимости от того как после сканирования будут использоваться фотографии, зависят настройки сканирования – разрешение, глубина цвета, формат хранения фотографий. Правильное сканирование фотографий это всегда поиск компромисса между настройками, от которых зависит качество и размер будущей цифровой фотографии.

Рис.1 Оцифровка семейного фотоальбома это одна из самых популярных целей для сканирования фотографий.

Целями для сканирования фотографий могут быть:

1. Перевод фотографий в цифровой вид для эффективного хранения
2. Реставрация старых фотографий из семейного фотоальбома
3. Копирование фотографий у кого-либо или для кого-либо
4. Создание музыкального слайд-шоу из фотографий
5. Увеличение размера фотографии или ее части
6. Печать фотокниги из своих фотографий
7. Просмотр на каком-либо устройстве
8. Пересылка по электронной почте
9. Размещение в сети Интернет
10.Универсальное хранение

Это 10 основных целей сканирования фотографий, из которых видно то, что в каждом таком случаи фотографии нужно сканировать по-разному. Например, в случаях 1,2,5,10 фотографии должны иметь максимальное качество. В случаях 3,4,6,7 качество должно быть строго ограниченным, а в случаях 8,9 размер файла должен быть минимальным.

Кроме этих 10 целей, конечно, есть и другие, но эти встречаются очень часто и они наглядно показывают, как сильно могут отличаться файлы и размеры цифровых фотографий после их сканирования. Конечно же, все фотографии можно сканировать с максимальным качеством, но тогда их размер будет очень большим, что потребует дополнительных ресурсов.

При сканировании фотографий актуально выражение «Цель определяет средства». От того как правильно будет поставлена цель, будут зависеть время потраченное на дополнительные операции и деньги потраченные на хранение ненужных объемов информации. Выбор цели сканирования это залог того, что Вы будете правильно сканировать свои фотографии.

После того как будет выбрана цель для которой Вам нужно сканировать фотографии, эти фотографии нужно подготовить для сканирования. Это второй важный этап в сканировании фотографий, который поможет Вам значительно сократить общее время сканирования большого количества фотографий и сделать сам процесс сканирования менее утомительным.

Подготовка фотографий к сканированию

Если нужно отсканировать одну или несколько фотографий, какой-либо особой подготовки для этого не надо. Но если стоит задача оцифровать большой фотоархив, тогда без сортировки фотографий Вам не обойтись. Чем больше фотографий надо сканировать, тем тщательней их для этого нужно готовить (рис.2).

Рис.2 Перед сканированием фотографий их нужно разделить на характерные группы по общему признаку.

Перед тем как сканировать большое количество фотографий, сначала их нужно собрать в отдельную стопку. После этого они делятся на группы, для которых характерны одинаковые настройки. Это могут быть размер, ориентация, разрешение, глубина цвета или что-то еще. Сканер удобнее перестраивать под группу фотографий, а не под каждую из них.

Процесс сканирования большого числа фотографий чем-то напоминает работу конвейера. Берем из стопки фотографию, загружаем ее в сканер, нажимаем кнопку, сканируем, извлекаем фотографию и так повторяется со всеми фотографиями. Чем меньше Вы отвлекаетесь от этих действий, тем быстрее закончите сканировать свои фотографии.

Для того чтобы максимально увеличить общую скорость сканирования фотографий, их можно сканировать сразу по несколько штук. Для этого в сканере нужно разместить не одну фотографию, а например, сразу три или четыре. Проблема только в том, что потом их придется вырезать из общего файла.

Если сканирование фотографий выполняется на «автопилоте», попутно можно смотреть видео, слушать музыку или заниматься чем-то еще, что этому не мешает. Для того чтобы сканировать фотографии непрерывно, надо выполнить третий этап – правильно настроить сканер, учитывая те рекомендации о которых говорилось выше.

Настройка сканера для сканирования

Для сканирования фотографий лучше всего иметь планшетный с пометкой «Photo». Такой сканер имеет специальную программу-драйвер для работы с фотографиями. Сканировать фотографии удобнее сразу из этой программы (рис.3), но можно и в других программах как, например Adobe Photoshop или XnView.

Рис.3 Сканировать фотографии удобнее с помощью программы-драйвера сканера.

Независимо от марки сканера самый главный параметр, который нужно правильно выбрать, это разрешение будущей фотографии. Выбирать его надо для какой-то одной цели, о которых говорилось выше. Чем больше разрешение, тем качественнее изображение, но при этом и размер файла фотографии будет больше. Важно выбрать оптимальное разрешение.

Оптимальным разрешением сканирования фотографий для печати ее на бумажном носителе считается 300 пикселей на дюйм. Это при условии, что печать осуществляется в масштабе 1:1. Если при печати фотография будет увеличена в два раза, то и разрешение сканирования должно быть увеличено в два раза.

Печать фотографий на бумаге является своего рода ориентиром. Это то максимальное качество, которое требуется для просмотра фотографий. Для просмотра другого типа фотографий такого качества не нужно как, например, для просмотра с экрана монитора или телевизора.

Если говорить о формате, в котором надо сохранять файлы фотографий при сканировании, то для этого есть два основных графических формата и . Правило по их применению очень простое. Для сохранения максимального качества изображения – TIF, в других случаях – JPEG.

Сканирование фотографий – это популярный способ пополнения своего фотоархива цифровыми фотографиями, но есть и другие. О них читайте в следующих главах этой статьи:

Политика конфиденциальности персональных данных

Настоящая Политика конфиденциальности персональных данных (далее – Политика конфиденциальности) действует в отношении всей информации, расположенной на сайте с доменным именем www.сайт.

1. Определение терминов

1.1. В настоящей Политике конфиденциальности используются следующие термины:

  • «Администрация сайта» (далее – Администрация сайта) – уполномоченные сотрудники управления сайтом, действующие от имени ИП Григорьевой Ю.С., которые организуют и (или) осуществляет обработку персональных данных, а также определяет цели обработки персональных данных, состав персональных данных, подлежащих обработке, действия (операции), совершаемые с персональными данными.
  • «Персональные данные» - любая информация, относящаяся прямо или косвенно определенному или определяемому физическому лицу (субъекту персональных данных).
  • «Обработка персональных данных» - любое действие (операция) или совокупность действий (операций), совершаемых с использованием средств автоматизации или без использования таких средств с персональными данными, включая сбор, запись, систематизацию, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передачу (распространение, предоставление, доступ), обезличивание, блокирование, удаление, уничтожение персональных данных.
  • «Конфиденциальность персональных данных» - обязательное для соблюдения Оператором или иным получившим доступ к персональным данным лицом требование не допускать их распространения без согласия субъекта персональных данных или наличия иного законного основания.
  • «Пользователь сайта» (далее «Пользователь») – лицо, имеющее доступ к Сайту, посредством сети Интернет
  • «Cookies» - небольшой фрагмент данных, отправленный веб-сервером и хранимый на компьютере пользователя, который веб-клиент или веб-браузер каждый раз пересылает веб-серверу в HTTP-запросе при попытке открыть страницу соответствующего сайта.
  • «IP-адрес» - уникальный сетевой адрес узла в компьютерной сети, построенной по протоколу IP.

2. Общие положения

Использование Пользователем сайта и отправка Персональных данных означает согласие с настоящей Политикой конфиденциальности и условиями обработки Персональных данных Пользователя.

2.2. В случае несогласия с условиями Политики конфиденциальности Пользователь должен прекратить использование сайта.

2.3. Настоящая Политика конфиденциальности применяется только к сайту www.сайт.

2.4. Администрация сайта не проверяет достоверность персональных данных, предоставляемых Пользователем сайта.

3. Предмет политики конфиденциальности

3.1. Настоящая Политика конфиденциальности устанавливает обязательства Администрации сайта по неразглашению и обеспечению режима защиты конфиденциальности персональных данных, которые Пользователь предоставляет по запросу Администрации сайта при оформлении заказа.

3.2. Персональные данные, разрешённые к обработке в рамках настоящей Политики конфиденциальности, предоставляются Пользователем путём заполнения формы на Сайте включают в себя следующую информацию:

  • Имя, Фамилию;
  • Номер контактного телефона и/или адрес электронной почты, по которым мы можем связаться с Вами;

3.3. Также Администрация сайта может при необходимости собирать некоторую статистическую информацию, например:

  • IP-адрес пользователя;
  • Тип браузера;
  • Дата, время и количество посещений;
  • Адрес сайта, с которого пользователь осуществил переход на сайт Компании;
  • Сведения о местоположении;
  • Сведения о посещенных страницах, о просмотре рекламных баннеров;

4. Цели сбора персональной информации пользователя

4.1. Персональные данные Пользователя Администрация сайта может использовать в целях:

  • Установления с Пользователем обратной связи, включая направление уведомлений, запросов, касающихся оказания услуг, обработка запросов и заявок от Пользователя.
  • Подтверждения достоверности и полноты персональных данных, предоставленных Пользователем.
  • Уведомления Пользователя Сайта о состоянии Заказа.
  • Обработки и получения платежей.
  • Предоставления Пользователю эффективной клиентской и технической поддержки при возникновении проблем связанных с использованием Сайта.
  • Предоставления Пользователю с его согласия, обновлений продукции, специальных предложений, информации о ценах, новостной рассылки и иных сведений от имени Компании.
  • Осуществления рекламной деятельности с согласия Пользователя.

5. Способы и сроки обработки персональной информации

5.1. Обработка персональных данных Пользователя осуществляется без ограничения срока, любым законным способом, в том числе в информационных системах персональных данных с использованием средств автоматизации или без использования таких средств.

5.2. Пользователь соглашается с тем, что Администрация сайта вправе передавать персональные данные третьим лицам, в частности, курьерским службам, организациями почтовой связи, операторам электросвязи, исключительно в целях выполнения заказа Пользователя.

5.3. Персональные данные Пользователя могут быть переданы уполномоченным органам государственной власти Российской Федерации только по основаниям и в порядке, установленным законодательством Российской Федерации.

5.4. При утрате или разглашении персональных данных Администрация сайта информирует Пользователя об утрате или разглашении персональных данных.

5.5. Администрация сайта принимает необходимые организационные и технические меры для защиты персональной информации Пользователя от неправомерного или случайного доступа, уничтожения, изменения, блокирования, копирования, распространения, а также от иных неправомерных действий третьих лиц.

5.6. Администрация сайта совместно с Пользователем принимает все необходимые меры по предотвращению убытков или иных отрицательных последствий, вызванных утратой или разглашением персональных данных Пользователя.

6. Обязательства сторон

6.1. Пользователь обязан:

6.1.1. Предоставить информацию о персональных данных, необходимую для пользования Сайтом.

6.1.2. Обновить, дополнить предоставленную информацию о персональных данных в случае изменения данной информации.

6.2. Администрация сайта обязана:

6.2.1. Использовать полученную информацию исключительно для целей, указанных в п. 4 настоящей Политики конфиденциальности.

6.2.2. Обеспечить хранение конфиденциальной информации в тайне, не разглашать без предварительного письменного разрешения Пользователя, а также не осуществлять продажу, обмен, опубликование, либо разглашение иными возможными способами переданных персональных данных Пользователя, за исключением п.п. 5.2. и 5.3. настоящей Политики Конфиденциальности.

6.2.3. Принимать меры предосторожности для защиты конфиденциальности персональных данных Пользователя согласно порядку, обычно используемого для защиты такого рода информации в существующем деловом обороте.

6.2.4. Осуществить блокирование персональных данных, относящихся к соответствующему Пользователю, с момента обращения или запроса Пользователя или его законного представителя либо уполномоченного органа по защите прав субъектов персональных данных на период проверки, в случае выявления недостоверных персональных данных или неправомерных действий.

7. Ответственность сторон

7.1. Администрация сайта, не исполнившая свои обязательства, несёт ответственность за убытки, понесённые Пользователем в связи с неправомерным использованием персональных данных, в соответствии с законодательством Российской Федерации, за исключением случаев, предусмотренных п.п. 5.2., 5.3. и 7.2. настоящей Политики Конфиденциальности.

7.2. В случае утраты или разглашения Конфиденциальной информации Администрация сайта не несёт ответственность, если данная конфиденциальная информация:

  • Стала публичным достоянием до её утраты или разглашения.
  • Была получена от третьей стороны до момента её получения Администрацией сайта.
  • Была разглашена с согласия Пользователя.

8. Разрешение споров

8.1. До обращения в суд с иском по спорам, возникающим из отношений между Пользователем и Администрацией сайта, обязательным является предъявление претензии (письменного предложения о добровольном урегулировании спора).

8.2 Получатель претензии в течение 30 календарных дней со дня получения претензии, письменно уведомляет заявителя претензии о результатах рассмотрения претензии.

8.3. При не достижении соглашения спор будет передан на рассмотрение в судебный орган в соответствии с действующим законодательством Российской Федерации.

8.4. К настоящей Политике конфиденциальности и отношениям между Пользователем и Администрацией сайта применяется действующее законодательство Российской Федерации.

9. Дополнительные условия

9.1. Администрация сайта вправе вносить изменения в настоящую Политику конфиденциальности без согласия Пользователя.

9.3. Все предложения или вопросы по настоящей Политике конфиденциальности следует сообщать по электронной почте info@сайт

BMP (от англ. Bitmap Picture) - формат хранения растровых изображений, разработанный компанией Microsoft. Файлы формата BMP могут иметь расширения.bmp, .dib и.rle.

С форматом BMP работает огромное количество программ, так как его поддержка интегрирована в операционные системы Windows и OS/2. Кроме того, данные этого формата включаются в двоичные файлы ресурсов RES и в PE-файлы. В данном формате можно хранить только однослойные растры. На каждый пиксель в разных файлах может приходиться разное количество бит (глубина цвета). Microsoft предлагает битности 1, 2, 4, 8, 16, 24, 32, 48 и 64. В битностях 8 и ниже он указывается индексом из таблицы цветов (палитры), а при больших непосредственным значением. Цвет же в любом случае можно задать только в цветовой модели RGB (как при непосредственном указании в пикселе, так и в таблице цветов), но в битностях 16 и 32 можно получить Grayscale с глубиной до 16 и 32 бит соответственно. Частичная прозрачность реализована альфа-каналом различных битностей, но при этом прозрачность без градаций можно косвенно получить RLE-кодированием.

В большинстве случаев пиксели хранятся в виде относительно простого двумерного массива. Для битностей 4 и 8 доступно RLE-кодирование, которое может уменьшить их размер. Формат BMP также поддерживает встраивание данных в форматах JPEG и PNG. Но последнее скорее больше предназначено не для компактного хранения, а для обхода ограничений архитектуры GDI, которая не предусматривает прямую работу с изображениями отличных от BMP форматов.

GIF (англ. Graphics Interchange Format - «формат для обмена изображениями») - популярный формат графических изображений. Способен хранить сжатые данные без потери качества в формате не более 256 цветов. Не зависящий от аппаратного обеспечения формат GIF был разработан в 1987 году (GIF87a) фирмой CompuServe для передачи растровых изображений по сетям. В 1989-м формат был модифицирован (GIF89a), были добавлены поддержка прозрачности и анимации. GIF использует LZW-компрессию, что позволяет сжимать файлы, в которых много однородных заливок (логотипы, надписи, схемы).



JPEG (произносится «джейпег » , англ. Joint Photographic Experts Group , по названию организации-разработчика) - один из популярных графических форматов, применяемый для хранения фотоизображенийи подобных им изображений. Файлы, содержащие данные JPEG, обычно имеют расширения (суффиксы) .jpg ,.jfif , .jpe или .jpeg . Однако из них .jpg является самым популярным на всех платформах. MIME-типом является image/jpeg.

PNG (англ. portable network graphics , сокращение произносится по-английски /pɪŋ/ ) - растровый формат хранения графической информации, использующий сжатие без потерь по алгоритму Deflate.TIFF (англ. Tagged Image File Format ) - формат хранения растровых графических изображений. TIFF стал популярным форматом для хранения изображений с большой глубиной цвета. Он используется при сканировании, отправке факсов, распознавании текста, в полиграфии, широко поддерживается графическими приложениями. TIFF был выбран в качестве основного графического формата операционной системы NeXTSTEP и из неё поддержка этого формата перешла в Mac OS X. Формат был разработан Aldus Corporation в сотрудничестве с Microsoft для использования с PostScript. Компания-владелец спецификаций - Aldus Corporation - впоследствии объединилась с Adobe Systems, владеющей в настоящее время авторским правом на эти спецификации .

Изначально формат поддерживал сжатие без потерь, впоследствии формат был дополнен для поддержки сжатия с потерями в формате JPEG .

DjVu (от фр. déjà vu - «уже виденное») - технология сжатия изображений с потерями, разработанная специально для хранения сканированных документов - книг, журналов, рукописей и прочее, где обилие формул, схем, рисунков и рукописных символов делает чрезвычайно трудоёмким их полноценноераспознавание. Также является эффективным решением, если необходимо передать все нюансы оформления, например, исторических документов, где важное значение имеет не только содержание, но и цвет и фактура бумаги; дефекты пергамента: трещинки, следы от складывания; исправления, кляксы, отпечатки пальцев; следы, оставленные другими предметами и т. д.

Изначально технология была разработана Яном Лекуном, Леоном Боту и Патриком Хеффнером в AT&T Labs с 1996 по 2001 годы. DjVu стал основой для нескольких библиотек научных книг. Он довольно популярен, и в нём делается большое количество разных документов.

Формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать ещё до завершения загрузки файла. DjVu-файл может содержать текстовый (OCR) слой, что позволяет осуществлятьполнотекстовый поиск по файлу. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области - ссылки, что позволяет реализовать удобную навигацию в DjVu-книгах.

  1. Что такое TWAIN?

TWAIN - стандартный протокол и интерфейс (API), определяющий взаимодействие между программами и устройствами захвата изображения, такими как сканеры и цифровые камеры.

Поскольку TWAIN не является протоколом аппаратного уровня, производитель устройств для получения изображений может предоставлять TWAIN-совместимый драйвер. Таким образом, становится возможным захват изображений не только со сканеров, но и некоторых веб-камер, не только при помощи Video for Windows, DirectShow или WIA, но и через TWAIN. Благодаря открытости стандарта становится возможным использование оборудования с программным обеспечением сторонних поставщиков, например камер для микроскопических систем Leica Microsystems (англ.).

В процессе работы используется несколько абстракций: англ. Data source manager, управляющий всеми доступными в системе TWAIN-совместимыми устройствами и англ. Data source object для каждого отдельного устройства, отвечающий за передачу и настройки захвата получаемого кадра.

Взаимодействие клиентского приложения и устройства можно представить следующим образом:

Диалог выбора устройства захвата (Data source manager)

Открытие источника данных (Data source) и настройка параметров захвата, с установкой разрешения изображения, разрядности и пр.

Клиентское приложение опрашивает устройство. Доступны два механизма: опроса и callback. В последнем случае устройство само сообщает о готовности изображения для передачи.

Собственно передача данных от DS. Существует несколько механизмов передачи:

Native - в Windows это Device independent bitmap в памяти

Memory - блоки пикселей в буферах памяти

File - DS записывает изображение непосредственно в файл (не обязательно поддерживается)

Закрытие источника данных

Сканирование документов и создание электронного архива могут занять у Вас длительное время, но, поверьте, это того стоит! Ведь грамотное сканирование позволяет пользоваться документами в электронном виде, а для бумажных носителей предусмотреть внеофисное хранение документов. Представьте, сколько офисного пространства Вы могли бы сэкономить!

Сканирование документов и создание электронного архива подразумевает три шага:

Шаг 1. Подготовка.

одного размера и в хорошем состоянии можно воспользоваться автоматическим устройством подачи документов. Кроме того, использование этого устройства при двусторонней печати поможет Вам существенно сэкономить время при сканировании документов.

Обязательно удалите все скобы и скрепки, разгладьте все загибы и складки на документах, чтобы избежать замятия бумаги в процессе сканирования.

Сканирование документов нестандартного размера нужно сканировать вручную.

Шаг 2. Выбор формата файлов.

Приступая ко второму шагу в процессе сканирования документов и создания электронного архива, задумайтесь, хотите ли Вы в будущем иметь возможность редактировать файлы в электронном архиве. Если Вы не собираетесь изменять отсканированные документы, сохраняйте их в формате PDF (Portable Document Format). В свою очередь, оптическое распознавание символов (OCR) позволяет сохранять документы в редактируемых форматах. При сканировании документов с OCR с расширением.RTF или.DOC, или с другим расширением, соответствующем приложению, которое Вы будете использовать для редактирования документа.

Итак, при сканировании и сохранении документов выберите один из следующих форматов:

  • Portable Document Format (PDF) – формат сохраненных файлов, позволяющий просматривать документы электронного архива на различных компьютерных платформах вне зависимости от шрифтов и программного обеспечения, использованных для создания оригинала.
  • Tagged Image Файл Format (TIFF) – формат высокого качества поддерживается в большинстве операционных систем, идеально подходит для сканирования и архивирования документов или чертежей, которые в дальнейшем можно будет изменять с помощью программ-редакторов изображения, таких как Adobe Photoshop.
  • Документы Microsoft Word (. DOC) или Microsoft Rich Text Format (. RTF) – цифровые текстовые форматы поддерживаются во всех операционных системах и позволяют также не допустить изменения документов.

Заключительный этап

Шаг 3. Хранение.

Закончив сканирование документов, Вы переходите к завершающему этапу создания электронного архива – передаче файлов на свой компьютер или другие устройства хранения информации. Для удобства можно воспользоваться специальными утилитами для создания электронного архива, или записать несколько DVD или CD дисков с отсканированными документами. Помните про резервные копии файлов электронного архива – они пригодятся в случае поломки компьютера.



© 2024 beasthackerz.ru - Браузеры. Аудио. Жесткий диск. Программы. Локальная сеть. Windows