Основные сведения о жестких дисках. Логическая структура дисков

Основные сведения о жестких дисках. Логическая структура дисков

05.06.2019

Логическая структура дисков

Форматирование дисков. Для того чтобы на диске можно было хранить информацию, диск должен быть отформатирован, то есть должна быть создана физическая и логическая структура диска.

Формирование физической структуры диска состоит в создании на диске концентрических дорожек, которые, в свою очередь, делятся на секторы. Для этого в процессе форматирования магнитная головка дисковода расставляет в определенных местах диска метки дорожек и секторов.

После форматирования гибкого диска 3,5" его параметры будут следующими (рис. 4.24):

  • информационная емкость сектора - 512 байтов;
  • количество секторов на дорожке - 18;
  • дорожек на одной стороне - 80;
  • сторон - 2.


Рис 4.24. Физическая структура дискеты

Логическая структура гибких дисков. Логическая структура магнитного диска представляет собой совокупность секторов (емкостью 512 байтов), каждый из которых имеет свой порядковый номер (например, 100). Сектора нумеруются в линейной последовательности от первого сектора нулевой дорожки до последнего сектора последней дорожки.

На гибком диске минимальным адресуемым элементом является сектор .

При записи файла на диск будет занято всегда целое количество секторов, соответственно минимальный размер файла - это размер одного сектора, а максимальный соответствует общему количеству секторов на диске.

Файл записывается в произвольные свободные сектора, которые могут находиться на различных дорожках. Например, Файл_1 объемом 2 Кбайта может занимать сектора 34, 35 и 47, 48, а Файл_2 объемом 1 Кбайт - сектора 36 и 49.

Для того чтобы можно было найти файл по его имени, на диске имеется каталог, представляющий собой базу данных.

Запись о файле содержит имя файла, адрес первого сектора, с которого начинается файл, объем файла, а также дату и время его создания (табл. 4.5).

Полная информация о секторах, которые занимают файлы, содержится в таблице размещения файлов (FAT - File Allocation Table). Количество ячеек FAT соответствует количеству секторов на диске, а значениями ячеек являются цепочки размещения файлов, то есть последовательности адресов секторов, в которых хранятся файлы.

Например, для двух рассмотренных выше файлов таблица FAT с 1 по 54 сектор принимает вид, представленный в табл. 4.6.

Цепочка размещения для файла Файл_1 выглядит следующим образом: в начальном 34-м секторе хранится адрес 35, в 35-м секторе хранится адрес 47, в 47-м - 48, в 48-м - знак конца файла (К).

Для размещения каталога - базы данных и таблицы FAT на гибком диске отводятся секторы со 2 по 33. Первый сектор отводится для размещения загрузочной записи операционной системы. Сами файлы могут быть записаны, начиная с 34 сектора.

Виды форматирования. Существуют два различных вида форматирования дисков: полное и быстрое форматирование. Полное форматирование включает в себя как физическое форматирование (проверку качества магнитного покрытия дискеты и ее разметку на дорожки и секторы), так и логическое форматирование (создание каталога и таблицы размещения файлов). После полного форматирования вся хранившаяся на диске информация будет уничтожена.

Быстрое форматирование производит лишь очистку корневого каталога и таблицы размещения файлов. Информация, то есть сами файлы, сохраняется и в принципе возможно восстановление файловой системы.

Стандартное форматирование гибкого диска

1. В контекстном меню выбрать пункт Форматировать . Откроется диалоговая панель Форматирование . С помощью переключателя Способ форматирования выбрать пункт Полное .

В поле Метка можно ввести название диска. Для получения сведения о результатах форматирования установить флажок Вывести отчет о результатах. Щелкнуть по кнопке Начать .

В целях защиты информации от несанкционированного копирования можно задавать нестандартные параметры форматирования диска (количество дорожек, количество секторов и др.). Такое форматирование возможно в режиме MS-DOS.

Нестандартное форматирование гибкого диска

1. Ввести команду [Программы-Сеанс MS-DOS]. Появится окно приложения Сеанс MS-DOS.

2. Ввести команду нестандартного форматирования гибкого диска А:, на котором будет 79 дорожек и 19 секторов на каждой дорожке:

Информационная емкость гибких дисков. Рассмотрим различие между емкостью неформатированного гибкого магнитного диска, его информационной емкостью после форматирования и информационной емкостью, доступной для записи данных.

Заявленная емкость неформатированного гибкого магнитного диска формата 3,5" составляет 1,44 Мбайт.

Рассчитаем общую информационную емкость отформатированного гибкого диска:

Количество секторов: N = 18 х 80 х 2 = 2880.

Информационная емкость:

512 байт х N = 1 474 560 байт = 1 440 Кбайт = 1,40625 Мбайт.

Однако для записи данных доступно только 2847 секторов, то есть информационная емкость, доступная для записи данных, составляет:

512 байт х 2847 = 1 457 664 байт = 1423,5 Кбайт » 1,39 Мбайт.

Логическая структура жестких дисков. Логическая структура жестких дисков несколько отличается от логической структуры гибких дисков. Минимальным адресуемым элементом жесткого диска является кластер , который может включать в себя несколько секторов. Размер кластера зависит от типа используемой таблицы FAT и от емкости жесткого диска.

На жестком диске минимальным адресуемым элементом является кластер , который содержит несколько секторов.

Таблица FAT16 может адресовать 2 16 = 65 536 кластеров. Для дисков большой емкости размер кластера оказывается слишком большим, так как информационная емкость жестких дисков может достигать 150 Гбайт.

Например, для диска объемом 40 Гбайт размер кластера будет равен:

40 Гбайт/65536 = 655 360 байт = 640 Кбайт.

Файлу всегда выделяется целое число кластеров. Например, текстовый файл, содержащий слово "информатика", составляет всего 11 байтов, но на диске этот файл будет занимать целиком кластер, то есть 640 Кбайт дискового пространства для диска емкостью 150 Гбайт. При размещении на жестком диске большого количества небольших по размеру файлов они будут занимать кластеры лишь частично, что приведет к большим потерям свободного дискового пространства.

Эта проблема частично решается с помощью использования таблицы FAT32, в которой объем кластера принят равным 8 секторам или 4 килобайтам для диска любого объема.

В целях более надежного сохранения информации о размещении файлов на диске хранятся две идентичные копии таблицы FAT.

Преобразование FAT16 в FAT32 можно осуществить с помощью служебной программы Преобразование диска в FAT32, которая входит в состав Windows.

Дефрагментация дисков. Замедление скорости обмена данными может происходить в результате фрагментации файлов. Фрагментация файлов (фрагменты файлов хранятся в различных, удаленных друг от друга кластерах) возрастает с течением времени, в процессе удаления одних файлов и записи других.

Так как на диске могут храниться сотни и тысячи файлов в сотнях тысяч кластеров, то фрагментированность файлов будет существенно замедлять доступ к ним (магнитным головкам придется постоянно перемещаться с дорожки на дорожку) и в конечном итоге приводить к преждевременному износу жесткого диска. Рекомендуется периодически проводить дефрагментацию диска, в процессе которой файлы записываются в кластеры, последовательно идущие друг за другом.

Дефрагментация диска

1. Для запуска программы Дефрагментация диска, необходимо из Главного меню ввести команду [Стандартные-Служебные-Дефрагментация диска].

2. Диалоговая панель Выбор диска позволяет выбрать диск, нуждающийся в процедуре дефрагментации. После нажатия кнопки ОК появится петель Дефрагментация диска .

3. Процесс дефрагментации диска можно визуально наблюдать, если щелкнуть по кнопке Сведения . Каждый квадратик соответствует одному кластеру, при этом неоптимизированные , уже оптимизированные , а также считываемые и записываемые в данный момент кластеры имеют различные цвета.

Вопросы для размышления

1. Какой минимальный объем занимает файл при его хранении:

  • на гибком магнитном диске;
  • на жестком магнитном диске.

2. Какова последовательность размещения файла Файл_2 из приведенного примера на секторах гибкого диска?

3. Почему различаются величины емкости отформатированного диска и информационной емкости, доступной для записи данных?

4. Чем различаются полное и быстрое форматирование диска?

5. Чем различаются таблицы размещения файлов FAT16 и FAT32?

6. С какой целью необходимо периодически проводить дефрагментацию жестких дисков?

Практические задания

4.14. Отформатировать гибкий диск с нестандартными параметрами.

4.15. Вычислить объем кластера вашего жесткого диска в системе FAT16.

4.16. С помощью служебной программы Сведения о системе определить тип FAT, используемый на ваших дисках.

4.17. С помощью служебной программы Проверка диска провести проверку целостности файловой системы.

4.18. С помощью служебной программы Дефрагментация диска провести дефрагментацию дисков вашего компьютера.

Информационная емкость жесткого диска - важное понятие для систем хранения данных. За ним скрывается полный объем накопителя. Сейчас получили распространение две методики его расчета. Они дают разные результаты, и это не разбирающихся в данном вопросе пользователей вводит в заблуждение.

В чем проблема?

Человек обрабатывает информацию в Так исторически сложилось, и никто от этого не хочет отказываться. Нам так удобней. В ее состав входят числа от 0 до 9 (некоторые считают от 1 до 10, но это сути не меняет). А вот компьютер обрабатывает данные в Она базируется на 0 (отсутствии сигнала) и 1 (наличии напряжения). Вот и получается, что информационная емкость жесткого диска может быть определена по двоичной или по десятичной При этом необходимо учитывать один важный момент. В первой из них 1 килобайт составляет 2 10 , или 1024 байта. Этим значением пользуются программисты, и так определяют объем информации все ОС «Виндовс» на сегодняшний день. А вот во втором случае это значение будет равно 10 3 , или 1000 байт. Так считают информацию люди и производители накопителей. Как несложно понять, человек может купить жесткий диск с одними характеристиками, а ОС «Виндовс» покажет ему немножко другую информацию. При этом информационная емкость жесткого диска для двоичной системы будет меньше, а для десятичной - больше. А вот количество остается неизменным. Определяющим в этом случае является то, каким способом считать.


Пересчет

Сделаем пересчет на примере накопителя на 500 Гб (по данным производителя) и определим процент потерь. Для начала уточним то, что приставка "гига" в десятичной системе означает 10 9 , а в двоичной - 2 30 . Для начала умножаем 500 Гб на 10 9 . Это позволит получить размер в байтах. Для перехода к двоичной системе нужно полученное значение 500 х 10 9 разделить на 2 30 , и мы получим 465 Гб. Это и будет информационная емкость жесткого диска в новой системе. Далее определим процент потерь при переходе между ними. Для этого от 500 Гб вычтем 465 Гб и разделим полученное значение на 500 Гб. В результате получаем 0,07. Если это значение умножим на 100, то узнаем разницу в процентах. Это будет 7%.

Вот и получается, что объем накопителя, который покажет ОС «Виндовс», уменьшается сразу на полученное значение. Хорошо, если человек разбирается и понимает это. Но бывают и другие случаи, когда обиженный клиент приходит в магазин и начинает выяснять отношения. При этом продавца обвиняют в том, что он продал «обрезанный» накопитель. Клиент не понимает того, что максимальная емкость жесткого диска - величина неизменная на самом деле. Но ее значение может изменяться в зависимости от метода подсчета. И разница между ними составляет 7% независимо от объема. Это утверждение справедливо для всех устройств хранения информации, в том числе и флешек, и дискет, и компакт-дисков.


Заключение

Полная емкость жесткого магнитного диска является ключевым параметром, на который покупатели обращают внимание перед приобретением. Но при этом мало кто задумывается о том, что ее значение будет меньше на 7% в ОС «Виндовс». А ведь это надо учитывать и брать устройство с определенным запасом, чтобы потом не покупать второй накопитель.

Устройство жесткого диска

Накопитель на жестких магнитных дисках состоит из одной или нескольких пластин с магнитным слоем, головок, позиционирующего устройства, корпуса, а также контроллера. Пластины - основной элемент накопителя, на них размещается информация. Головки предназначены для чтения и записи информации на пластины. Позиционирующее устройство обеспечивает перемещение головок к нужному месту на поверхности пластин. Корпус служит для крепления остальных элементов конструкции, а также для защиты пластин и головок от механических повреждений и пыли. Контроллер управляет всеми электрическими и электромеханическими узлами накопителя и обеспечивает передачу информации из компьютера и обратно.

рис.1

Геометрия жесткого диска

Пластины накопителя изготовляются из металла или стекла и имеют с одной или обеих сторон магнитный слой, на который и происходит запись информации. Сторона пластины с нанесенным магнитным слоем называется рабочей поверхностью. Поверхности пластин тщательно отполированы и покрыты ферромагнитным слоем. Материал покрытия и количество слоев (магнитный слой может состоять из нескольких слоев разных материалов) может быть различным для разных накопителей. На каждую рабочую поверхность приходится по одной головке (на самом деле в современных накопителях для увеличения плотности записи применяются отдельные головки записи и чтения, изготовленные по различным технологиям). Поверхность пластины разбивается на тонкие концентрические кольцевые зоны, называемые дорожками. А каждая дорожка , в свою очередь, делится на несколько участков, получивших названия секторов. Сектор можно условно разделить на две области: область данных и область служебной информации. Служебная информация записывается на пластину один раз на заводе-изготовителе и в дальнейшем не подлежит изменению. Служебная область включает уникальный адрес сектора в накопителе, по которому его опознает контроллер при записи или считывании информации. Область данных содержит полезную информацию, записываемую на накопитель. Эта область может быть многократно изменена в период эксплуатации. Объем области данных несколько превосходит информационную емкость сектора за счет дополнительной информации - для верификации и, возможно, исправления ошибок. Область данных сектора может быть обновлена только целиком. Т.е. на накопитель нельзя записать один или десять байт - только сектор целиком. Все головки перемещаются синхронно, и этот процесс занимает некоторое время. Совокупность дорожек на разных пластинах доступных одновременно при неизменном положении головок называется цилиндром . С точки зрения производительности дисковой системы целесообразно последовательные данные располагать в пределах одного цилиндра.



рис.2

В старых накопителях все дорожки содержали одинаковое количество секторов. В этом случае уникальный адрес каждого сектора (т.е. минимальной порции информации, хранимой на накопителе) мог быть задан тремя числами: номерами цилиндра, головки и сектора. Таким образом, на жестком диске была введена трехмерная система координат, очень напоминающая цилиндрическую в трехмерном пространстве: радиусу соответствует номер цилиндра, высоте - номер головки, а углу - номер сектора.

Если представить такую конструкцию в декартовой системе координат (например, считать, что наш "диск" собран из нескольких плат с флэш-памятью), то она будет представлять собой по форме параллелепипед, разбитый на ячейки - сектора.

Однако, при такой разметке жесткого диска плотность записи на внешних дорожках оказывается примерно втрое ниже, чем на внутренних (одно и то же количество информации на втрое превосходящую длину дорожки). Поэтому в современных накопителях используется так называемая зонная запись, при которой поверхность пластин разделяется вдоль радиуса на несколько зон (обычно около десятка), в каждой из которых количество секторов на дорожку постоянно, однако, это количество меняется от зоны к зоне. На внешних дорожках размещается больше секторов, чем на внутренних. Это позволяет увеличить информационную емкость накопителя примерно вдвое без изменения максимальной плотности записи. Но, будучи представленной в декартовой геометрии, такая фигура будет иметь достаточно сложную форму, с которой не сможет работать BIOS. Поэтому из всего многообразия интерфейсов жестких дисков (ST506/412, ESDI, IDE, SCSI) остались только два последних, отличающихся наибольшей "интеллектуальностью", что выражается в способности осуществлять такое "преобразование координат" при котором фигура неправильной формы превращается в аккуратный "кирпичик". Заодно такое преобразование позволяет обойти или, по крайней мере, несколько смягчить ограничения, налагаемые BIOS на максимальные значения некоторых параметров. Например, BIOS не может работать более чем с 63 секторами на дорожке, в то время как на современных дисках их примерно на порядок больше. В то же время, BIOS может "думать", что у жесткого диска 16 или даже 255 головок, в то время как в реальных накопителях это число лежит в пределах, как правило, от 1 до 6.



рис.3

Естественно, зонная запись, т.е. различное количество секторов на разных дорожках при постоянной скорости вращения ведет к тому, что скорость обмена данными будет зависеть от номера цилиндра.



рис.4

Ограничения на объем

В свое время при разработке первых версий BIOS для IBM PC было решено ограничить количество секторов и цилиндров одним 16-разрядным числом, при этом для сектора отводилось 6 разрядов (максимальный номер 63), а для цилиндра - 10 (максимальный номер - 1023). Для номера головки BIOS было отведено 8 разрядов (максимальное число - 255). Но интерфейс IDE допускал не более 16 головок, что при размере сектора 512 байт по сумме всех ограничений давало верхнюю границу в 504 Мбайта (528 482 304 байта). Разрешение этой проблемы заключалось во введении режима LBA, т.е. "переносе" неиспользуемых разрядов номера головки для адресации номера цилиндра. Такое решение требовало одновременно как аппаратной (со стороны IDE-контроллера), так и программной (со стороны BIOS) поддержки. Одновременно оказалась исчерпанной пропускная способность шины ISA. Поэтому слегка переработанный контроллер (теперь уже с интерфейсом, называемым EIDE) стали помещать на системную плату, т. е. туда же, где располагалась микросхема BIOS с поддержкой новых возможностей.

  • Но только была преодолена эта граница, как выяснилось, что следующее ограничение связано уже с файловой системой FAT16 - размер логического диска не может быть больше 2 Гбайт (точнее 2047 Мбайт). При этом место на жестком диске расходуется на редкость неэффективно (см. Раздел "Проблемы кластеризации").

    Введение FAT32 позволило преодолеть этот предел, однако вскоре снова "вылезла" проблема BIOS - на полный адрес сектора отводилось 24 разряда, и адресация более 8 Гбайт (точнее 7.85 Гбайт) дисковой памяти при 512-байтных секторах оказалась невозможной. Пришлось ввести новые функции BIOS для большинства дисковых операций. Теперь лимит составляет 64 разряда, что соответствует 8 млрд. Тбайт, так что пока есть некоторый запас по времени. Кроме того оговорено, что нумерации подлежат блоки, а не сектора. Пока 1 блок равен 1 сектору, но как только объем накопителей приблизится к указанному лимиту, появится некоторый резерв за счет увеличения размера блока.

    Кроме того, так как с введением зонной записи привязка к физической структуре накопителя, выраженная в цилиндрах, секторах и головках, оказалась неактуальной, было решено отказаться от трехмерной системы координат и перейти к одномерной - по абсолютному номеру сектора.

    Теперь программных ограничений на рост объемов накопителей в ближайшее время не предвидится (но некоторые программы из-за содержащихся в них ошибок не могут работать с дисками объемом выше 32 или 64 Мбайт), хотя остаются определенные ограничения, связанные с аппаратурой, т.е. с физической организацией интерфейса IDE.

    Взаимодействие между пользователем и дисковым накопителем

    Рядовому пользователю было бы чрезвычайно обременительно следить за тем, какие сектора на его жестком диске уже заняты, и куда следует записывать новые данные. Чтобы облегчить ему эту работу служит операционная система (ОС), вводящая понятие файла и позволяющая работать с содержимым файла побайтно. Для этого ОС резервирует некоторое место на диске для своих нужд. Вот как выглядит дописывание нескольких байт к концу существующего файла в корневом каталоге с точки зрения ОС.

    • 1. считать оглавление, содержащее нужный файл и поместить его в буфер №1,
    • 2. считать таблицу FAT и поместить ее в буфер №2,
    • 3. в соответствии с FAT считать последний (неполный) сектор файла в буфер №3,
    • 4. дописать часть требуемых байтов в буфер №3 до его заполнения,
    • 5. вписать буфер №3 на его прежнее место на диске,
    • 6. используя FAT, найти на диске свободный фрагмент,
    • 7. вписать оставшиеся байты в буфер №4,
    • 8. вписать содержимое буфера №4 в найденный свободный фрагмент диска,
    • 9. внести изменения в FAT (в буфер №2) и вписать его на прежнее место на диске,
    • 10. внести изменения длины файла в оглавление (буфер №1) и вписать его в прежнее место на диск.

    Это только самый простейший случай. Если файловая система предусматривает вложенные оглавления, защиту информации, разграничение доступа, откат и восстановление после сбоев, то список необходимых действий может увеличиться в несколько раз.

    Мы уже говорили о том, что данные в накопителе адресуются через номер логического сектора или через тройку цилиндр-головка-сектор. Именно таким образом и обращается ОС к BIOS. Последний же, в свою очередь, должен сообщить ОС объем накопителя и, при необходимости, его геометрические характеристики, а также перевести запрос на операцию с определенным сектором в последовательность команд того или иного интерфейса. Для ОС тип интерфейса, ST512/412, ESDI. IDE, SCSI, USB, IEEE1394 или режим работы, PIO, UDMA неинтересны. Ее интересуют только сектора и точка!

    Проблемы кластеризации

    Как мы видели, для работы с файлами постоянно требуется определенная информация по размещению их на диске. В приведенном выше случае это FAT. Для простоты ограничимся рассмотрением именно этого случая. Из 7 дисковых операций 3 относятся к FAT. Учитывая, что файловые операции, выполняемые с перемещением головки, происходят существенно медленнее операций без перемещения, получается, что хранение FAT в оперативной памяти увеличивает производительность файловой системы более чем вдвое. Но есть и явная отрицательная черта - если перед выключением компьютера не привести в соответствие копию FAT, хранящуюся на диске, с копией в оперативной памяти, неизбежна потеря информации. Поэтому выключение компьютера кнопкой или тумблером на передней панели, как это практиковалось в DOS, уже становится неприемлемым.

    При этом, если буфера для данных файла или каталога могли быть небольшими, в один сектор, то FAT иногда необходимо обрабатывать целиком, например, при поиске свободного фрагмента.

    В FAT16 максимальное количество фрагментов, предназначенных для размещения файлов, составляет около 65 тысяч, а занимаемое таблицами место - 128 Кбайт (64К 2-байтных слов). При распределении мест секторами максимальный объем диска составит, таким образом, 32 Мбайта (кое-кто еще помнит, что реально было и такое ограничение на объем жесткого диска).

    Для увеличения доступного ОС дискового пространства сектора пришлось объединять в кластеры, содержащие несколько секторов. Кроме того, очевидно, что при увеличении вдвое размера кластера вдвое же уменьшается размер FAT, а следовательно, как расход оперативной памяти, так и время поиска свободного места. Но увеличение размера кластеров ведет к неэффективному расходу дискового пространства. Мне когда-то попадалась аналогия распределения места на диске с необходимостью расплачиваться за любые товары только стодолларовыми купюрами: купил коробок спичек - и нет $100, купил батон хлеба - еще сотню долой. Действительно, при записи даже одного байта расходуется целиком кластер. Например, при 32-Кбайтных кластерах (диск объемом 2 Гбайт) 1000 однобайтных файлов суммарной длиной менее Кбайта займут на диске место равное 32 Мбайтам.

    Введение FAT32 отчасти устранило эту проблему, теперь для размещения аналогичного объема информации потребуется только 4 Мбайта. Но ничего бесплатного не бывает. Размер одного элемента FAT увеличился вдвое, а количество элементов - в 8 раз, так что теперь объем таблиц для данного случая составит уже 2 Мбайта. Конечно, по нынешним меркам это немного, но если учесть, что объем накопителей может превышать сотню Гбайт, то окажется, что значительная доля оперативной памяти будет использована не для размещения данных пользователя, а для внутренних нужд ОС. Вспомним и о том, что для поиска свободного фрагмента на диске может потребоваться просмотреть значительную часть FAT, так что в попытках увеличить скорость работы дисковой системы мы одновременно увеличиваем нагрузку на центральный процессор и оперативную память, что ведет к снижению итоговой производительности.

    В общем, прямого и простого пути к увеличению производительности не существует. Везде приходится искать компромиссы.

    Скоростные характеристики жестких дисков

    Помимо объема, как правило, представляют интерес и скоростные характеристики накопителей. Из них можно выделить две основных: среднее время доступа и скорость линейной передачи данных .

    Время доступа (access time) - время с момента запроса небольшой порции данных (обращения к прерыванию BIOS) до момента их получения (возвращения из прерывания). Временем выполнения программы здесь можно пренебречь, в этом случае время доступа состоит из времени позиционирования (seek time), то есть нахождения нужной дорожки и среднего времени ожидания данных (latent time), т.е. времени на поворот диска, чтобы нужный сектор оказался под головкой чтения. Очевидно, что среднее время ожидания равно половине периода обращения диска: 5.56 мс при частоте вращения 5400 об/мин и 4.17 мс - при 7200 об/мин. Время позиционирования же складывается из времени необходимого на перемещение головки и времени для успокоения ее колебаний после перемещения. Так как требования к допустимой амплитуде колебаний при чтении и при записи отличаются, могут отличаться также средние времена доступа и позиционирования. К сожалению, не существует единой методики измерения этой величины, поэтому каждая фирма-производитель применяет собственную методику, выставляющую ее продукцию в наилучшем свете. Кроме того, для обозначения по сути одинаковых величин разные фирмы зачастую используют различные термины. Чаще в спецификациях приводится время позиционирования, т.к. оно меньше.

    Со скоростью линейной передачи данных тоже не все обстоит гладко. Во-первых, существует скорость передачи данных из кэш-памяти контроллера - величина, поддающаяся измерению и, как правило, наибольшая из всех скоростей обмена. Скорость обмена данными с пластинами обычно меньше. Кроме того, она зависит от номера дорожки, к концу диска эта скорость может снижаться в 2-3 раза по сравнению с тем, что наблюдается на первых дорожках. В спецификациях зачастую приводится максимальная мгновенная скорость чтения с пластин в бит/с. Тут можно только принимать или не принимать на веру слова изготовителя, т.к. измерить ее на накопителе, оснащенном кэш-памятью, нельзя. Поддается измерению максимальная установившаяся скорость обмена. "Максимальная" в данном случае означает, что она измеряется в той части диска, которая имеет наибольшее количество секторов на дорожку. Она определяется как отношение объема переданных данных ко времени. Естественно, во время включается как то, в течение которого головка летит над данными, так и то, в течение которого головка находится над зонами служебной информации, а также время перехода головки с дорожки на дорожку. Как правило, либо указывают максимальную величину этой скорости, либо строят график зависимости этой скорости от номера сектора (один такой график приведен в разделе "Геометрия жесткого диска", см. рис.3).

    Можно измерить скорость передачи данных при чтении, записи и верификации. В правильно сконструированном накопителе все эти три величины должны совпадать. Для оптимальности процесса обмена различные дорожки должны начинаться не с одного и того же места, а со сдвигом равным отношению времени перехода на 1 дорожку к периоду вращения. При этом первый сектор следующей дорожки должен оказываться под головкой как раз к моменту окончания позиционирования. Конечно, время перехода может быть различным для чтения и записи, но если вдруг переходной процесс не успеет закончиться к моменту прихода нужного сектора, то это приведет к падению скорости почти вдвое (при одной рабочей поверхности) из-за необходимости ожидать целый оборот. Думаю, производители такого не допускают, поэтому следует ожидать совпадения скорости чтения и записи. Что же касается скорости верификации, то ее целесообразно измерять, когда скорость обмена данными с пластинами превосходит скорость передачи данных через интерфейс, что может наблюдаться, например, при выборе неадекватного режима работы интерфейса. Верификация - это процесс чтения во внутреннюю память накопителя без передачи данных наружу.

    В качестве примера приведем профиль скоростей чтения, записи и верификации для диска с максимальной установившейся скоростью передачи данных, превышающей скорость передачи интерфейса (на самом деле, конечно, дело не в интерфейсе самого диска - UDMA100, а в интерфейсе IDE-контроллера на системной плате, к которой подключен накопитель - UDMA33).



    рис.5

    Для современных дисков время доступа составляет порядка 15 мс, а устоявшаяся скорость линейной передачи данных - порядка 30 Мбайт/с. Нетрудно заметить, что за время поиска можно было бы считать или записать почти полмегабайта информации. Однако, реально информация читается чаще всего либо покластерно, т.е. по 4 Кбайта, либо максимальными фрагментами, поддерживаемыми BIOS - 64 Кбайта. Кроме того, объем однократно считанного фрагмента информации никогда не превышает размера файла (точнее, суммарной длины занимаемых им кластеров), а средний размер файла, как правило, не превосходит нескольких килобайт. Поэтому определяющий вклад в производительность дисковой системы вносит время доступа, а линейная скорость передачи лишь очень незначительно влияет на время выполнения файловых операций. Даже при записи или чтении одного длинного файла в однозадачной системе реальная скорость обмена оказывается существенно, иногда в разы, ниже установившейся скорости накопителя.



    рис.6

    Время доступа определяется скоростью вращения диска, конструкцией механизма позиционирования головки, а также линейными размерами, на которые необходимо совершить перемещение, т. е. диаметром пластин. Установившаяся скорость обмена в основном зависит от плотности записи и скорости вращения. Вряд ли следует ожидать существенного увеличения скорости вращения пластин, поэтому в перспективе вряд ли можно надеяться на заметный прирост эксплуатационной производительности жестких дисков.

    Уменьшение времени доступа возможно в основном за счет уменьшения диаметра пластин, что делает возможным как увеличение скорости вращения, так и уменьшения времени позиционирования. Однако этот подход ведет к радикальному уменьшению емкости накопителя. И хотя первых жесткий диск имел пластины диаметром 24 дюйма, первый, применяемый в персональном компьютере - около 5 (формфактор корпуса 5.25"), а современные - около 3 (а скоростные накопители SCSI при формфакторе корпуса 3.5" имеют уменьшенные пластины), вряд ли в ближайшее время можно ожидать повального перехода на 2.5-дюймовые накопители. Скорее уж революцию во времени доступа следует связывать с переходом на твердотельные накопители.

    Наиболее эффективным средством повышения производительности дисковой системы является кэширование, т.е. хранение в оперативной памяти наиболее часто используемых данных с жесткого диска. Ведь для доступа к определенному байту, расположенному на диске, требуется около 15 мс, а к расположенному в оперативной памяти - порядка 0.1 мкс. Даже однокластерное (буфер 4 Кбайта) кэширование при построчном чтении текстового файла с длиной строки 80 символов приведет к уменьшению времени считывания в 50 раз. Увеличение объема буфера еще более ускорит этот процесс, поэтому, во-первых, сами накопители содержат буфер объемом, как правило, от 2 до 8 Мбайт, а во-вторых, кэширование производится на уровне ОС.

    Интерфейс

    В настоящее время для жестких дисков (не считая части накопителей для ноутбуков, носимой аппаратуры, а также внешних моделей) используются два параллельных интерфейса, разработанных в 80-х годах прошлого века: IDE (ATA) и SCSI.

    IDE более демократичен. Основная нагрузка в нем ложится на контроллер устройства. Первые его модификации работали в режиме программируемого ввода/вывода (PIO) и были ограничены скоростями от 3 до 16 Мбайт/с. Впрочем, внешние контроллеры часто еще сильнее "тормозились" шиной ISA. Реально даже на шине PCI от такого контроллер не удавалось добиться скорости обмена выше 8-9 Мбайт/с. Тогда был использован поддерживаемый PCI механизм прямого обмена с памятью (UDMA), в результате чего максимальная скорость выросла до 33, 66 или 100 Мбайт/с в зависимости от разновидности интерфейса (а компания Maxtor выпускает даже диски UDMA133).

    SCSI обладает как более широкими возможностями, так и более высокой ценой. К этому интерфейсу можно подключать не только дисковые накопители, но также ленточные накопители, сканеры, принтеры и т. д. Кроме того, он позволяет одновременно работать нескольким устройствам, что снижает нагрузку на центральный процессор. Диапазон скоростей, поддерживаемых SCSI простирается от 5 до 320 Мбайт/с. В перспективе планируется увеличение скорости обмена до 640 Мбайт/с.

    Последнее время IDE существенно потеснил SCSI. Особенно после введения режима UDMA, в результате чего сильно снизилась нагрузка на процессор, и исчезло основное преимущество SCSI перед IDE. Одновременно появление USB стало вытеснить SCSI из низкоскоростных устройств, таких как сканеры и принтеры.

    Дальнейшее увеличение скорости при использовании параллельных интерфейсов уже упирается в очень серьезные проблемы по синхронизации линий передачи данных, поэтому, как представляется, будущее за последовательными интерфейсами.

    В настоящее время активно идет разработка последовательного варианта интерфейса IDE - Serial ATA. К контроллеру каждый накопитель будет подключаться своим 7-жильным кабелем. Первый намеченный рубеж скорости - 150 Мбайт/с, на очереди - 300 Мбайт/с. Эти интерфейсы, несмотря на существенное аппаратное различие будут программно совместимы с существующим сейчас параллельным IDE.

    Определенные разработки намечены и для совершенствования интерфейса SCSI. Здесь также намечен переход на последовательный интерфейс, а также на существенное снижение стоимости вследствие сильной конкуренции со стороны SerialATA.

    Для накопителей на жестких дисках помимо рассмотренных могут применяться интерфейсы Compact Flash Type II - для 1-дюймового накопителя IBM MicroDrive, USB, IEEE1394 (FireWire) - для внешних устройств и Fibre Channel - для наиболее производительных серверов.

  • Проинсталлированы на HDD. Винчестер - самая важная вещь для Вас и вашей информации.
    Постоянно растет объем винчестеров, новые диски каждый год сменяют старые. По данным Dataquest, в 2001 году были заменены 130 миллионов HDD, в 2002 - уже 150 миллионов.

    История: в начале 70-х годов фирмой IBM был разработан первый накопитель на жестких магнитных дисках (14-дюймовый). Диск позволял записать 30 дорожек по 30 секторов в каждой из них (30/30) и мог хранить до 16 Кбайт информации. Вначале ему присвоили название 30/30. Но по аналогии с американскими автоматическими винтовками "Winchester", имеющими калибр 30/30, дисковые устройства с несъемными дисками (жесткие диски ) стали называться винчестерами . В 1973 году фирма IBM создала первый HDD с несколькими дисками емкостью 140Мб, который продавался по цене $8600.
    Развитие HDD-технологий можно разбить на пять этапов:

    • Первый (до 1979 года) - использование "классических" индуктивных головок записи/воспроизведения;
    • Второй этап (1979-1991гг.) - применение тонкопленочных головок;
    • Третий (1991-1995гг.) - применение магниторезисторных (MR, Magneto-Resistive) головок;
    • Четвертый (1995-2000гг.) - применение супермагниторезистивных головок (GMR, Giant Magneto-Resistive): уменьшение магнитного зазора в записывающей головке и повышение чувствительности головки чтения за счет использования материалов с аномально высоким коэфициэнтом магниточувствительности;
    • Пятый (с 2000 года) - появление моделей с новым типом магнитного покрытия - с антиферромагнитной связью (AFC) при сохранении параметров магнитных головок;

    Жесткий диск имеет восемь основных параметров:

    Кроме основных параметров, важны "Перегрузка от удара в рабочем/нерабочем состоянии (Operating/Nonoperating Shock), G " (параметр, характеризующий устойчивость винчестера к механическим воздействиям), "Рабочая температура (Operating temperature),°C " (параметр, по которому можно судить о "жаростойкости" винчестера), Потребляемая мощность (Power Management), Вт (параметр, о том, насколько винчестер будет нагреваться), срок гарантии (от 6 месяцев до 5 лет) и фирма-производитель:

    Главные производители :

    [ Fujitsu ] [ Hitachi Inc. ] [ IBM ] [ Iomega * ] [ LaCie ] [ Matsushita * ] [ Maxtor Corporation ] [ QArchos * ] [ Quantum Corporation * ] [ Samsung ] [ Seagate Technology, Inc. ] [ SimpleTech ] [ Storage Technology Corporation ] [ Toshiba * ] [ Western Digital Corporation ]
    * - компанией Maxtor куплен винчестерный бизнес у Quantum и Matsushita ; Toshiba специализируется на винчестерах для цифровых плееров и 1,8-дюймовых; Iomega разрабатывает только внешние винчестеры; QArchos - карманные винчестеры; SimpleTech - флэш-винчестеры.
    ** - многие фирмы-разработчики винчестеров имеют несколько заводов-изготовителей по выпуску винчестеров разных марок

    · Разделение винчестера . Винчестер "физический" делится на один или несколько "логических" (т.е. содержит logical область). Вы можете создать любую конфигурацию разделов. Разделы могут быть четырех типов:

    1. Master Boot Record (главная загрузочная запись, MBR) . Здесь (в первом блоке HDD) хранится информация о разбиении диска и там можно разместить Boot Manager ;
    2. Primary (основной) . Это раздел, в котором всегда устанавливается операционная система . Многие "простые" (напр. DOS, Windows) инсталлируются только в primary;
    3. Extended (расширенный) . Это раздел для программ пользователя, к которому имеет доступ. Extended может использоваться целиком (как единый логический диск) или же разбит на несколько логических дисков (см. рис);
    4. Other (иной) раздел. Это Extended -раздел, выделяемое для установки другой OS , отличной от установленной в primary ;
    При разделении HDD всегда получается только один primary -раздел и один или несколько extended -разделов. Размер любого HDD-раздела имеет верхний предел. Максимальное число логических дисков для файловых систем FATxx составляет 26 штук. Пример разделения HDD на три раздела:


    Миллионы "чайников" потеряли свои данные, делая резервное копирование с "диска C:\" на соседний диск "D:\", ибо часто это один винчестер! Раньше разделение винчестера делали обязательно из-за ограничений фатовой системы и , теперь - для удобства (раз), нескольких операционок (два) и той же (три). Выделяемый объем зависит от вида операционной системы и количества программ , которые Вы используете.

    · Режимы pаботы IDE-винчестеров . Из-за более низкой стоимости IDE -дисков (по сравнению с SCSI -дисками и учитывая неразвитость USB -дисков) фактически они и преобладают. Hа одном IDE -кабеле могут pаботать до двух IDE -устpойств: Master (MA) - основной (пеpвый) и Slave (SL) - дополнительный (втоpой). Т.е. max - 4 IDE -HDD. Установка Master/Slave производится HDD-Jumper -ами. Если устpойство на кабеле одно, его устанавливают в pежим Master, однако у некотоpых HDD есть отдельный pежим Single . Напрямую не допускается pабота устpойства в pежиме Slave пpи отсутствии Master-устpойства, но некоторые новые модели HDD могут так pаботать в этом pежиме при условии соответствующего Bios -а или дpайвеpа . Это необходимо, т.к. многие дpайвеpы , обнаpужив отсутствие Master-устpойства, пpекpащают дальнейшую работу с данным контpоллеpом. Существует pежим, в котоpом HDD само устанавливается в pежим Master/Slave в зависимости от типа pазъема на интеpфейсном кабеле - Cable Select (CS, CSel, выбоp по pазъему кабеля). Два примера установки жестких дисков:

    primary secondary
    master slave master slave
    HDD --- CD ---
    primary secondary
    master slave master slave
    HDD 1 HDD 2 CD-RW/DVD CD

    Есть вариант и увеличения максимального количества подключенных устройств IDE-устройств (стандарт - не более 4-х штук). Для "обмана" нужен свободный PCI -слот m/b . По внешнему виду это карта с двумя (или четырьмя) IDE-контроллерами , установленная в PCI-разъем материнской платы . Для активации контроллера необходимо настройка Bios -a карты.

    Анатомия винчестера ... HDD состоит из геpмоблока и платы электpоники. В геpмоблоке pазмещены ("запечатаны") все механические части и пpедусилитель, на плате - почти вся упpавляющая электpоника. В дальней от pазъемов части геpмоблока установлен шпиндель с одним или несколькими дисками. Магнитные диски представляет собой пластины из алюминия, керамики или стекла, на которые нанесен тонкий слой высококачественного ферромагнетика - на основе окиси хpома (ранее - окиси железа и бариевых ферритов). Количество дисков - одного до трех (как правило), но в некоторых моделях достигает 10. Под дисками находится двигатель, создающий вращающееся магнитное поле. Ближе к pазъемам, с левой или пpавой стоpоны от шпинделя, находится повоpотный позиционеp (head positioner ) - с одной стоpоны - несущие магнитных головок, а с дpугой - коpоткий и более массивный хвостовик с обмоткой электpомагнитного пpивода. Встречаются поворотные и линейные позиционеры.
    Внутри геpмоблока - обычный воздух (а не вакуум), очищенный при изготовлении с помощью специальных фильтров. Пpи вpащении дисков создается сильный поток воздуха, котоpый циpкулиpует по пеpиметpу геpмоблока и постоянно очищается фильтpом, установленным на одной из его стоpон. Данные с поверхности диска считываются непосредственно магнитной головкой. При записи головка создает магнитное поле, намагничивая тем самым участок диска - при считывании же, наоборот, поле диска возбуждает сигнал в головке. Современные приводы содержат несколько магнитных головок - как правило, по одной на каждую сторону каждого диска.
    Т.к. магнитные головки винчестера работают с очень большей скоростью, необходим очень тесный контакт между ними и поверхностью носителя. При вращении дисков внутри корпуса возникает воздушный поток, который и приподнимает головки над поверхностью - головки "посадили" на воздушную подушку. Но эта конструкция требует парковки головок - перемещения их за пределы рабочей области диска (landing zone ) во время выключения компьютера. Т.е. когда винчестер выключается, диски останавливаются, исчезает магнитный поток и головки "падают" на поверхность. Поэтому головки нужно отвести в нерабочую область. Управляет всем этим позиционер.


    Плата электpоники - съемная, подключается к геpмоблоку чеpез один-два pазъема pазличной констpукции. Hа плате pасположены основной пpоцессоp винчестеpа, ПЗУ с пpогpаммой, pабочее ОЗУ, котоpое обычно используется и в качестве дискового буфеpа, цифpовой сигнальный пpоцессоp (DSP) для подготовки записываемых и обpаботки считанных сигналов и интеpфейсная логика. Hа одних винчестеpах пpогpамма пpоцессоpа полностью хpанится в ПЗУ, на дpугих опpеделенная ее часть записана в служебной области диска. Hа диске также записаны паpаметpы HDD (производитель, модель, сеpийный номеp и т.п.). Hекотоpые винчестеpы хpанят эту инфоpмацию в электpически pепpогpаммиpуемом ПЗУ (EEPROM) . Многие винчестеpы имеют на плате электpоники специальный технологический интеpфейс с pазъемом, чеpез котоpый пpи помощи стендового обоpудования можно выполнять pазличные сеpвисные опеpации с накопителем - тестиpование, фоpматиpование, пеpеназначение дефектных участков и т.п.
    Всю информацию, хранящуюся на диске, условно делят на служебную и пользовательскую . Первая обеспечивает нормальную работу и изначально присутствует в любом HDD - ее записывает завод-изготовитель.
    Каждый HDD разделен на зоны (notches ), в каждую из которых входит обычно от 20 до 30 цилиндров с одинаковым количеством секторов. Секторов может умещаться от 17 до 150 (как правило) на одной дорожке. Их нумерация начинается с 1, тогда как нумерация головок и цилиндров начинается с 0. Количество секторов на дорожке не равное. Чем дальше дорожка от центра, тем больше число секторов на диске
    Т.к. технология производства винчестеров пока не позволяет избавиться от битых секторов на 100%, в каждом винчестере существует таблица перераспределения запорченных секторов (участок дорожки). При каждом включении HDD считывает таблицу и просто "не замечает" битых частей. Но в процессе эксплуатации появляются новые bad-секторы - те, которые не помечены в заводской таблице. Обращаясь к такому сектору, магнитная головка многократно повторяет попытку чтения или записи, при этом возможно разрушение "здоровой" поверхности диска. Это влечет за собой дальнейшее "размножение" запорченных секторов. Таким образом винт постепенно приходит в негодность. Во многих винчестерах есть функция autoremap . Она предназначена для замены сбойных секторов на нормальные из резервной области на аппаратном уровне. Однако она не всегда срабатывает. Но можно прогнать дисковую утилиту (напр. HDDSpeed в режиме теста записи) - после этого bad-блоки пропадают (срабатывает autoremap).
    Все диски на заводе проходят первичную разметку (низкоуровневую, Low Level Formatting ) на специальном высокоточном технологическом стенде. При разметке на диски записываются служебные метки (сервометки), а также формируются дорожки и секторы. Записываются их префиксы и суффиксы. Высокоуровневое форматирование делает пользователь при помощи утилиты FORMAT. В каждый раздел диска записывается VBS (volume boot sector - загрузочный сектор тома), FAT , корневой каталог (root directory) , проверяется диск на наличие ошибок.
    Есть система звукоподавления (Sound Barrier Technology ), которая обеспечивает низкий уровень шума во время работы диска (напр. разработанная Seagate SBT-технология).
    В винчестерах последнего поколения используются технологии PRML (Partial Response, Maximum Likelihood - максимальное правдоподобие при неполном отклике) и S.M.A.R.T. (Self Monitoring Analysis and Report Technology - технология самостоятельного следящего анализа и отчетности). Для пользователя существует много дисковых утилит . Пример - DFT (Drive Fitness Test) и IBM Feature Tool . Обе - freeware . Первая из них диагностирует жесткий диск, позволяет просматривать параметры S.M.A.R.T. а также осуществлять low-level format, вторая - управлять работой кэша, изменять акустические характеристики и режим UDMA.

    · Геометрия диска или Normal, LBA, Large . Бывший классический способ адресации секторов - CHS - по номеру цилиндра, головки и сектора (Cylinder/Head/Sector ). Разработчики первого ПК подложили всем "мину", строго определив количество разрядов, с помощью которых адресовались данные. Под номер цилиндра было отведено 16 разрядов, под номер головки - 4 и сектора - 8, что давало максимальную емкость винчестера в 128 Гб. Но Bios с самого начала ограничивал количество секторов до 63, а цилиндров - до 1024, этому же примеру следовал и DOS, что в итоге дало максимум - 528Мб. Когда же появились жесткие диски емкостью более 528Мб, ПК перестали "видеть" диск полностью. Производители Bios срочно выпустили поддержку режима LBA (Logical Block Addressing) . Они использовали сквозную нумерация секторов и адрес CHS преобразуется в одно линейное 28-битовое число абсолютного номеpа сектоpа (для DOS по-пpежнему остается огpаничение в 8,4Гб), используемое для нумерации секторов (LBA-адрес) и пpеобpазуемого винчестеpом. Для pаботы в pежиме LBA необходима поддеpжка винчестеpа, Bios -а, дpайвеpа . Схема адресации с использованием LBA была впервые применена фирмой Western Digital в конце 1993 года.
    Режим Large (Large Block Adressing) предназначен для винчестеров емкостью до 1Гб, не поддерживающих режима LBA. В Large количество логических головок увеличивается до 32, а количество логических цилиндров уменьшается вдвое. При этом обращения к логическим головкам 0..F транслируются в четные физические цилиндры, а обращения к головкам 10..1F - в нечетные. Винчестер, размеченный в режиме LBA, несовместим с режимом Large, и наоборот. Режим Normal заставлял Bios работать подобно старым версиям без трансляции.
    Но сегодня это все в прошлом (с нынешними Гб-ными HDD). Те параметры диска, которые Вы видите в разделе SETUP Standart CMOS Setup , как правило, ничего общего не имеют с реальными параметрами диска. HDD ныне работают напрямую (через драйвера).

    · Кластер - минимальный размер места на HDD, выделяемый файловой системой для хранения одного файла. Проще: кластер - ячейка размещения данных. Все доступное пространство винчестера разделено на разделы - от одного до множества. Разделы делятся на кластеры, причем каждый кластер может или быть незанятым (доступным для использования файлом) или дефектным (непригодным для использования). На одном жестком диске может быть много разделов (диск С, диск D, диск E, диск F, диск G, диск H, диск I, диск J, диск K, etc.). За основание системы исчисления размеров кластеров принят 512-байтный сектор диска. Кластер должен иметь размер, равный основанию (512 байт), умноженному на 2 в степени n. Размер кластера определяется автоматически, в зависимости от объема созданного раздела и/или фатовой системы. Исключение - только системный раздел: если он меньше 2048Мб, размер кластера всегда 512 байт. 16-разрядная FAT может поддерживать только 65.526 кластеров.
    Влияние размера кластера на потери - эффективность использования дискового пространства - можно оценить по формуле:

    Eff = [ Size / (Size + Overhang) ] x 100%
    где:
    - Eff - эффективность использования дискового пространства, выраженная в процентах от 0 до 100;
    - Size - суммарный размер всех файлов в накопителе;
    - Overhang - суммарная остаточная избыточность кластеров.
    Сумма величин Size и Overhang дает общий объем кластеров, занятых всеми файлами в накопителе. Чем выше отношение, тем более эффективно используется дисковое пространство. Обычное Eff составляет от 51% до 98%. Например, для раздела FAT-a в 1Гб с 10.000 файлов потери составят 160 Мб!

    Размер раздела HDD Размер в FAT16 Средние потери Размер в NTFS
    менее 127 Mб 2 Kб 1,00-1,75 Kб 512 байт
    127 Mб - 255 Mб 4 Kб 2,00-3,75 Kб 512 байт
    256 Mб - 511 Mб 8 Kб 4,00-7,75 Kб 512 байт
    512 Mб - 1023 Mб 16 Kб 8,00-15,75 Kб 1Kб
    1024 Mб - 2047 Mб 32 Kб 16,00-31,75 Kб 2K
    2048 Mб - 4095 Mб 64 Kб 16,00-31,75 Kб 4K
    4096 Mб - 8191Mб 8K
    8192 Mб - 16383 Mб 16K
    16384 Mб - 32767Mб 32K
    от 32768 Mб 64K

    Грубо можно считать, что каждый файл занимает свой последний кластеp пpимеpно наполовину - пpи этом Ваши потеpи (места на HDD) будут pавны количеству файлов, умноженному на половину pазмеpа кластеpа. Способы боpьбы с потеpями пpостpанства:
    - хpанение больших набоpов pедко используемых файлов в виде аpхивов;
    - pазбиение винчестеpа на диски.
    Есть универсальный метод для любых Windows (кроме встроенных утилит). Создаете (или берете готовый) очень маленький файлик размером 1-500 байт. Правая кнопка мыши - Properties . Смотрите на два пункта: Size и Size on disk . Size - размер файлик реально имеет. Size on disk будет (например) 4096 байт, что соответствует настоящему размеру кластера, т.е. 4Kб. Т.е. при кластере 32Kb файл с информацией в 1 байт займет на диске 32Kb.
    Размер кластера может выбрать и пользователь (вручную при форматировании). Делается это так: "format d: /A:size", где size это размер кластера в байтах. Но существуют правила, которых следует придерживаться: размер кластера должен быть кратен размеру физического сектора, то есть 512 байтам в подавляющем большинстве случаев (во-первых); есть ограничения по количеству кластеров на разделе (во-вторых).

    "... Каждой твари по hardware! ...

    RAID-массивы (Redundant Array of Inexpensive Disks, избыточный набоp недорогих дисков) . Raid - способ оpганизации больших хpанилищ инфоpмации, увеличения скоpости обмена и надежности хpанения данных. RAID-система пpедставляет собой гpуппу из нескольких обычных (недоpогих) винчестеpов, pаботающих под упpавлением пpостого контpоллеpа и видимую извне, как одно устpойство суммарной емкости и высокой скоpости или надежности. Технология RAID базируется на трех основных методах:

    1. Поочередное размещение данных по дискам с определенной циклической очередностью. Поочередное размещение предполагает запись первого сегмента данных на первый диск, второго - на второй и т. д. В этом случае производительность массива повышается, поскольку компьютер начинает записывать очередной сегмент данных (на следующий диск) до того, как закончил запись предыдущего сегмента. Дальнейшее повышение производительности дисковых систем обеспечивается за счет подключения разных групп дисков к отдельным контроллерам;
    2. Зеркальное отражение дисков . Резервное копирование данных (ежедневно или несколько раз в неделю) не обеспечивает быстрое восстановление информации и оперативную защиту новых данных, созданных после последнего сеанса копирования. Эти задачи решаются с помощью зеркального отражения дисков, при котором все, что записывается на первый диск, дублируется на второй. В случае поломки первого диска (или записи данных в испорченный сектор его дискового пространства), они будут считаны с второго ("зеркального") диска;
    3. Вычисление контрольных сумм . Контроль четности работает так: все информационные биты в байте складываются по модулю 2 и если число единиц в нем четное - контрольный бит устанавливается в ноль, а если нечетное - в единицу. При считывании данных информационные разряды снова суммируются и полученный результат сравнивается со значением контрольного бита. Если они совпадают - данные верны, а если нет - значения одного или нескольких разрядов ошибочны;
    Компании (Adaptec, CMD и другие) выпускают специальные контроллеры, предназначенные для организации массивов RAID.
    Такой массив можно реализовать и на основе обычного контроллера SCSI или Fibre Channel - с помощью программы, распределяющей сегменты данных по дискам. Такое программное решение дешевле, чем основанное на специальном контроллере, но оно (как правило) поддерживает только RAID-уровни 0 и 1.

    · История ... Место рождения RAID-технологии - Калифорнийский университет, г.Беркли, USA. В 1987г. его специалисты (Петтерсон, Гибсон и Катц) опубликовали статью с описанием принципов объединения многочисленных дисковых накопителей. Первоначально было определено шесть уровней (levels ) RAID 0-5, но по мере развития технологии появились дополнительные уровни (еще пять).

    · Raid 0: распределение данных (data striping) . Информация разбивается на куски (фиксированные объемы данных, обычно именуемые блоками) и эти куски записываются на диски и считываются с них в параллель. Два дисковых блока по 512 байт образуют сегмент.

    Raid 0 не является отказоустойчивой, но этот RAID-уровень используется гораздо чаще других уровней RAID. Преимущества Raid 0 (с точки зрения производительности):

    • повышается пропускная способность последовательного ввода/вывода за счет одновременной загрузки нескольких интерфейсов;
    • снижается латентность случайного доступа - несколько запросов к различным небольшим сегментам информации могут выполнятся одновременно;
    · Raid 1: Зеркальные диски (disk mirroring) . Копия каждого блока информации хранится отдельно. Обычно каждый (используемый) диск имеет "двойника", который хранит точную копию этого диска. Если происходит сбой одного из основных дисков, он замещается своим "двойником". Производительность улучшают, настраивая систему так, чтобы для чтения информации использовался тот "двойник", головка которого расположена ближе к требуемому блоку.
    Диск 1 Диск 2 Диск 3 Диск 4 Диск 5
    Сегмент 1 Сегмент 1 Сегмент 2 Сегмент 2 ---
    Сегмент 3 Сегмент 3 Сегмент 4 Сегмент 4 ---
    данные X копия диска 1 данные Y копия диска 3 свободный

    Один из наиболее дорогостоящих уровней, т.к. все диски дублируются и при каждой записи информация записывается еще и на проверочный диск. Часто для нормальной работы RAID 1-го уровня требуются HDD одинаковой емкости, выпущенные одним и тем же производителем. К недостаткам Raid 1 относится самый высокая избыточность, а при программной реализации - проблемы с "горячей" заменой вышедшего из строя HDD.

    · Raid 2: матрица с поразрядным расслоением . В этой технологии предусмотрена защита данных с помощью корректирующей ошибки кода Хэминга. Записываемые данные распределяются по нескольким дискам, а затем контрольные суммы ECC (Error-Correction Code) записываются на отдельный диск или на несколько отдельных дисков. Коммерческие реализации RAID 2-го уровня практически отсутствуют.

    · Raid 3: аппаратное обнаружение ошибок и четность . Данные распределяются по информационным дискам и для каждой “полосы” данных (совокупности сегментов данных, расположенных в одних и тех же секторах на разных физических дисках) определяется контрольная сумма (или код четности), которая записывается на отдельный диск.

    Диск 1 Диск 2 Диск 3 Диск 4 Диск 5
    Байт 1 Байт 2 Байт 3 Байт 4 Байт четности
    Байт 5 Байт 6 Байт 7 Байт 8 Байт четности
    данные данные данные данные информация четности

    RAID 3-го уровня довольно сложен и реализовывается только аппаратным способом. Как минимум нужны три диска.

    · Raid 4: внутригрупповой параллелизм . В отличии от Raid 3 происходит поочередное распределение не коротких сегментов данных, а информационных блоков значительного размера. Это дает возможность выполнять несколько разных запросов на чтение одновременно. Т.к. вся контрольная информация сосредоточена на одном (последнем) диске, данный массив не может осуществлять несколько операций записи одновременно. Как минимум нужны три диска. Raid 4 встречаются крайне редко.

    · Raid 5: четность вращения для распараллеливания записей . На дисках системы RAID уровня 5 поочередно размещаются большие блоки данных, но в отличие от Raid 4 контрольная информация распределяется по всем дискам массива. Для первой “полосы” сегментов данных код четности может быть записан на последнем диске массива, для второй - на предпоследнем и т. д. Это позволяет выполнять несколько операций записи одновременно.

    Диск 1 Диск 2 Диск 3 Диск 4 Диск 5
    Сегмент четности Сегмент 1 Сегмент 2 Сегмент 3 Сегмент 4
    Сегмент 5 Сегмент четности Сегмент 6 Сегмент 7 Сегмент 8
    Сегмент 9 Сегмент 10 Сегмент четности Сегмент 11 Сегмент 12

    Один из наиболее часто применяемых на практике и самый сложный из первых шести уровней. Как минимум нужны три диска.

    · Raid 6: Двумерная четность . это расширенный вариант RAID-уровня 5, в котором предусмотрен двойной контроль четности хранимой информации для обеспечения большей надежности. Только для хранения контрольной информации требуется два HDD. RAID 6-го уровня разработан для критически важных приложений и имеет очень низкую производительность записи в связи с необходимостью расчета дополнительных контрольных сумм.

    · Raid 7 . Уникальная технология компании Storage Computer Corporation. Предполагает асинхронность работы своих компонентов (включая канал связи с хост-машиной) и независимость управления ими. В массивах используется встроенная операционная система реального времени для кэширования данных и расчета контрольной информации. Причем эта самая информация передается по специальной Х-шине. Данные распределяются по обычным дискам, а контрольная информация хранится на отдельном диске. С целью повышения производительности операции чтения и записи централизованно кэшируются. Очень высокая производительность и надежность хранения данных, однако высока и цена системы, оборудованной таким массивом. RAID 7 является торговой маркой.

    · Raid 10/1+0 . Массивы этого уровня представляют собой сочетание принципов, применяемых в массивах нулевого и первого уровня. То есть, "стриппинг" в сочетании с зеркалированием. Т.е. сначала создаются два массива RAID 0 и затем зеркалируются, что требует, как минимум, четыре диска в минимальной конфигурации - очень дорого. Цена такого массива начинает быстро расти, когда начинается расширение.

    · Raid 50 . Массив, сочетающий в себе принципы массивов нулевого и пятого уровня. Т.е. если например контроллер получает команду записать на HDD 256Кб данных, то эти данные по принципам RAID 0 разбиваются на два куска по 128Кб и затем каждый из них по принципам уже массивов пятого уровня разбивается на кусочки по 32Кб и записываются физически одновременно на все диски массива. Цель применения - повышение скорости работы дисковой подсистемы при сохранении высочайшей надежности хранения данных.

    · Raid 53 . Правильнее назвать RAID-уровнем 03, так как в нем комбинируются архитектуры RAID уровней 0 и 3. Для реализации такого дискового массива нужно не менее пяти HDD. В этой конфигурации система RAID уровня 53 поочередно записывает небольшие сегменты данных на первые два HDD, а информацию о четности - на третий HDD. Последние два диска (четвертый и пятый) содержат те же самые данные, поочередно записанные большими блоками без контроля четности, как это делается в системе RAID уровня 0.

    · Если винчестер умер ... Никакой HDD не вечен и Вы должны быть готовы к его смерти. Делать резервные копии на CD-R , стриммер, магнитооптику и т.п. Итак, это случилось. Самые частые причины смерти:

    Если HDD еще гарантийный - меняете на новый (с доплатой), если гарантия закончилась - отдайте старьевщикам или выбросьте. Если архивов данных не делали, а информация очень важна - попытайтесь восстановить. Количество информации (файлов) на HDD огромно, а их физическое уничтожение довольно длительно. Т.е. информация почти всегда еще жива, но не доступна. И восстанавливать надо не саму информацию, а только доступ к ней. Обращаю внимание, что как правило восстановление не лечит HDD, а позволяет скопировать имеющиеся данные на другой носитель.
    Не оставляйте чужим свою информацию! В 2002 году студенты Массачусетского института провели эксперимент - купили несколько сотен "битых" HDD. Только 60% HDD были отформатированы, а на 17,7% даже вообще не удалялась информация. 81,6% винчестеров находились в рабочем состоянии. Т.к. штатная команда Windows -форматирования format не производит перезаписи блоков (не пользуйтесь этим барахлом), а "чайники" по глупости держат информацию в папке "Мои документы" (два) - все данные легко восстановимы. В частности были извлечены корпоративная финансовая информация, номера кредиток, персональные медицинские данные и т.п.
    Для восстановления потребуются: загрузочная дискета (защищённая от записи), утилиты FDisk и Format (из комплекта установленной ), утилиты DiskEdit и UnErase (из Norton Utilities ), программа NC . И все легче, когда диск определяется Bios -ом и физически исправен.
    Если Вы не уверены в своих знаниях и/или не исключаете возможной ошибки в своих действиях, не предпринимайте сами никаких действий. Даже незначительная неточность в Ваших действиях может значительно осложнить или даже сделать невозможным дальнейшее восстановление информации. Обратитесь за помощью к спецам.

    Несколько определений, поясняющих принцип хранения информации на диске c FATxx:

    "...Диски свежие, не очищенные..."

    Обозначения любого винчестеpа легко pасшифpовать - они обычно буквенно-цифpовые и стpоятся по схожим пpинципам: вначале - обозначение пpоизводителя и модели, затем объем в миллионах байтов, и в конце - суффиксы, уточняющие исполнение, конкpетные хаpактеpистики и т.п. Hапpимеp, суффикс "A" указывает на интеpфейс ATA (IDE), а "S" - на SCSI. Суффикс "V" у многих моделей обозначает удешевленную (Value) модель, за исключением винчестеpов Micropolis, у котоpых суффикс "AV" обозначает Audio/Video - оpиентацию на pавномеpный обмен данными пpи чтении/записи. Примеры:

    ******* Western Digital ******* WD A C 2 635 - 0 0 F 1 2 3 4 5 6 7 8 1 - Western Digital 2 - интеpфейс: A - IDE, S - SCSI, C - PCMCIA-IDE 3 - модель: C - Caviar, P - Piranha, L - Lite, U - Ultralite 4 - количество физических дисков 5 - емкость в миллионах байт 6 - светодиодный индикатоp: 0 - нет, 1 - кpасный, 2 - зеленый 7 - пеpедняя панель: 0 - нет, 1 - чеpная, 2 - сеpая 8 - объем буфеpа: S - 8 кб, M - 32 кб, F - 64 кб, H - 128 кб. Для восстановленных винчестеpов после даты изготовления указывается место восстановления: E - Евpопа, S - Сингапуp. ******* Maxtor ******* Mxt 7 850 AV 1 2 3 4 1 - Maxtor 2 - сеpия (7xxx) 3 - емкость в миллионах байт 4 - суффиксы: A - ATA (IDE), S - SCSI, V - Value ******* Seagate ******* ST 5 1080 A PR -0 1 2 3 4 5 6 1 - Seagate Technology 2 - коpпус: 1 - 3.5" высотой 41 мм 2 - 5.25" высотой 41 мм 3 - 3.5" высотой 25 мм или 5.7" глубиной 146 мм 4 - 5.25" высотой 82 мм 5 - 3.5" высотой 25 мм или 5" глубиной 127 мм 6 - 9" 7 - 1.8" 8 - 8" 9 - 2.5" высотой 19 мм или 12.5 мм
    Вместо итогов обращаю Ваше внимание на ряд важных факторов:

    • на чрезвычайную чувствительность жестких дисков к различного рода встряскам, толчкам и ударам;
    • что винчестеры одной марки, но из разных стран резко отличаются по цене и качеству;
    • что не стоит покупать винчестеров "Made in China";
    • что если гарантия всего 6 месяцев, то эти винчестеры где-то долго лежали;
    Личное мнение ... жесткие диски, применяемые в обычных ПК, развиваются только в направлении повышения емкости одновременно со снижением стоимости. Скорость и надежность, к сожалению, отходят на второй план. В мире есть хорошие HDD, но предлагаемым на российском рынке "обывательским" винчестерам до них страшно далеко…

    © 2024 beasthackerz.ru - Браузеры. Аудио. Жесткий диск. Программы. Локальная сеть. Windows