Rev 981 | Blame | Compare with Previous | Last modification | View Log | Download | RSS feed | ?url?
Формат файла UDI ( Ultra Disk Image )
Версия 1.0 (Alex Makeev, Редакция 24 марта 2002 г.)
Версия 2 (deathsoft, согласовано с Alex Makeev)
--------------------------------------------------------------------------------
Формат файла UDI:
Offset Length Comment
---------- ------ ----------------------------------------------------
0x00000000 0x0004 Идентификатор "UDI!", если идентификатор
записан маленькими буквами ("udi!"), то
применено сжатие данных, алгоритм сжатия
пока не определен, но вероятно будет аналогичен
TELEDISK'у
Упаковываются данные, начиная с образа первой
дорожки, т.е. сразу после основного
(и дополнительных) заголовка
0x00000004 0x0004 Размер файла после распаковки без учета CRC
(если файл не упакован, то просто размер файла - 4)
0x00000008 0x0001 Версия формата, для UDI 1.0 содержит #00,
для UDI 2 содержит #01
0x00000009 0x0001 Максимально доступный цилиндр (0x00...0xFF),
итого макс. число цилиндров = 256
0x0000000A 0x0001 Максимальный номер поверхности диска:
0x01 - DoubleSided, 0x00 - SingleSided
(0x02..0xFF -reserved!)
0x0000000B 0x0001 В этой версии не используется поэтому всегда 0x00
0x0000000C 0x0004 EXTHDL - Длина дополнительного заголовка
(всегда 0, в противном случае структура данных
может быть другая...)
Далее следуют образы каждой из дорожек, в порядке размещения на диске
(Trk00, Side00; Trk00, Side01; Trk01, Side00; Trk01, Side01; ...):
0x00000010 0xXXXX Образ дорожки см. ниже...
0xXXXXXXXX 0xXXXX Образ следующей дорожки
0xXXXXXXXX 0xXXXX Образ следующей дорожки
...
...
0xXXXXXXXX 0x0004 CRC файла (для версии 1.0 CRC_UDI, алгоритм см. приложение 1)
(для версии 2 CRC32 (правильный), алгоритм см. приложение 2)
Образ дорожки:
Offset Length Comment
---------- ------ ----------------------------------------------------
0x00000000 0x0001 Определяет формат дорожки:
0x00 - Decoded MFM (например TR-DOS-ный формат)
0x01 - аналогичен 0x00 но с поддержкой областей запись/чтение
в которые дает ошибки
0x02 - RAW MFM (биты в том виде в котором они читаются с дискеты без
декодирования контроллером). Дорожка DD дискеты содержит
~50000бит
другие значения форматов пока запрещены!
(т.к. еще не известно сколько доп. инфы
нужно хранить)
***Для формата дорожки 0x00 (Decoded MFM):
0x00000001 0x0002 tlen - Длина дорожки в байтах (типичная длина
дорожки 6250 байт)
ВНИМАНИЕ! Для MFM DoubleDensity (ВГ93) крайне
не рекомендуется задавать длину
дорожки, сильно отличающуюся от 6250 байт!!!
0x00000003 tlen Побайтовый образ дорожки - включая пробелы,
синхропробелы, синхроимпульсы (маркеры MFM),
адресные маркеры, заголовки, массивы данных, etc.
Другими словами здесь записаны те байты,
которые будут выданы ВГ93 по команде "чтение дорожки"
0x0003+tlen сtlen Битовый массив, описывающий тип CLK для каждого
байта образа дорожки (см. приложение 1);
Один бит соответствует одному байту образа дорожки:
0 - записано с обычным CLK (обычные данные)
1 - записано с маркерным CLK (метки #A1 и #C2)
Например имеем последовательность байт:
{ 0xA1,0xA1,0x00,0xA1,0xFE,0x00,0x00,0x01 }
где 0xA1 - MFM маркеры
тогда байт битового массива будет равен 0x0B.
Для типичной длины дорожки 6250 байт:
ctlen = tlen/8 + ((tlen-(tlen/8)*8)? 1:0) = 782 байт
Лишние биты - незначащие, их рекомендуется
заполнять нулями.
Программы, создающие/записывающие UDI файлы обязаны
обеспечивать присутствие реальных CRC кодов для
массивов данных и адресных массивов по алгоритму
CRC с полиномом F = X^16 + X^12 + X^5 + 1
Симуляцию ошибочного CRC синтетическим способом,
при конвертировании из файлов FDI, рекомендуется
производить с помощью выражения C = RC^0xFFFF,
где C - crc которую нужно записать, RC - crc
синтетическая, корректно вычисленная по
алгоритму CRC... это чтоб накладок не выходило,
запишешь bad CRC равный нулю или еще чему-нибудь,
глядишь, а он и впрямь окажется равным нулю -
получается реально bad'овый CRC будет определятся
как безошибочный
***Для формата дорожки 0x01 (Decoded MFM со сбойными участками):
(пока не реализовано)
***Для формата дорожки 0x02 (RAW MFM):
(пока не реализовано)
***Для других форматов дорожки:
#0001+tlen 4 MTIL - Длина блока, описывающего дорожку
#0005+tlen MTIL Блок описывающий формат дорожки
--------------------------------------------------------------------------------
Почему типичная длина дорожки 6250 байт?
Изучив процедуру форматирования у TR-DOS и утилиты FUT я выяснил, что
реальная длина (она естественно зависит от аппаратуры) должна лежать в
диапазоне 6208...6464 байт, для других длин произойдет ошибка. Однако,
просчитав timing, учитывая что на один бит информации уходит 4мкс - получаем
время 32мкс на байт; время одного полного оборота диска известно - 200000 мкс;
далее просто считаем длину дорожки: 200000 / 32 = 6250 байт.
Вниманию разработчикам эмуляторов: большая просьба - своих корректив в
формат UDI без согласования с автором не вносить.
-------------------------------------------------------------------------------
ПРИЛОЖЕНИЕ 1
Алгоритм вычисления CRC_UDI для файла UDI(версии 1.0)
{deathsoft, реально это не алгоритм CRC32, а ошибочная реализация CRC32 дающая совершенно другие результаты }
Начальное значение CRC = 0xFFFFFFFF (-1l).
Функция обновления CRC32 для одного байта Symbol:
long CalcCRC32(long CRC, unsigned char Symbol)
{
long temp;
CRC ^= -1l ^ Symbol;
for(int k = 8; k--;)
{ temp = -(CRC & 1), CRC >>= 1, CRC ^= 0xEDB88320ul & temp; }
CRC ^= -1l;
return CRC;
}
Эту функцию нужно вызвать для каждого байта из файла UDI (исключая последние
4 байта CRC).
Первый аргумент функции - текущая CRC, второй аргумент - байт данных,
результат - новая CRC.
-------------------------------------------------------------------------------
ПРИЛОЖЕНИЕ 2
Алгоритм вычисления CRC32 (UDI 2 и выше)
static uint32_t crc32(const void *data, unsigned len)
{
const uint8_t *d = (const uint8_t *)data;
uint32_t crc = 0xFFFFFFFF;
while(len--)
{
uint32_t byte = *d++;
crc ^= byte;
for(int j = 7; j >= 0; j--)
{
uint32_t mask = -(crc & 1);
crc = (crc >> 1) ^ (0xEDB88320 & mask);
}
}
return ~crc;
}
crc32("The quick brown fox jumps over the lazy dog") == 0x414FA339
-------------------------------------------------------------------------------