Skip to content

Commit

Permalink
Небольшое уточнение в раздел о расстоянии единственности
Browse files Browse the repository at this point in the history
  • Loading branch information
vlsergey committed Dec 25, 2013
1 parent 29158e3 commit 0481561
Showing 1 changed file with 8 additions and 3 deletions.
11 changes: 8 additions & 3 deletions unicity_distance.tex
Original file line number Diff line number Diff line change
Expand Up @@ -69,11 +69,16 @@ \section{Расстояние единственности}\label{section_unicit

\[ \rho _{en} \approx 1 - \frac{ 1{,}3 }{ \log _2 {26} } \approx 0{,}72.\]

Для русского текста с энтропией $H(M)$ примерно равной $3{,}01$ бит/символ\footnote{Следует отметить, что для английского текста значение $1{,}3$ представляет собой суммарную оценку для всего текста, в то время как оценка $3{,}01$ для русского текста получена Лебедевым и Гармашем из анализа \textbf{частот трёхбуквенных сочетаний} в отрывке текста Л. Н. Толстого <<Война и мир>> длиной в 30 тыс. символов. Соответствующая оценка для английского текста, также приведённая в работе Шеннона, примерно равна $3{,}0$} получаем:
Для русского текста с энтропией $H(M)$ примерно равной $3{,}01$ бит/символ~\cite{Lebedev:1958}\footnote{Следует отметить, что для английского текста значение $1{,}3$ представляет собой суммарную оценку для всего текста, в то время как оценка $3{,}01$ для русского текста получена Лебедевым и Гармашем из анализа \textbf{частот трёхбуквенных сочетаний} в отрывке текста Л. Н. Толстого <<Война и мир>> длиной в 30 тыс. символов. Соответствующая оценка для английского текста, также приведённая в работе Шеннона, примерно равна $3{,}0$} получаем:

\[ \rho _{ru} \approx 1 - \frac{ 3{,}0 }{ \log _2 {32} } \approx 0{,}40.\]

Однако, если предположить, что текст передаётся в формате простого текстового файла (plain text) в стандартной кодировке UTF-8 (один байт на английский символ и два -- на кириллицу), то значения избыточности становятся примерно равны $0{,}83$ для английского и $0{,}81$ для русского языков. Подставляя эти числа в выражение~\ref{eq:unicity_distance_simple_frac} для шифров DES и AES получаем таблицу \ref{table:unicity_distances}.
Однако, если предположить, что текст передаётся в формате простого текстового файла (plain text) в стандартной кодировке UTF-8 (один байт на английский символ и два -- на кириллицу), то значения избыточности становятся примерно равны $0{,}83$ для английского и $0{,}81$ для русского языков.

\[ \rho _{en, UTF-8} \approx 1 - \frac{ 1{,}3 }{ \log _2 {2^{8}} } \approx 0{,}83,\]
\[ \rho _{ru, UTF-8} \approx 1 - \frac{ 3{,}0 }{ \log _2 {2^{16}} } \approx 0{,}81.\]

Подставляя полученные числа в выражение~\ref{eq:unicity_distance_simple_frac} для шифров DES и AES, получаем таблицу \ref{table:unicity_distances}.

\begin{table}[!ht]
\centering
Expand Down Expand Up @@ -101,4 +106,4 @@ \section{Расстояние единственности}\label{section_unicit

Соображения выше показывают, что для одного ключа расшифрования так или иначе процедура проверки его корректности является быстрой. Чтобы значительно усложнить работу криптоаналитику, множество ключей, которые требуется перебрать, должно быть большой величиной (например, от $2^{80}$). Это можно сделать, во-первых увеличением битовой длины ключа, во-вторых аккуратной разработкой алгоритма шифрования, чтобы криптоаналитик не смог <<отбросить>> часть ключей без их полной проверки.

Несмотря на то, что теоретический вывод о совершенной криптостойкости для практики не приемлем, так как требует большого объема ключа, сравнимого с объемом открытого текста, разработанные идеи находят успешное применение в современных криптосистемах. Вытекающий из идей Шеннона принцип выравнивания апостериорного распределения символов в шифротекстах используется в современных криптосистемах с помощью многократных итераций, включающих замены и перестановки.
Несмотря на то, что теоретический вывод о совершенной криптостойкости для практики неприемлем, так как требует большого объема ключа, сравнимого с объемом открытого текста, разработанные идеи находят успешное применение в современных криптосистемах. Вытекающий из идей Шеннона принцип выравнивания апостериорного распределения символов в шифротекстах используется в современных криптосистемах с помощью многократных итераций, включающих замены и перестановки.

0 comments on commit 0481561

Please sign in to comment.