Небольшое уточнение в раздел о расстоянии единственности

vlsergey · Dec 25, 2013 · 0481561 · 0481561
1 parent 29158e3
commit 0481561
Showing 1 changed file with 8 additions and 3 deletions.
diff --git a/unicity_distance.tex b/unicity_distance.tex
@@ -69,11 +69,16 @@ \section{Расстояние единственности}\label{section_unicit
 
 	\[ \rho _{en} \approx 1 - \frac{ 1{,}3 }{ \log _2 {26} } \approx 0{,}72.\]
 
-Для русского текста с энтропией $H(M)$ примерно равной $3{,}01$ бит/символ\footnote{Следует отметить, что для английского текста значение $1{,}3$ представляет собой суммарную оценку для всего текста, в то время как оценка $3{,}01$ для русского текста получена Лебедевым и Гармашем из анализа \textbf{частот трёхбуквенных сочетаний} в отрывке текста Л. Н. Толстого <<Война и мир>> длиной в 30 тыс. символов. Соответствующая оценка для английского текста, также приведённая в работе Шеннона, примерно равна $3{,}0$} получаем:
+Для русского текста с энтропией $H(M)$ примерно равной $3{,}01$ бит/символ~\cite{Lebedev:1958}\footnote{Следует отметить, что для английского текста значение $1{,}3$ представляет собой суммарную оценку для всего текста, в то время как оценка $3{,}01$ для русского текста получена Лебедевым и Гармашем из анализа \textbf{частот трёхбуквенных сочетаний} в отрывке текста Л. Н. Толстого <<Война и мир>> длиной в 30 тыс. символов. Соответствующая оценка для английского текста, также приведённая в работе Шеннона, примерно равна $3{,}0$} получаем:
 
 	\[ \rho _{ru} \approx 1 - \frac{ 3{,}0 }{ \log _2 {32} } \approx 0{,}40.\]
 
-Однако, если предположить, что текст передаётся в формате простого текстового файла (plain text) в стандартной кодировке UTF-8 (один байт на английский символ и два -- на кириллицу), то значения избыточности становятся примерно равны $0{,}83$ для английского и $0{,}81$ для русского языков. Подставляя эти числа в выражение~\ref{eq:unicity_distance_simple_frac} для шифров DES и AES получаем таблицу \ref{table:unicity_distances}.
+Однако, если предположить, что текст передаётся в формате простого текстового файла (plain text) в стандартной кодировке UTF-8 (один байт на английский символ и два -- на кириллицу), то значения избыточности становятся примерно равны $0{,}83$ для английского и $0{,}81$ для русского языков.
+
+	\[ \rho _{en, UTF-8} \approx 1 - \frac{ 1{,}3 }{ \log _2 {2^{8}} } \approx 0{,}83,\]
+	\[ \rho _{ru, UTF-8} \approx 1 - \frac{ 3{,}0 }{ \log _2 {2^{16}} } \approx 0{,}81.\]
+
+Подставляя полученные числа в выражение~\ref{eq:unicity_distance_simple_frac} для шифров DES и AES, получаем таблицу \ref{table:unicity_distances}.
 
 \begin{table}[!ht]
 	\centering
@@ -101,4 +106,4 @@ \section{Расстояние единственности}\label{section_unicit
 
 Соображения выше показывают, что для одного ключа расшифрования так или иначе процедура проверки его корректности является быстрой. Чтобы значительно усложнить работу криптоаналитику, множество ключей, которые требуется перебрать, должно быть большой величиной (например, от $2^{80}$). Это можно сделать, во-первых увеличением битовой длины ключа, во-вторых аккуратной разработкой алгоритма шифрования, чтобы криптоаналитик не смог <<отбросить>> часть ключей без их полной проверки.
 
-Несмотря на то, что теоретический вывод о совершенной криптостойкости для практики не приемлем, так как требует большого объема ключа, сравнимого с объемом открытого текста, разработанные идеи находят успешное применение в современных криптосистемах. Вытекающий из идей Шеннона принцип выравнивания апостериорного распределения символов в шифротекстах используется в современных криптосистемах с помощью многократных итераций, включающих замены и перестановки.
+Несмотря на то, что теоретический вывод о совершенной криптостойкости для практики неприемлем, так как требует большого объема ключа, сравнимого с объемом открытого текста, разработанные идеи находят успешное применение в современных криптосистемах. Вытекающий из идей Шеннона принцип выравнивания апостериорного распределения символов в шифротекстах используется в современных криптосистемах с помощью многократных итераций, включающих замены и перестановки.