Hacking at the Voynich manuscript Notebook - volume 7 Warning: these notebooks aren't strictly chronological logs. Sometimes I go back and redo things, clarify comments, delete garbage, etc. Summary of previous notebooks ============================= On 97-07-05 I obtained Landini's interlinear transcription of the VMs, version 1.6 (landini-interln16.evt) from http://sun1.bham.ac.uk/G.Landini/evmt/intrln16.zip I manually extracted from it a homogeneous, full-text sample bio-m-evt.evt, consisting of pages 147-166 (f75r--f84v) of the "biological" section, in Currier's Language B, hand 2. This section includes Currier's and Friedman's transcriptions. Currier's seems to be the most complete of them. The two versions have many differences (affecting 5-10% of the words), and often disagree even in the grouping of symbols: where one sees two words the other sees a single word, what is [A] for one may be [CI] for the other, and so on. So I decided to break all characters doen to individual "logical" strokes, and use one (computer) character to encode each stroke. I called this new encoding "jsa" (Jorge's Super-Analytic). After mapping to jsa, I generated a "consensus" version of the biological section, and got these digraph counts: q o c i l g y s x j u TOT ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- . 1398 965 1877 361 60 . . . . . . 4661 q 1 . 1229 18 . 1 154 . . . 700 . 2103 o 21 486 1 63 1087 1071 . . . . . . 2729 c 4 167 176 6137 1209 232 2114 2921 1019 . . . 13979 i 4 1 1 8 1997 2 . . 560 1616 37 457 4683 l . . . . . . 16 . . . 1566 . 1582 g 52 . 74 2150 4 4 . . . . . . 2284 y 2790 26 2 47 13 43 . . . . . . 2921 s 463 1 99 1013 1 2 . . . . . . 1579 x 827 24 105 488 5 167 . . . . . . 1616 j 46 . 76 2175 6 . . . . . . . 2303 u 453 . 1 3 . . . . . . . . 457 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 4661 2103 2729 13979 4683 1582 2284 2921 1579 1616 2303 457 40897 Some conclusions we get from this and other data: The valid \i/ sequences are \ij/ \is/ \iis/ \iiu/ \iiiu/ \ix/; the others are likely to be scription or transcription errors. \ci/ and \o/ are lexically similar but distinct glyphs. The suffixes \ij/, \is/, \iiu/, and \iiiu/ are preceded almost exclusively by \ci/ and strictly word-final. It seems plausible that these are errors: \oij/ (4 occurrences) should be \ciij/ ( 32 occurrences) \oiiu/ (2 occurrences) should be \ciiiu/ (109 occurrences) \ciiu/ (4 occurrences) should be \ciiiu/ (109 occurrences) \oiiiu/ (9 occurrences) should be \ciiiiu/ (329 occurrences) \ciiiiiu/ (4 occurrences) should be \ciiiiu/ (329 occurrences) \ciiix/ (2 occurrences) should be \ciix/ (403 occurrences) \ciiis/ (19 occurrences) may also be a misreading of \ciis/ (291 occurrences). \cg/ is always a glyph. \qo/ is a combination that occurs only in word-initial position. \qc/ is likely to be a misreading/miswriting of \qo/. \cy/ is always a glyph, almost certainly a final form of \ci/. \qj/, \lj/, \qg/, \lg/ are glyphs. \cs/ is a glyph closely related to (but distinct from) \c/. \ccg/ is almost always followed by \ci/ or \cy/. Here "glyph" means a group of strokes that can be treated as a single symbol for analysis; it may actually be part of a larger, still unrecognized symbol. Summarizing again: \iiiu/, \iiu/, \iis/, \ij/ The ziggies: strictly final, preceded always by \ci/ or, more rarely, by \o/. \ix/ Usually initial or preceded by \ci/ or \o/; followed by any letter except ziggies and \qo/, \ix/, \is/ \is/ Similar to \ix/ except that it cannot be followed by capitals or \cg/, either. \cy/ Almost always final, but occasionaly followed by other letters. Preceded by about the same letters as \ci/; indeed, it is probably the final form of \ci/. \cg/ May be followed by many letters, most often \cy/ and \ci/. Almost always prededed by \c/, or initial; rarely by \ix/ or \o/. \cs/ Most often followed by \c/, somewhat less often by \o/, \ci/, or word break. Most often initial, but also preceded by \ix/, gallows, \c/, \cy/, \cg/, \is/. \lj/, \qj/ The H-gallows: Very similar to each other, different from the rest, but somewhat similar to the P-gallows. They probably combine with \c/ on both sides to make glyphs. It is very likely that \l/ and \q/ are exactly equivalent. \lg/, \qg/ The P-gallows: Very similar to each other, different from the rest, but somewhat similar to the P-gallows. They probably combine with \c/ on both sides to make glyphs. It is very likely that \l/ and \q/ are exactly equivalent. They may be merely ornate forms of some letter, or several letters (\cg/, perhaps), used mainly in the first line of each paragraph (and perhaps of each page?) \qo/ Strictly initial, almost always followed by a capital. Sometimes misread as \qc/? \ci/ May be followed only by the ziggies, \ix/, or \ir/ only. Often follows a capital, but also \cg/, \cs/, \c/, \ix/, \is/, or word break. \o/ Similar to \a/, but is very often word-initial. Other conclusions: * The manuscript does not appear to use any hyphenation mark. Either words are not broken across lines, which would be unusual, or they are broken without any extra marks. Such word breaks may result in statistical anomalies at the beginning and end of lines. Could this explain Currier's claim that lines are "functional units"? * Note that parsing sequences like \cij/, \ciis/, and \ciiis/ requires some care: the right parsings are c+ij, c+iis, ci+iis. * The parsing of \ciis/ is ambiguous: ci+is or c+iis. Declaring \ciiis/ to be a misreading of \ciis/ would remove the ambiguity. * The parsing of \ciiiu/ is ambiguous, too; but since the \iu/ series does not seem to follow a bare \c/, it seems safe to parse it as ci+iiu. * The gallows characters \qj/ and \lj/ appear to be closely related: for every common word with \lj/, there appears to be a a word with \qj/ that occurs with about 1/4 the frequency. * There seems to be a kinship between the glyphs \cs/ (when not attached to the following \c/s) \ir/, and the gallows \lj/ and \qj/ (also, when unattached). * The same phenomenon can be noted with respect to prefixes containing \cc/ and \csc/: for every word beginning with \cc/, there is a word where the first \cc/ is replaced by \csc/, and practically the same frequency. * There apepars to be much confusion between the suffixes \iu/ and \iiiu/. They are almost surely distinct letters, but in about one half of the cases, Currier sees \iiu/ where Friedman has \iiiu/. * There appears to be much confusions between \o/ and \ci/. The strings of \c/, \cs/, \lj/, \qj/, \lg/, \qg/ must be treated together, after collapsing the glyphs listed above, since there seem to be glyphs consisting of gallows preceded and followed by \c/ or \cc/. When this is taken into account, we can see that a single \c/ is not a glyph, but \cs/ is. In fact, after shrinking \ci/ to `a', \cs/ to `z', the gallows to `H' or `P', the only possible glyphs of the form [czHp]* with length at most 3 are freq glyph ---- ----- 795 H 52 P 152 z 138 cc 70 zc 482 Hc 484 ccc 439 zcc ? 493 Hcc ? 19 cHc 4 cPc The ones marked `?' may be composite, z+cc and H+cc, but this hypothesis does not seem very likely (perhaps they are *sometimes* composite?) The significant strings of length 4 that cannot be parsed into the glyphs above are 20 cHcc 4 cPcc Strings with 4 or more [czHP]'s tend to be quite ambiguous. Looking at the raw texts, it seems that the main source of "?"s is the confusion between "M" and "N" by Currier and/or Friedman. So I decided to map both [N] and [M] (and other lookalikes) to "m". I christened the new encoding "hop". --- fsg2hop ------------------------ #! /n/gnu/bin/gawk -f # Recoding an interlinear file from the FSG alphabet to # my Lossy Ad-hoc Semi-Analytic Fault-Tolerant encoding BEGIN { print "# Output of fsg2hop - Stolfi's Semi-Analytic Fault-Tolerant alphabet" } /^ *$/ { print; next } /^ *#/ { print; next } /^<[^>.;]*>/ { print; next } /^<[^>]*\.[^>]*;[A-Z]> / { curtxt = substr($0,20) # We discard "%" and "!" since the conversion # will destroy synchronism anyway. gsub(/[%!]/, "", curtxt); # First, the conversion from FSG to JSA (Stolfi's super-analytic) gsub(/IIIK/, "iiiij", curtxt); gsub(/IIIL/, "iiiiu", curtxt); gsub(/IIIR/, "iiiis", curtxt); gsub(/IIIE/, "iiiix", curtxt); gsub(/IIE/, "iiix", curtxt); gsub(/IIR/, "iiis", curtxt); gsub(/IIK/, "iiij", curtxt); gsub(/HZ/, "cqjc", curtxt); gsub(/PZ/, "cqgc", curtxt); gsub(/DZ/, "cljc", curtxt); gsub(/FZ/, "clgc", curtxt); gsub(/IE/, "iix", curtxt); gsub(/IR/, "iis", curtxt); gsub(/IK/, "iij", curtxt); gsub(/2/, "cs", curtxt); gsub(/4/, "q", curtxt); gsub(/6/, "cj", curtxt); gsub(/7/, "ig", curtxt); gsub(/8/, "cg", curtxt); gsub(/A/, "ci", curtxt); gsub(/C/, "c", curtxt); gsub(/D/, "lj", curtxt); gsub(/E/, "ix", curtxt); gsub(/F/, "lg", curtxt); gsub(/G/, "cy", curtxt); gsub(/H/, "qj", curtxt); gsub(/I/, "i", curtxt); gsub(/K/, "ij", curtxt); gsub(/L/, "iu", curtxt); gsub(/M/, "iiiu", curtxt); gsub(/N/, "iiu", curtxt); gsub(/O/, "o", curtxt); gsub(/P/, "qg", curtxt); gsub(/R/, "is", curtxt); gsub(/S/, "csc", curtxt); gsub(/T/, "cc", curtxt); gsub(/V/, "?", curtxt); gsub(/Y/, "?", curtxt); # Now, the conversion from JSA to HOP: gsub(/[ql]j/, "H", curtxt); gsub(/[ql]g/, "P", curtxt); gsub(/cs/, "z", curtxt); gsub(/ij/, "k", curtxt); gsub(/ix/, "e", curtxt); gsub(/is/, "r", curtxt); gsub(/iiu/, "n", curtxt); gsub(/y/, "i", curtxt); gsub(/ci/, "a", curtxt); gsub(/cg/, "8", curtxt); gsub(/ir/, "w", curtxt); gsub(/i*n/, "m", curtxt); print (substr($0,1,19) curtxt); next } ------------------------------------ After mapping Currier and Friedman to the "hop" encoding, I created a consensus bio-j-hop.evt. I also created by hand a file bio-j-hop.evj, which is like bio-j-hop.evt except that it has " " instead of "." as word-space, and " //" instead of "-" for end-of-line, and " =" instead of "=" for end-of-paragraph. It allows me to find the page and line numbers of a word, given its "hop" encoding. Extracted the text files: extract-words-from-interlin \ -chars "aocz8HPerqkmw" \ bio-j-hop.evt \ bio-j-hop lines words bytes file ------ ------- --------- ------------ 7670 7670 41815 bio-j-hop.wds 1510 1510 9982 bio-j-hop.dic 5894 5894 33804 bio-j-hop-gut.wds 949 949 6236 bio-j-hop-gut.dic 843 843 2464 bio-j-hop-fun.wds 5 5 24 bio-j-hop-fun.dic 933 933 5547 bio-j-hop-bad.wds 556 556 3722 bio-j-hop-bad.dic Digraph counts: a o c z 8 H P e r q k m w TT ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- . 251 1235 757 912 472 276 86 313 103 1489 . . . 5894 a 3196 2 4 19 26 14 78 2 491 345 5 39 802 23 5046 o 28 5 1 39 6 21 1776 68 1173 240 6 5 19 1 3388 c 10 1059 226 4047 44 1865 408 33 15 4 . . 5 . 7716 z 58 109 90 957 10 3 4 1 1 . . . . . 1233 8 64 2245 50 45 32 1 5 . 5 1 . . . . 2448 H 12 1125 98 1479 47 5 . . 9 . . . 1 . 2776 P 2 20 43 116 17 3 . . . . . . . . 201 e 1121 130 117 216 122 61 227 10 4 2 1 . . . 2011 r 514 90 48 24 15 3 1 . . . . . . . 695 q 1 5 1474 17 2 . 1 1 . . . . . . 1501 k 43 . 1 . . . . . . . . . . . 44 m 822 4 1 . . . . . . . . . . . 827 w 23 1 . . . . . . . . . . . . 24 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 5894 5046 3388 7716 1233 2448 2776 201 2011 695 1501 44 827 24 33804 Next-symbol probability (× 99): a o c z 8 H P e r q k m w TT -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- . 4 21 13 15 8 5 1 5 2 25 . . . 99 a 63 . . . 1 . 2 . 10 7 . 1 16 . 99 o 1 . . 1 . 1 52 2 34 7 . . 1 . 99 c . 14 3 52 1 24 5 . . . . . . . 99 z 5 9 7 77 1 . . . . . . . . . 99 8 3 91 2 2 1 . . . . . . . . . 99 H . 40 3 53 2 . . . . . . . . . 99 P 1 10 21 57 8 1 . . . . . . . . 99 e 55 6 6 11 6 3 11 . . . . . . . 99 r 73 13 7 3 2 . . . . . . . . . 99 q . . 97 1 . . . . . . . . . . 99 k 97 . 2 . . . . . . . . . . . 99 m 98 . . . . . . . . . . . . . 99 w 95 4 . . . . . . . . . . . . 99 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 17 15 10 23 4 7 8 1 6 2 4 0 2 0 99 Previous-symbol probability (× 99): a o c z 8 H P e r q k m w TT -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- . 5 36 10 73 19 10 42 15 15 98 . . . 17 a 54 . . . 2 1 3 1 24 49 . 88 96 95 15 o . . . 1 . 1 63 33 58 34 . 11 2 4 10 c . 21 7 52 4 75 15 16 1 1 . . 1 . 23 z 1 2 3 12 1 . . . . . . . . . 4 8 1 44 1 1 3 . . . . . . . . . 7 H . 22 3 19 4 . . . . . . . . . 8 P . . 1 1 1 . . . . . . . . . 1 e 19 3 3 3 10 2 8 5 . . . . . . 6 r 9 2 1 . 1 . . . . . . . . . 2 q . . 43 . . . . . . . . . . . 4 k 1 . . . . . . . . . . . . . 0 m 14 . . . . . . . . . . . . . 2 w . . . . . . . . . . . . . . 0 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 Rebuilt .fix.wds, .fix.dic: cat bio-j-hop.wds \ | sed -e '/?/s/^.*$/???/g' \ > .fix.wds cat .fix.wds \ | sort | uniq \ > .fix.dic cat .fix.wds \ | wfreq \ > .fix.frq lines words bytes file ------ ------- --------- ------------ 955 955 6264 .fix.dic 957 2871 17757 .fix.frq 7670 7670 40000 .fix.wds 97-09-13 stolfi =============== Dennis challenged me to find a statistically convincing mapping from Latin to Voynichese. First, let's try to maximize the H2 of latin, by adding some contractions. Obvious problems in the standard spelling are "q" (always followed by "u"), "t" and "m" (often followed by " "). Also "s" is often followed by " ". So let's try: cat latn.txt \ | sed \ -e 's/$/ /g' \ -e 's/at /A/g' \ -e 's/et /E/g' \ -e 's/it /I/g' \ -e 's/ot /O/g' \ -e 's/ut /U/g' \ -e 's/qu/Q/g' \ -e 's/th/T/g' \ -e 's/ $//g' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' iaueonrpclgbshdtmfvxzTQAEIOU' Digraph counts: TT i a u e o n r p c l g b s h d t m f v x z T Q A E I U ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 1093 . 90 86 5 73 12 36 62 43 49 11 9 16 124 8 83 56 56 51 44 . 1 3 48 . 121 . 6 i 739 107 7 63 49 26 36 121 12 13 35 36 5 25 73 8 22 37 20 3 19 12 . 2 3 3 1 1 . a 546 50 8 1 19 37 . 51 16 5 24 44 8 34 29 9 62 26 60 . 40 . . 17 3 . . 3 . u 407 11 16 10 12 9 13 38 26 15 8 25 1 4 84 . 11 14 93 1 1 6 . . . 1 . 8 . e 751 152 28 4 27 5 12 61 138 4 18 19 52 11 66 . 26 24 56 3 1 27 . 11 3 3 . . . o 422 70 7 4 . 1 . 88 32 13 28 15 2 5 49 1 12 8 71 . 4 2 . . 10 . . . . n 443 81 59 38 41 40 32 4 . 4 8 . 15 . 24 . 17 63 . 4 5 2 . . 3 . 1 2 . r 380 45 31 48 24 105 30 6 12 . 4 . 9 1 7 1 14 4 8 2 11 . 1 . . 10 1 6 . p 118 . 12 7 8 27 20 . 20 . . 5 . . 7 9 . 3 . . . . . . . . . . . c 212 23 37 22 36 50 19 . 2 . 7 3 . . . 4 . 5 . . . . . . . . 2 . 2 l 174 10 52 21 9 17 39 . . . 3 12 . . . . 1 9 . . 1 . . . . . . . . g 103 2 27 3 7 22 12 17 9 . . 2 2 . . . . . . . . . . . . . . . . b 108 7 18 16 23 19 7 1 1 . . 1 . . 3 . . . 1 . . . . . . 3 . 8 . s 515 219 21 72 46 41 15 . 9 7 12 . . . 15 . . 45 . . . . . . 5 . 5 3 . h 48 . 9 4 3 24 7 . 1 . . . . . . . . . . . . . . . . . . . . d 267 38 56 24 11 41 78 . 1 1 . . . . . 3 3 . . . . . . . . . 1 10 . t 300 43 53 32 58 72 9 . 17 . . . . . . . . . . . . . . . 15 . 1 . . m 374 189 58 12 9 40 43 9 . 2 . . . 3 . . . 1 2 . . . . . 5 . 1 . . f 70 . 36 8 9 9 4 . 3 . . . . . . . . . . 1 . . . . . . . . . v 133 . 49 7 5 30 14 . . . . . . . . . . . . . . . . . . 4 . 24 . x 49 23 5 . . 9 . . . . . . . . . . . 2 . . . . . . . . . 10 . z 2 . . . . 1 1 . . . . . . . . . . . . . . . . . . . . . . T 34 3 4 17 . 1 . . 4 . . . . . 5 . . . . . . . . . . . . . . Q 98 . 24 22 . 37 14 . . . . . . . . . . . . . . . . . . . . 1 . A 24 2 2 2 . 4 . 1 3 . 2 . . . 4 1 2 . . . 1 . . . . . . . . E 137 12 23 16 2 6 3 9 6 7 8 1 . 6 15 1 7 . 3 5 3 . . 1 2 . 1 . . I 76 6 4 6 4 5 2 1 6 4 5 . . 3 8 3 7 3 3 . 3 . . . 1 . 2 . . U 8 . 3 1 . . . . . . 1 . . . 2 . . . 1 . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 7631 1093 739 546 407 751 422 443 380 118 212 174 103 108 515 48 267 300 374 70 133 49 2 34 98 24 137 76 8 Next-symbol probability (× 99): TT i a u e o n r p c l g b s h d t m f v x z T Q A E I U -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 99 . 8 8 . 7 1 3 6 4 4 1 1 1 11 1 8 5 5 5 4 . . . 4 . 11 . 1 i 99 14 1 8 7 3 5 16 2 2 5 5 1 3 10 1 3 5 3 . 3 2 . . . . . . . a 99 9 1 . 3 7 . 9 3 1 4 8 1 6 5 2 11 5 11 . 7 . . 3 1 . . 1 . u 99 3 4 2 3 2 3 9 6 4 2 6 . 1 20 . 3 3 23 . . 1 . . . . . 2 . e 99 20 4 1 4 1 2 8 18 1 2 3 7 1 9 . 3 3 7 . . 4 . 1 . . . . . o 99 16 2 1 . . . 21 8 3 7 4 . 1 11 . 3 2 17 . 1 . . . 2 . . . . n 99 18 13 8 9 9 7 1 . 1 2 . 3 . 5 . 4 14 . 1 1 . . . 1 . . . . r 99 12 8 13 6 27 8 2 3 . 1 . 2 . 2 . 4 1 2 1 3 . . . . 3 . 2 . p 99 . 10 6 7 23 17 . 17 . . 4 . . 6 8 . 3 . . . . . . . . . . . c 99 11 17 10 17 23 9 . 1 . 3 1 . . . 2 . 2 . . . . . . . . 1 . 1 l 99 6 30 12 5 10 22 . . . 2 7 . . . . 1 5 . . 1 . . . . . . . . g 99 2 26 3 7 21 12 16 9 . . 2 2 . . . . . . . . . . . . . . . . b 99 6 17 15 21 17 6 1 1 . . 1 . . 3 . . . 1 . . . . . . 3 . 7 . s 99 42 4 14 9 8 3 . 2 1 2 . . . 3 . . 9 . . . . . . 1 . 1 1 . h 99 . 19 8 6 50 14 . 2 . . . . . . . . . . . . . . . . . . . . d 99 14 21 9 4 15 29 . . . . . . . . 1 1 . . . . . . . . . . 4 . t 99 14 17 11 19 24 3 . 6 . . . . . . . . . . . . . . . 5 . . . . m 99 50 15 3 2 11 11 2 . 1 . . . 1 . . . . 1 . . . . . 1 . . . . f 99 . 51 11 13 13 6 . 4 . . . . . . . . . . 1 . . . . . . . . . v 99 . 36 5 4 22 10 . . . . . . . . . . . . . . . . . . 3 . 18 . x 99 46 10 . . 18 . . . . . . . . . . . 4 . . . . . . . . . 20 . z 99 . . . . 50 50 . . . . . . . . . . . . . . . . . . . . . . T 99 9 12 50 . 3 . . 12 . . . . . 15 . . . . . . . . . . . . . . Q 99 . 24 22 . 37 14 . . . . . . . . . . . . . . . . . . . . 1 . A 99 8 8 8 . 17 . 4 12 . 8 . . . 17 4 8 . . . 4 . . . . . . . . E 99 9 17 12 1 4 2 7 4 5 6 1 . 4 11 1 5 . 2 4 2 . . 1 1 . 1 . . I 99 8 5 8 5 7 3 1 8 5 7 . . 4 10 4 9 4 4 . 4 . . . 1 . 3 . . U 99 . 37 12 . . . . . . 12 . . . 25 . . . 12 . . . . . . . . . . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 14 10 7 5 10 5 6 5 2 3 2 1 1 7 1 3 4 5 1 2 1 0 0 1 0 2 1 0 Symbol entropy: 4.182 Next-symbol entropy: ntrpy count i a u e o n r p c l g b s h d t m f v x z T Q A E I U ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 4.094 1093 . 0.297 0.289 0.036 0.261 0.071 0.162 0.235 0.184 0.201 0.067 0.057 0.089 0.356 0.052 0.282 0.220 0.220 0.206 0.187 . 0.009 0.023 0.198 . 0.352 . 0.041 I 4.075 76 0.289 0.224 0.289 0.224 0.258 0.138 0.082 0.289 0.224 0.258 . . 0.184 0.342 0.184 0.317 0.184 0.184 . 0.184 . . . 0.082 . 0.138 . . a 3.967 546 0.316 0.089 0.017 0.169 0.263 . 0.319 0.149 0.062 0.198 0.293 0.089 0.249 0.225 0.098 0.356 0.209 0.350 . 0.276 . . 0.156 0.041 . . 0.041 . i 3.960 739 0.404 0.064 0.303 0.260 0.170 0.212 0.427 0.097 0.103 0.208 0.212 0.049 0.165 0.330 0.071 0.151 0.216 0.141 0.032 0.136 0.097 . 0.023 0.032 0.032 0.013 0.013 . E 3.902 137 0.308 0.432 0.362 0.089 0.198 0.121 0.258 0.198 0.219 0.239 0.052 . 0.198 0.349 0.052 0.219 . 0.121 0.174 0.121 . . 0.052 0.089 . 0.052 . . e 3.687 751 0.466 0.177 0.040 0.172 0.048 0.095 0.294 0.449 0.040 0.129 0.134 0.267 0.089 0.308 . 0.168 0.159 0.279 0.032 0.013 0.172 . 0.089 0.032 0.032 . . . u 3.609 407 0.141 0.184 0.131 0.150 0.122 0.159 0.319 0.254 0.176 0.111 0.247 0.021 0.066 0.470 . 0.141 0.167 0.487 0.021 0.021 0.090 . . . 0.021 . 0.111 . n 3.519 443 0.448 0.387 0.304 0.318 0.313 0.274 0.061 . 0.061 0.105 . 0.165 . 0.228 . 0.181 0.400 . 0.061 0.073 0.035 . . 0.049 . 0.020 0.035 . r 3.518 380 0.365 0.295 0.377 0.252 0.513 0.289 0.094 0.157 . 0.069 . 0.128 0.023 0.106 0.023 0.175 0.069 0.117 0.040 0.148 . 0.023 . . 0.138 0.023 0.094 . o 3.361 422 0.430 0.098 0.064 . 0.021 . 0.472 0.282 0.155 0.260 0.171 0.037 0.076 0.361 0.021 0.146 0.108 0.433 . 0.064 0.037 . . 0.128 . . . . A 3.304 24 0.299 0.299 0.299 . 0.431 . 0.191 0.375 . 0.299 . . . 0.431 0.191 0.299 . . . 0.191 . . . . . . . . b 3.082 108 0.256 0.431 0.408 0.475 0.441 0.256 0.063 0.063 . . 0.063 . . 0.144 . . . 0.063 . . . . . . 0.144 . 0.278 . p 3.048 118 . 0.335 0.242 0.263 0.487 0.434 . 0.434 . . 0.193 . . 0.242 0.283 . 0.135 . . . . . . . . . . . c 3.040 212 0.348 0.440 0.339 0.434 0.492 0.312 . 0.063 . 0.162 0.087 . . . 0.108 . 0.127 . . . . . . . . 0.063 . 0.063 l 2.832 174 0.237 0.521 0.368 0.221 0.328 0.484 . . . 0.101 0.266 . . . . 0.043 0.221 . . 0.043 . . . . . . . . g 2.823 103 0.110 0.506 0.149 0.264 0.476 0.361 0.429 0.307 . . 0.110 0.110 . . . . . . . . . . . . . . . . s 2.802 515 0.525 0.188 0.397 0.311 0.291 0.149 . 0.102 0.084 0.126 . . . 0.149 . . 0.307 . . . . . . 0.065 . 0.065 0.043 . t 2.770 300 0.402 0.442 0.344 0.458 0.494 0.152 . 0.235 . . . . . . . . . . . . . . . 0.216 . 0.027 . . d 2.722 267 0.400 0.473 0.312 0.190 0.415 0.519 . 0.030 0.030 . . . . . 0.073 0.073 . . . . . . . . . 0.030 0.177 . v 2.357 133 . 0.531 0.224 0.178 0.485 0.342 . . . . . . . . . . . . . . . . . . 0.152 . 0.446 . m 2.302 374 0.498 0.417 0.159 0.129 0.345 0.359 0.129 . 0.040 . . . 0.056 . . . 0.023 0.040 . . . . . 0.083 . 0.023 . . U 2.156 8 . 0.531 0.375 . . . . . . 0.375 . . . 0.500 . . . 0.375 . . . . . . . . . . f 2.130 70 . 0.493 0.358 0.380 0.380 0.236 . 0.195 . . . . . . . . . . 0.088 . . . . . . . . . T 2.092 34 0.309 0.363 0.500 . 0.150 . . 0.363 . . . . . 0.407 . . . . . . . . . . . . . . h 2.023 48 . 0.453 0.299 0.250 0.500 0.405 . 0.116 . . . . . . . . . . . . . . . . . . . . Q 1.980 98 . 0.497 0.484 . 0.531 0.401 . . . . . . . . . . . . . . . . . . . . 0.067 . x 1.953 49 0.512 0.336 . . 0.449 . . . . . . . . . . . 0.188 . . . . . . . . . 0.468 . z 1.000 2 . . . . 0.500 0.500 . . . . . . . . . . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 3.402 7631 0.402 0.326 0.272 0.226 0.329 0.231 0.238 0.216 0.093 0.144 0.124 0.084 0.087 0.262 0.046 0.169 0.184 0.213 0.062 0.102 0.047 0.003 0.035 0.081 0.026 0.104 0.066 0.010 It seems that "th" -> "T", "ot " -> "O", and "ut " -> "U" are not useful. Ok, now let's fix "m" (coomon endings) and v ("ve", "vi"): cat latn.txt \ | sed \ -e 's/$/ /g' \ -e 's/at /A/g' \ -e 's/et /E/g' \ -e 's/it /I/g' \ -e 's/qu/Q/g' \ -e 's/ve/Y/g' \ -e 's/vi/W/g' \ -e 's/am /H/g' \ -e 's/em /M/g' \ -e 's/om /O/g' \ -e 's/um /U/g' \ -e 's/ $//g' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' iaueonrpclgbshdtmfvxzQAEIYWHMOU' Digraph counts: TT i a u e o n r p c l g b s h d t m f v x z Q A E I Y W H M O U ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 946 . 79 76 9 65 12 32 51 34 46 11 6 15 108 7 71 48 49 40 14 . . 47 . 99 . 13 14 . . . . i 690 103 6 48 36 25 36 121 4 13 34 36 5 25 72 8 6 33 20 3 4 12 . 3 3 1 1 6 3 10 1 . 12 a 500 50 8 1 19 37 . 51 16 5 24 44 8 34 29 9 62 43 14 . 18 . . 3 . . 3 5 17 . . . . u 330 11 16 5 4 9 13 38 26 15 8 25 1 4 84 . 11 22 8 1 1 6 . . 1 . 8 . . 5 . . 8 e 668 152 28 . 6 5 12 54 121 4 18 19 52 11 61 . 26 35 3 3 1 27 . 3 2 . . . . 4 . . 21 o 420 70 7 4 . 1 . 88 32 13 28 15 2 5 49 1 12 8 69 . 1 2 . 10 . . . 3 . . . . . n 443 81 59 38 30 27 32 4 . 4 8 . 15 . 24 . 17 63 . 4 . 2 . 3 . 1 2 2 3 . 13 . 11 r 380 45 31 40 21 100 30 6 12 . 4 . 9 1 7 1 14 4 8 2 7 . 1 . 10 1 6 . 4 8 5 . 3 p 118 . 12 7 8 26 20 . 20 . . 5 . . 7 9 . 3 . . . . . . . . . . . . 1 . . c 212 23 37 22 21 50 19 . 2 . 7 3 . . . 4 . 5 . . . . . . . 2 . . . . . . 17 l 174 10 52 16 7 16 37 . . . 3 12 . . . . 1 9 . . 1 . . . . . . . . 5 1 2 2 g 103 2 27 3 7 11 12 17 9 . . 2 2 . . . . . . . . . . . . . . . . . 11 . . b 108 7 18 14 22 19 7 1 1 . . 1 . . 3 . . . 1 . . . . . 3 . 8 . . 2 . . 1 s 515 219 21 71 45 41 15 . 9 7 12 . . . 15 . . 45 . . . . . 5 . 5 3 . . 1 . . 1 h 82 3 13 21 3 25 7 . 5 . . . . . 5 . . . . . . . . . . . . . . . . . . d 267 38 56 23 11 39 78 . 1 1 . . . . . 3 3 . . . . . . . . 1 10 . . 1 2 . . t 342 51 53 30 54 53 9 . 17 . . . . . . 34 . . . . . . . 15 . 1 . . . 2 19 . 4 m 188 3 58 10 8 40 43 9 . 2 . . . 3 . . . 1 2 . . . . 5 . 1 . . . 2 . . 1 f 70 . 36 8 9 9 4 . 3 . . . . . . . . . . 1 . . . . . . . . . . . . . v 54 . . 7 2 . 14 . . . . . . . . . . . . . . . . . 4 . 24 . . . . . 3 x 49 23 5 . . 9 . . . . . . . . . . . 2 . . . . . . . . 10 . . . . . . z 2 . . . . 1 1 . . . . . . . . . . . . . . . . . . . . . . . . . . Q 98 . 24 19 . 37 14 . . . . . . . . . . . . . . . . . . . 1 . . 3 . . . A 24 2 2 2 . 4 . 1 3 . 2 . . . 4 1 2 . . . . . . . . . . . 1 . . . . E 137 12 23 16 2 6 3 9 6 7 8 1 . 6 15 1 7 1 3 5 1 . . 2 . 1 . 1 1 . . . . I 76 6 4 6 4 5 2 1 6 4 5 . . 3 8 3 7 3 3 . . . . 1 . 2 . . 3 . . . . Y 30 . . . . . . 7 17 . . . . . 5 . . . . . . . . . 1 . . . . . . . . W 49 4 1 2 . . . . 8 . 1 . . . 1 . 16 6 . . 5 . . . . . . . 1 3 . . 1 H 46 7 1 4 2 2 . . 6 1 . . . . 4 1 2 2 3 3 1 . . . . 6 . . 1 . . . . M 53 8 4 4 . 1 . . . 3 2 . . 1 8 . 4 2 2 4 . . 1 1 . 8 . . . . . . . O 2 1 . . . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . U 85 15 9 3 . 5 . 4 5 5 2 . 3 . 6 . 6 7 3 3 . . . . . 8 . . 1 . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 7261 946 690 500 330 668 420 443 380 118 212 174 103 108 515 82 267 342 188 70 54 49 2 98 24 137 76 30 49 46 53 2 85 Next-symbol probability (× 99): TT i a u e o n r p c l g b s h d t m f v x z Q A E I Y W H M O U -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 99 . 8 8 1 7 1 3 5 4 5 1 1 2 11 1 7 5 5 4 1 . . 5 . 10 . 1 1 . . . . i 99 15 1 7 5 4 5 17 1 2 5 5 1 4 10 1 1 5 3 . 1 2 . . . . . 1 . 1 . . 2 a 99 10 2 . 4 7 . 10 3 1 5 9 2 7 6 2 12 9 3 . 4 . . 1 . . 1 1 3 . . . . u 99 3 5 2 1 3 4 11 8 5 2 8 . 1 25 . 3 7 2 . . 2 . . . . 2 . . 2 . . 2 e 99 23 4 . 1 1 2 8 18 1 3 3 8 2 9 . 4 5 . . . 4 . . . . . . . 1 . . 3 o 99 17 2 1 . . . 21 8 3 7 4 . 1 12 . 3 2 16 . . . . 2 . . . 1 . . . . . n 99 18 13 8 7 6 7 1 . 1 2 . 3 . 5 . 4 14 . 1 . . . 1 . . . . 1 . 3 . 2 r 99 12 8 10 5 26 8 2 3 . 1 . 2 . 2 . 4 1 2 1 2 . . . 3 . 2 . 1 2 1 . 1 p 99 . 10 6 7 22 17 . 17 . . 4 . . 6 8 . 3 . . . . . . . . . . . . 1 . . c 99 11 17 10 10 23 9 . 1 . 3 1 . . . 2 . 2 . . . . . . . 1 . . . . . . 8 l 99 6 30 9 4 9 21 . . . 2 7 . . . . 1 5 . . 1 . . . . . . . . 3 1 1 1 g 99 2 26 3 7 11 12 16 9 . . 2 2 . . . . . . . . . . . . . . . . . 11 . . b 99 6 17 13 20 17 6 1 1 . . 1 . . 3 . . . 1 . . . . . 3 . 7 . . 2 . . 1 s 99 42 4 14 9 8 3 . 2 1 2 . . . 3 . . 9 . . . . . 1 . 1 1 . . . . . . h 99 4 16 25 4 30 8 . 6 . . . . . 6 . . . . . . . . . . . . . . . . . . d 99 14 21 9 4 14 29 . . . . . . . . 1 1 . . . . . . . . . 4 . . . 1 . . t 99 15 15 9 16 15 3 . 5 . . . . . . 10 . . . . . . . 4 . . . . . 1 6 . 1 m 99 2 31 5 4 21 23 5 . 1 . . . 2 . . . 1 1 . . . . 3 . 1 . . . 1 . . 1 f 99 . 51 11 13 13 6 . 4 . . . . . . . . . . 1 . . . . . . . . . . . . . v 99 . . 13 4 . 26 . . . . . . . . . . . . . . . . . 7 . 44 . . . . . 6 x 99 46 10 . . 18 . . . . . . . . . . . 4 . . . . . . . . 20 . . . . . . z 99 . . . . 50 50 . . . . . . . . . . . . . . . . . . . . . . . . . . Q 99 . 24 19 . 37 14 . . . . . . . . . . . . . . . . . . . 1 . . 3 . . . A 99 8 8 8 . 17 . 4 12 . 8 . . . 17 4 8 . . . . . . . . . . . 4 . . . . E 99 9 17 12 1 4 2 7 4 5 6 1 . 4 11 1 5 1 2 4 1 . . 1 . 1 . 1 1 . . . . I 99 8 5 8 5 7 3 1 8 5 7 . . 4 10 4 9 4 4 . . . . 1 . 3 . . 4 . . . . Y 99 . . . . . . 23 56 . . . . . 17 . . . . . . . . . 3 . . . . . . . . W 99 8 2 4 . . . . 16 . 2 . . . 2 . 32 12 . . 10 . . . . . . . 2 6 . . 2 H 99 15 2 9 4 4 . . 13 2 . . . . 9 2 4 4 6 6 2 . . . . 13 . . 2 . . . . M 99 15 7 7 . 2 . . . 6 4 . . 2 15 . 7 4 4 7 . . 2 2 . 15 . . . . . . . O 99 50 . . . . . . . . . . . . . . . . . 50 . . . . . . . . . . . . . U 99 17 10 3 . 6 . 5 6 6 2 . 3 . 7 . 7 8 3 3 . . . . . 9 . . 1 . . . . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 13 9 7 4 9 6 6 5 2 3 2 1 1 7 1 4 5 3 1 1 1 0 1 0 2 1 0 1 1 1 0 1 Symbol entropy: 4.328 Next-symbol entropy: TT TT i a u e o n r p c l g b s h d t m f v x z Q A E I Y W H M O U ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 4.137 946 . 0.299 0.292 0.064 0.265 0.080 0.165 0.227 0.172 0.212 0.075 0.046 0.095 0.357 0.052 0.280 0.218 0.221 0.193 0.090 . . 0.215 . 0.341 . 0.085 0.090 . . . . I 4.075 76 0.289 0.224 0.289 0.224 0.258 0.138 0.082 0.289 0.224 0.258 . . 0.184 0.342 0.184 0.317 0.184 0.184 . . . . 0.082 . 0.138 . . 0.184 . . . . i 4.011 690 0.410 0.060 0.268 0.222 0.173 0.222 0.440 0.043 0.108 0.214 0.222 0.052 0.173 0.340 0.075 0.060 0.210 0.148 0.034 0.043 0.102 . 0.034 0.034 0.014 0.014 0.060 0.034 0.089 0.014 . 0.102 a 4.000 500 0.332 0.095 0.018 0.179 0.278 . 0.336 0.159 0.066 0.210 0.309 0.095 0.264 0.238 0.104 0.373 0.304 0.144 . 0.173 . . 0.044 . . 0.044 0.066 0.166 . . . . E 3.936 137 0.308 0.432 0.362 0.089 0.198 0.121 0.258 0.198 0.219 0.239 0.052 . 0.198 0.349 0.052 0.219 0.052 0.121 0.174 0.052 . . 0.089 . 0.052 . 0.052 0.052 . . . . u 3.824 330 0.164 0.212 0.092 0.077 0.142 0.184 0.359 0.289 0.203 0.130 0.282 0.025 0.077 0.502 . 0.164 0.260 0.130 0.025 0.025 0.105 . . 0.025 . 0.130 . . 0.092 . . 0.130 U 3.755 85 0.442 0.343 0.170 . 0.240 . 0.208 0.240 0.240 0.127 . 0.170 . 0.270 . 0.270 0.297 0.170 0.170 . . . . . 0.321 . . 0.075 . . . . r 3.738 380 0.365 0.295 0.342 0.231 0.507 0.289 0.094 0.157 . 0.069 . 0.128 0.023 0.106 0.023 0.175 0.069 0.117 0.040 0.106 . 0.023 . 0.138 0.023 0.094 . 0.069 0.117 0.082 . 0.055 H 3.694 46 0.413 0.120 0.306 0.197 0.197 . . 0.383 0.120 . . . . 0.306 0.120 0.197 0.197 0.257 0.257 0.120 . . . . 0.383 . . 0.120 . . . . n 3.690 443 0.448 0.387 0.304 0.263 0.246 0.274 0.061 . 0.061 0.105 . 0.165 . 0.228 . 0.181 0.400 . 0.061 . 0.035 . 0.049 . 0.020 0.035 0.035 0.049 . 0.149 . 0.132 e 3.604 668 0.486 0.192 . 0.061 0.053 0.104 0.293 0.446 0.044 0.140 0.146 0.287 0.098 0.315 . 0.182 0.223 0.035 0.035 0.014 0.187 . 0.035 0.025 . . . . 0.044 . . 0.157 M 3.563 53 0.412 0.281 0.281 . 0.108 . . . 0.235 0.178 . . 0.108 0.412 . 0.281 0.178 0.178 0.281 . . 0.108 0.108 . 0.412 . . . . . . . o 3.372 420 0.431 0.098 0.064 . 0.021 . 0.472 0.283 0.155 0.260 0.172 0.037 0.076 0.362 0.021 0.147 0.109 0.428 . 0.021 0.037 . 0.128 . . . 0.051 . . . . . A 3.304 24 0.299 0.299 0.299 . 0.431 . 0.191 0.375 . 0.299 . . . 0.431 0.191 0.299 . . . . . . . . . . . 0.191 . . . . t 3.229 342 0.409 0.417 0.308 0.420 0.417 0.138 . 0.215 . . . . . . 0.331 . . . . . . . 0.198 . 0.025 . . . 0.043 0.232 . 0.075 b 3.218 108 0.256 0.431 0.382 0.468 0.441 0.256 0.063 0.063 . . 0.063 . . 0.144 . . . 0.063 . . . . . 0.144 . 0.278 . . 0.107 . . 0.063 c 3.164 212 0.348 0.440 0.339 0.330 0.492 0.312 . 0.063 . 0.162 0.087 . . . 0.108 . 0.127 . . . . . . . 0.063 . . . . . . 0.292 p 3.100 118 . 0.335 0.242 0.263 0.481 0.434 . 0.434 . . 0.193 . . 0.242 0.283 . 0.135 . . . . . . . . . . . . 0.058 . . l 3.064 174 0.237 0.521 0.317 0.186 0.317 0.475 . . . 0.101 0.266 . . . . 0.043 0.221 . . 0.043 . . . . . . . . 0.147 0.043 0.074 0.074 g 3.037 103 0.110 0.506 0.149 0.264 0.345 0.361 0.429 0.307 . . 0.110 0.110 . . . . . . . . . . . . . . . . . 0.345 . . W 2.964 49 0.295 0.115 0.188 . . . . 0.427 . 0.115 . . . 0.115 . 0.527 0.371 . . 0.336 . . . . . . . 0.115 0.247 . . 0.115 s 2.830 515 0.525 0.188 0.394 0.307 0.291 0.149 . 0.102 0.084 0.126 . . . 0.149 . . 0.307 . . . . . 0.065 . 0.065 0.043 . . 0.017 . . 0.017 d 2.788 267 0.400 0.473 0.305 0.190 0.405 0.519 . 0.030 0.030 . . . . . 0.073 0.073 . . . . . . . . 0.030 0.177 . . 0.030 0.053 . . m 2.774 188 0.095 0.523 0.225 0.194 0.475 0.487 0.210 . 0.070 . . . 0.095 . . . 0.040 0.070 . . . . 0.139 . 0.040 . . . 0.070 . . 0.040 h 2.591 82 0.175 0.421 0.503 0.175 0.522 0.303 . 0.246 . . . . . 0.246 . . . . . . . . . . . . . . . . . . f 2.130 70 . 0.493 0.358 0.380 0.380 0.236 . 0.195 . . . . . . . . . . 0.088 . . . . . . . . . . . . . Q 2.109 98 . 0.497 0.459 . 0.531 0.401 . . . . . . . . . . . . . . . . . . . 0.067 . . 0.154 . . . v 2.093 54 . . 0.382 0.176 . 0.505 . . . . . . . . . . . . . . . . . 0.278 . 0.520 . . . . . 0.232 x 1.953 49 0.512 0.336 . . 0.449 . . . . . . . . . . . 0.188 . . . . . . . . 0.468 . . . . . . Y 1.549 30 . . . . . . 0.490 0.464 . . . . . 0.431 . . . . . . . . . 0.164 . . . . . . . . O 1.000 2 0.500 . . . . . . . . . . . . . . . . . 0.500 . . . . . . . . . . . . . z 1.000 2 . . . . 0.500 0.500 . . . . . . . . . . . . . . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 3.506 7261 0.383 0.323 0.266 0.203 0.317 0.238 0.246 0.223 0.097 0.149 0.129 0.087 0.090 0.271 0.073 0.175 0.208 0.136 0.065 0.053 0.049 0.003 0.084 0.027 0.108 0.069 0.033 0.049 0.046 0.052 0.003 0.075 The contractions "at " -> "A", "om " -> "O" seem harmless. Now the main problems are "s" (often folloed by space), "d" (usually followed by "i", "e", "o"), and "m" (usually followed by "i", "e", "o"). We can condense "is " -> "Z" and "us " -> "S". Since we are at it, let's also condense "ere" -> "R" and "e " -> "3". cat latn.txt \ | sed \ -e 's/$/ /g' \ -e 's/et /E/g' \ -e 's/it /I/g' \ -e 's/am /H/g' \ -e 's/em /M/g' \ -e 's/um /U/g' \ -e 's/is /Z/g' \ -e 's/us /S/g' \ -e 's/e /3/g' \ -e 's/qu/Q/g' \ -e 's/ve/Y/g' \ -e 's/vi/W/g' \ -e 's/ere/R/g' \ -e 's/ $//g' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' iaueonrpclgbshdtmfvxzQREIYWHMUZS3' Digraph counts: TT i a u e o n r p c l g b s h d t m f v x z Q R E I Y W H M U Z S 3 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 735 . 61 60 8 49 9 22 42 25 35 9 6 8 86 7 58 36 35 36 13 . . 41 . 65 . 11 13 . . . . . . i 645 103 4 51 13 20 36 121 4 13 34 36 5 25 27 8 6 33 20 3 4 12 . 3 . 1 1 6 3 10 1 12 2 23 5 a 524 50 8 1 19 13 . 51 16 5 24 44 8 34 29 9 62 67 14 . 18 . . 3 . . 3 5 17 . . . . . 24 u 253 11 14 6 . 9 13 38 26 15 8 25 1 4 7 . 11 22 8 1 1 6 . . . . 8 . . 5 . 8 2 4 . e 506 . 26 2 . . 12 53 116 4 18 19 52 11 61 . 26 31 3 3 1 27 . 3 . . . . . 4 . 21 2 6 5 o 422 70 7 4 . 1 . 88 32 13 28 15 2 5 49 1 12 8 71 . 1 2 . 10 . . . 3 . . . . . . . n 443 81 54 38 17 16 32 4 . 4 8 . 15 . 24 . 17 63 . 4 . 2 . 3 . 1 2 2 3 . 13 11 5 13 11 r 375 45 27 50 20 87 30 6 12 . 4 . 9 1 7 1 14 4 8 2 7 . 1 . 2 1 6 . 4 8 5 3 4 1 6 p 118 . 12 7 8 25 20 . 20 . . 5 . . 7 9 . 3 . . . . . . . . . . . . 1 . . . 1 c 212 23 36 22 21 45 19 . 2 . 7 3 . . . 4 . 5 . . . . . . . 2 . . . . . 17 1 . 5 l 174 10 50 16 4 16 39 . . . 3 12 . . . . 1 9 . . 1 . . . . . . . . 5 1 2 2 3 . g 103 2 16 3 7 2 12 17 9 . . 2 2 . . . . . . . . . . . . . . . . . 11 . 11 . 9 b 108 7 18 17 6 19 7 1 1 . . 1 . . 3 . . . 1 . . . . . . . 8 . . 2 . 1 . 16 . s 392 96 20 71 44 33 15 . 9 7 12 . . . 15 . . 45 . . . . . 5 . 5 3 . . 1 . 1 1 1 8 h 82 3 13 21 3 23 7 . 5 . . . . . 5 . . . . . . . . . 2 . . . . . . . . . . d 267 38 56 23 10 29 78 . 1 1 . . . . . 3 3 . . . . . . . . 1 10 . . 1 2 . . 1 10 t 366 75 41 30 47 30 9 . 17 . . . . . . 34 . . . . . . . 15 . 1 . . . 2 19 4 12 7 23 m 190 5 56 10 6 29 43 9 . 2 . . . 3 . . . 1 2 . . . . 5 . 1 . . . 2 . 1 2 2 11 f 70 . 36 8 9 8 4 . 3 . . . . . . . . . . 1 . . . . 1 . . . . . . . . . . v 55 . . 11 2 . 14 . . . . . . . . . . . . . . . . . . . 24 . . . . 3 1 . . x 49 23 5 . . 9 . . . . . . . . . . . 2 . . . . . . . . 10 . . . . . . . . z 2 . . . . 1 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . Q 98 . 24 19 . 3 14 . . . . . . . . . . . . . . . . . . . 1 . . 3 . . . . 34 R 5 . . . . . . 1 . . . . . . . . . 4 . . . . . . . . . . . . . . . . . E 137 12 23 16 2 6 3 9 6 7 8 1 . 6 15 1 7 1 3 5 1 . . 2 . 1 . 1 1 . . . . . . I 76 6 4 6 4 5 2 1 6 4 5 . . 3 8 3 7 3 3 . 1 . . 1 . 2 . . 2 . . . . . . Y 30 . . 1 . . . 7 17 . . . . . 5 . . . . . . . . . . . . . . . . . . . . W 48 4 . 2 . . . . 8 . 1 . . . . . 16 6 . . 5 . . . . . . . 1 3 . 1 1 . . H 46 7 1 4 2 2 . . 6 1 . . . . 4 1 2 2 3 3 1 . . . . 6 . . 1 . . . . . . M 53 8 4 4 . 1 . . . 3 2 . . 1 8 . 4 2 2 4 . . 1 1 . 8 . . . . . . . . . U 85 15 9 3 . 5 . 4 5 5 2 . 3 . 6 . 6 7 3 3 . . . . . 8 . . 1 . . . . . . Z 46 13 1 1 . 3 . 1 1 4 . . . 3 1 . 4 2 2 . . . . 1 . 8 . . 1 . . . . . . S 77 10 9 6 . 9 1 5 6 2 3 . . . 6 . 6 2 3 2 . . . 1 . 5 . . 1 . . . . . . 3 152 18 10 11 1 8 2 5 5 3 10 2 . 4 19 1 5 8 9 3 1 . . 4 . 21 . 2 . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 6944 735 645 524 253 506 422 443 375 118 212 174 103 108 392 82 267 366 190 70 55 49 2 98 5 137 76 30 48 46 53 85 46 77 152 Next-symbol probability (× 99): TT i a u e o n r p c l g b s h d t m f v x z Q R E I Y W H M U Z S 3 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 99 . 8 8 1 7 1 3 6 3 5 1 1 1 12 1 8 5 5 5 2 . . 6 . 9 . 1 2 . . . . . . i 99 16 1 8 2 3 6 19 1 2 5 6 1 4 4 1 1 5 3 . 1 2 . . . . . 1 . 2 . 2 . 4 1 a 99 9 2 . 4 2 . 10 3 1 5 8 2 6 5 2 12 13 3 . 3 . . 1 . . 1 1 3 . . . . . 5 u 99 4 5 2 . 4 5 15 10 6 3 10 . 2 3 . 4 9 3 . . 2 . . . . 3 . . 2 . 3 1 2 . e 99 . 5 . . . 2 10 23 1 4 4 10 2 12 . 5 6 1 1 . 5 . 1 . . . . . 1 . 4 . 1 1 o 99 16 2 1 . . . 21 8 3 7 4 . 1 11 . 3 2 17 . . . . 2 . . . 1 . . . . . . . n 99 18 12 8 4 4 7 1 . 1 2 . 3 . 5 . 4 14 . 1 . . . 1 . . . . 1 . 3 2 1 3 2 r 99 12 7 13 5 23 8 2 3 . 1 . 2 . 2 . 4 1 2 1 2 . . . 1 . 2 . 1 2 1 1 1 . 2 p 99 . 10 6 7 21 17 . 17 . . 4 . . 6 8 . 3 . . . . . . . . . . . . 1 . . . 1 c 99 11 17 10 10 21 9 . 1 . 3 1 . . . 2 . 2 . . . . . . . 1 . . . . . 8 . . 2 l 99 6 28 9 2 9 22 . . . 2 7 . . . . 1 5 . . 1 . . . . . . . . 3 1 1 1 2 . g 99 2 15 3 7 2 12 16 9 . . 2 2 . . . . . . . . . . . . . . . . . 11 . 11 . 9 b 99 6 17 16 6 17 6 1 1 . . 1 . . 3 . . . 1 . . . . . . . 7 . . 2 . 1 . 15 . s 99 24 5 18 11 8 4 . 2 2 3 . . . 4 . . 11 . . . . . 1 . 1 1 . . . . . . . 2 h 99 4 16 25 4 28 8 . 6 . . . . . 6 . . . . . . . . . 2 . . . . . . . . . . d 99 14 21 9 4 11 29 . . . . . . . . 1 1 . . . . . . . . . 4 . . . 1 . . . 4 t 99 20 11 8 13 8 2 . 5 . . . . . . 9 . . . . . . . 4 . . . . . 1 5 1 3 2 6 m 99 3 29 5 3 15 22 5 . 1 . . . 2 . . . 1 1 . . . . 3 . 1 . . . 1 . 1 1 1 6 f 99 . 51 11 13 11 6 . 4 . . . . . . . . . . 1 . . . . 1 . . . . . . . . . . v 99 . . 20 4 . 25 . . . . . . . . . . . . . . . . . . . 43 . . . . 5 2 . . x 99 46 10 . . 18 . . . . . . . . . . . 4 . . . . . . . . 20 . . . . . . . . z 99 . . . . 50 50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . Q 99 . 24 19 . 3 14 . . . . . . . . . . . . . . . . . . . 1 . . 3 . . . . 34 R 99 . . . . . . 20 . . . . . . . . . 79 . . . . . . . . . . . . . . . . . E 99 9 17 12 1 4 2 7 4 5 6 1 . 4 11 1 5 1 2 4 1 . . 1 . 1 . 1 1 . . . . . . I 99 8 5 8 5 7 3 1 8 5 7 . . 4 10 4 9 4 4 . 1 . . 1 . 3 . . 3 . . . . . . Y 99 . . 3 . . . 23 56 . . . . . 17 . . . . . . . . . . . . . . . . . . . . W 99 8 . 4 . . . . 17 . 2 . . . . . 33 12 . . 10 . . . . . . . 2 6 . 2 2 . . H 99 15 2 9 4 4 . . 13 2 . . . . 9 2 4 4 6 6 2 . . . . 13 . . 2 . . . . . . M 99 15 7 7 . 2 . . . 6 4 . . 2 15 . 7 4 4 7 . . 2 2 . 15 . . . . . . . . . U 99 17 10 3 . 6 . 5 6 6 2 . 3 . 7 . 7 8 3 3 . . . . . 9 . . 1 . . . . . . Z 99 28 2 2 . 6 . 2 2 9 . . . 6 2 . 9 4 4 . . . . 2 . 17 . . 2 . . . . . . S 99 13 12 8 . 12 1 6 8 3 4 . . . 8 . 8 3 4 3 . . . 1 . 6 . . 1 . . . . . . 3 99 12 7 7 1 5 1 3 3 2 7 1 . 3 12 1 3 5 6 2 1 . . 3 . 14 . 1 . . . . . . . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 10 9 7 4 7 6 6 5 2 3 2 1 2 6 1 4 5 3 1 1 1 0 1 0 2 1 0 1 1 1 1 1 1 2 Symbol entropy: 4.502 Next-symbol entropy: TT TT i a u e o n r p c l g b s h d t m f v x z Q R E I Y W H M U Z S 3 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 4.159 735 . 0.298 0.295 0.071 0.260 0.078 0.152 0.236 0.166 0.209 0.078 0.057 0.071 0.362 0.064 0.289 0.213 0.209 0.213 0.103 . . 0.232 . 0.309 . 0.091 0.103 . . . . . . u 4.122 253 0.197 0.231 0.128 . 0.171 0.220 0.411 0.337 0.242 0.158 0.330 0.032 0.095 0.143 . 0.197 0.306 0.158 0.032 0.032 0.128 . . . . 0.158 . . 0.112 . 0.158 0.055 0.095 . I 4.111 76 0.289 0.224 0.289 0.224 0.258 0.138 0.082 0.289 0.224 0.258 . . 0.184 0.342 0.184 0.317 0.184 0.184 . 0.082 . . 0.082 . 0.138 . . 0.138 . . . . . . i 4.089 645 0.423 0.045 0.289 0.114 0.155 0.232 0.453 0.045 0.114 0.224 0.232 0.054 0.182 0.192 0.079 0.063 0.219 0.155 0.036 0.045 0.107 . 0.036 . 0.014 0.014 0.063 0.036 0.093 0.014 0.107 0.026 0.172 0.054 a 4.031 524 0.323 0.092 0.017 0.174 0.132 . 0.327 0.154 0.064 0.204 0.300 0.092 0.256 0.231 0.101 0.364 0.379 0.140 . 0.167 . . 0.043 . . 0.043 0.064 0.160 . . . . . 0.204 3 3.989 152 0.365 0.258 0.274 0.048 0.224 0.082 0.162 0.162 0.112 0.258 0.082 . 0.138 0.375 0.048 0.162 0.224 0.241 0.112 0.048 . . 0.138 . 0.395 . 0.082 . . . . . . . E 3.936 137 0.308 0.432 0.362 0.089 0.198 0.121 0.258 0.198 0.219 0.239 0.052 . 0.198 0.349 0.052 0.219 0.052 0.121 0.174 0.052 . . 0.089 . 0.052 . 0.052 0.052 . . . . . . n 3.872 443 0.448 0.370 0.304 0.181 0.173 0.274 0.061 . 0.061 0.105 . 0.165 . 0.228 . 0.181 0.400 . 0.061 . 0.035 . 0.049 . 0.020 0.035 0.035 0.049 . 0.149 0.132 0.073 0.149 0.132 r 3.850 375 0.367 0.273 0.388 0.226 0.489 0.292 0.095 0.159 . 0.070 . 0.129 0.023 0.107 0.023 0.177 0.070 0.118 0.040 0.107 . 0.023 . 0.040 0.023 0.095 . 0.070 0.118 0.083 0.056 0.070 0.023 0.095 S 3.786 77 0.382 0.362 0.287 . 0.362 0.081 0.256 0.287 0.137 0.182 . . . 0.287 . 0.287 0.137 0.182 0.137 . . . 0.081 . 0.256 . . 0.081 . . . . . . U 3.755 85 0.442 0.343 0.170 . 0.240 . 0.208 0.240 0.240 0.127 . 0.170 . 0.270 . 0.270 0.297 0.170 0.170 . . . . . 0.321 . . 0.075 . . . . . . e 3.698 506 . 0.220 0.032 . . 0.128 0.341 0.487 0.055 0.171 0.178 0.337 0.120 0.368 . 0.220 0.247 0.044 0.044 0.018 0.226 . 0.044 . . . . . 0.055 . 0.191 0.032 0.076 0.066 H 3.694 46 0.413 0.120 0.306 0.197 0.197 . . 0.383 0.120 . . . . 0.306 0.120 0.197 0.197 0.257 0.257 0.120 . . . . 0.383 . . 0.120 . . . . . . M 3.563 53 0.412 0.281 0.281 . 0.108 . . . 0.235 0.178 . . 0.108 0.412 . 0.281 0.178 0.178 0.281 . . 0.108 0.108 . 0.412 . . . . . . . . . t 3.518 366 0.469 0.354 0.296 0.380 0.296 0.131 . 0.206 . . . . . . 0.318 . . . . . . . 0.189 . 0.023 . . . 0.041 0.222 0.071 0.162 0.109 0.251 o 3.368 422 0.430 0.098 0.064 . 0.021 . 0.472 0.282 0.155 0.260 0.171 0.037 0.076 0.361 0.021 0.146 0.108 0.433 . 0.021 0.037 . 0.128 . . . 0.051 . . . . . . . g 3.365 103 0.110 0.417 0.149 0.264 0.110 0.361 0.429 0.307 . . 0.110 0.110 . . . . . . . . . . . . . . . . . 0.345 . 0.345 . 0.307 s 3.336 392 0.497 0.219 0.446 0.354 0.301 0.180 . 0.125 0.104 0.154 . . . 0.180 . . 0.358 . . . . . 0.080 . 0.080 0.054 . . 0.022 . 0.022 0.022 0.022 0.115 Z 3.315 46 0.515 0.120 0.120 . 0.257 . 0.120 0.120 0.306 . . . 0.257 0.120 . 0.306 0.197 0.197 . . . . 0.120 . 0.439 . . 0.120 . . . . . . c 3.306 212 0.348 0.434 0.339 0.330 0.475 0.312 . 0.063 . 0.162 0.087 . . . 0.108 . 0.127 . . . . . . . 0.063 . . . . . 0.292 0.036 . 0.127 b 3.284 108 0.256 0.431 0.420 0.232 0.441 0.256 0.063 0.063 . . 0.063 . . 0.144 . . . 0.063 . . . . . . . 0.278 . . 0.107 . 0.063 . 0.408 . p 3.152 118 . 0.335 0.242 0.263 0.474 0.434 . 0.434 . . 0.193 . . 0.242 0.283 . 0.135 . . . . . . . . . . . . 0.058 . . . 0.058 l 3.108 174 0.237 0.517 0.317 0.125 0.317 0.484 . . . 0.101 0.266 . . . . 0.043 0.221 . . 0.043 . . . . . . . . 0.147 0.043 0.074 0.074 0.101 . m 3.082 190 0.138 0.519 0.224 0.157 0.414 0.485 0.208 . 0.069 . . . 0.094 . . . 0.040 0.069 . . . . 0.138 . 0.040 . . . 0.069 . 0.040 0.069 0.069 0.238 d 2.926 267 0.400 0.473 0.305 0.177 0.348 0.519 . 0.030 0.030 . . . . . 0.073 0.073 . . . . . . . . 0.030 0.177 . . 0.030 0.053 . . 0.030 0.177 W 2.879 48 0.299 . 0.191 . . . . 0.431 . 0.116 . . . . . 0.528 0.375 . . 0.340 . . . . . . . 0.116 0.250 . 0.116 0.116 . . h 2.714 82 0.175 0.421 0.503 0.175 0.514 0.303 . 0.246 . . . . . 0.246 . . . . . . . . . 0.131 . . . . . . . . . . Q 2.262 98 . 0.497 0.459 . 0.154 0.401 . . . . . . . . . . . . . . . . . . . 0.067 . . 0.154 . . . . 0.530 f 2.195 70 . 0.493 0.358 0.380 0.358 0.236 . 0.195 . . . . . . . . . . 0.088 . . . . 0.088 . . . . . . . . . . v 1.997 55 . . 0.464 0.174 . 0.502 . . . . . . . . . . . . . . . . . . . 0.522 . . . . 0.229 0.105 . . x 1.953 49 0.512 0.336 . . 0.449 . . . . . . . . . . . 0.188 . . . . . . . . 0.468 . . . . . . . . Y 1.549 30 . . 0.164 . . . 0.490 0.464 . . . . . 0.431 . . . . . . . . . . . . . . . . . . . . z 1.000 2 . . . . 0.500 0.500 . . . . . . . . . . . . . . . . . . . . . . . . . . . . R 0.722 5 . . . . . . 0.464 . . . . . . . . . 0.258 . . . . . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 3.622 6944 0.343 0.318 0.281 0.174 0.275 0.246 0.253 0.227 0.100 0.154 0.133 0.090 0.093 0.234 0.076 0.181 0.224 0.142 0.067 0.055 0.050 0.003 0.087 0.008 0.112 0.071 0.034 0.050 0.048 0.054 0.078 0.048 0.072 0.121 It seems that "ere" -> "R" is pointless; let's try "er" and "re" instead. Problems still with "p" ("pi", "pe", "po", "pr"), "l" ("li", "lo"), "m" ("mi", "me", "mo"), and "d" ("do", "d ", "di"). Other promising abbeviations are "un", "on" Also "ve" -> "Y" is not enough; "ver" seems more useful. Likewise, we shoudl try "vid" instead of "vi". Finally, "ex", "d ", "t " seem useful. cat latn.txt \ | sed \ -e 's/$/ /g' \ -e 's/et /E/g' \ -e 's/it /I/g' \ -e 's/am /H/g' \ -e 's/em /M/g' \ -e 's/um /U/g' \ -e 's/is /Z/g' \ -e 's/us /S/g' \ -e 's/e /3/g' \ -e 's/d /D/g' \ -e 's/t /T/g' \ -e 's/qu/Q/g' \ -e 's/ex/X/g' \ -e 's/ver/Y/g' \ -e 's/vid/W/g' \ -e 's/re/R/g' \ -e 's/er/K/g' \ -e 's/un/N/g' \ -e 's/on/O/g' \ -e 's/ $//g' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' iaueonrpclgbshdtmfvxzQXYWRKNOEIHMUZS3DT' Digraph counts: TT i a u e o n r p c l g b s h d t m f v x z Q X Y W R K N O E I H M U Z S 3 D T ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 636 . 47 53 4 24 8 18 10 24 28 9 6 5 74 5 52 32 30 35 29 . . 39 2 5 1 23 10 3 . 60 . . . . . . . . . i 692 107 4 53 12 16 30 121 11 13 35 36 5 25 27 8 3 39 20 3 13 12 . 3 . 6 . 1 4 1 6 1 1 13 1 13 3 23 5 18 . a 524 50 8 1 19 11 . 51 16 5 24 44 8 34 29 9 51 43 14 . 35 . . 3 . 5 . . 2 . . . 3 . . . . . 24 11 24 u 215 11 14 6 . 1 13 . 26 15 8 25 1 4 7 . 10 14 8 1 1 6 . . . . . . 8 . . . 8 5 . 8 2 4 . 1 8 e 316 . 26 3 . . 12 60 . 4 18 19 6 11 54 . 18 30 3 3 1 . . 3 . . . 3 . . . . . 4 . 21 2 6 5 4 . o 334 70 7 4 . 1 . . 30 13 28 15 2 5 49 1 8 8 71 . 4 2 . 10 . . . 2 . . . . . . . . . . . 4 . n 317 54 28 33 9 10 19 3 . 3 6 . 14 . 21 . 12 32 . 2 4 . . 3 . . . . 4 5 13 1 2 . 3 7 2 10 9 . 8 r 177 20 20 36 1 . 21 3 4 . 1 . 1 . 1 1 2 3 5 . 2 . . . 23 . . 2 . 1 6 1 . 8 5 3 3 1 3 . . p 118 . 12 7 8 6 15 . 20 . . 5 . . 7 9 . 3 . . . . . . . . . . 19 . 5 . . . 1 . . . 1 . . c 212 23 36 22 20 31 12 . 2 . 7 3 . . . 4 . 5 . . . . . . . . . . 14 1 7 2 . . . 17 1 . 5 . . l 174 10 50 16 4 16 39 . . . 3 12 . . . . 1 8 . . 1 . . . . . . . . . . . . 5 1 2 2 3 . . 1 g 103 2 16 3 7 1 12 17 1 . . 2 2 . . . . . . . . . . . . . . 8 1 . . . . . 11 . 11 . 9 . . b 108 7 18 17 6 17 5 1 1 . . 1 . . 3 . . . 1 . . . . . . . . . 2 . 2 . 8 2 . 1 . 16 . . . s 392 96 20 71 40 21 13 . 9 7 12 . . . 15 . . 28 . . . . . 5 . . . . 12 4 2 5 3 1 . 1 1 1 8 . 17 h 82 3 13 21 3 23 7 . 5 . . . . . 5 . . . . . . . . . . . . . 2 . . . . . . . . . . . . d 228 . 56 23 10 24 63 . 1 1 . . . . . 3 3 . . . . . . . . . . . 4 . 15 1 10 1 2 . . 1 10 . . t 291 . 41 30 47 17 9 . 16 . . . . . . 34 . . . . . . . 15 . . . 1 13 . . 1 . 2 19 4 12 7 23 . . m 190 5 56 10 6 29 12 9 . 2 . . . 3 . . . 1 2 . . . . 5 . . . . . . 31 1 . 2 . 1 2 2 11 . . f 70 . 36 8 9 7 3 . 3 . . . . . . . . . . 1 . . . . . . . . 2 . 1 . . . . . . . . . . v 115 . 47 11 2 13 14 . . . . . . . . . . . . . . . . . . . . . . . . . 24 . . 3 1 . . . . x 22 2 4 . . . . . . . . . . . . . . 2 . . . . . . . . . . 5 . . . 9 . . . . . . . . z 2 . . . . 1 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Q 98 . 24 19 . 3 14 . . . . . . . . . . . . . . . . . . . . . . . . . 1 3 . . . . 34 . . X 27 21 1 . . . . . . . . . . . . . . . . . . . . . . . . . 4 . . . 1 . . . . . . . . Y 17 . 2 1 1 . 2 . . . . . . 1 6 . . 1 . . . . . . . . . . . 2 . . 1 . . . . . . . . W 1 . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . R 71 . . . . . . 1 1 . . . 46 . 12 . 4 5 . . . . . . . . . 2 . . . . . . . . . . . . . K 115 25 5 13 2 . 1 3 6 . 3 . 8 . . . 12 . 3 2 9 . 1 . . . . . . 13 . . 5 . . . 1 . 3 . . N 38 . 6 2 1 . . . . . 2 . 1 . . . 1 5 . . . 2 . . . . . . . . . . . . . . . 1 . . 17 O 88 27 20 3 2 2 . 1 . 1 . . . . 3 . 4 1 . 2 1 . . . . . . . . . . . . . 10 4 3 2 2 . . E 137 12 23 16 . 6 3 9 4 7 8 1 . 6 15 1 7 1 3 5 3 . . 2 . . . 2 . 2 . 1 . . . . . . . . . I 76 6 4 6 . 3 2 1 3 4 5 . . 3 8 3 7 3 3 . 3 . . 1 . . . 3 2 4 . 2 . . . . . . . . . H 46 7 1 4 1 1 . . 1 1 . . . . 4 1 2 2 3 3 2 . . . . . . 5 1 1 . 6 . . . . . . . . . M 53 8 4 4 . 1 . . . 3 2 . . 1 8 . 4 2 2 4 . . 1 1 . . . . . . . 8 . . . . . . . . . U 85 15 9 3 . 4 . 4 . 5 2 . 3 . 6 . 6 7 3 3 1 . . . . . . 5 1 . . 8 . . . . . . . . . Z 46 13 1 1 . 2 . 1 . 4 . . . 3 1 . 4 2 2 . 1 . . 1 . . . 1 1 . . 8 . . . . . . . . . S 77 10 9 6 . 8 1 5 2 2 3 . . . 6 . 6 2 3 2 1 . . 1 1 . . 4 . . . 5 . . . . . . . . . 3 152 18 10 11 . 6 2 5 2 3 10 2 . 4 19 1 5 8 9 3 2 . . 4 1 1 . 3 1 1 . 21 . . . . . . . . . D 38 4 3 1 1 1 . 2 . . 2 . . 1 4 1 2 1 1 . 1 . . 2 . . . 5 1 . . 5 . . . . . . . . . T 75 10 11 6 . 9 1 2 3 1 5 . . 2 8 1 4 3 4 1 1 . . . . . . 1 2 . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 6558 636 692 524 215 316 334 317 177 118 212 174 103 108 392 82 228 291 190 70 115 22 2 98 27 17 1 71 115 38 88 137 76 46 53 85 46 77 152 38 75 Next-symbol probability (× 99): TT i a u e o n r p c l g b s h d t m f v x z Q X Y W R K N O E I H M U Z S 3 D T -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 99 . 7 8 1 4 1 3 2 4 4 1 1 1 12 1 8 5 5 5 5 . . 6 . 1 . 4 2 . . 9 . . . . . . . . . i 99 15 1 8 2 2 4 17 2 2 5 5 1 4 4 1 . 6 3 . 2 2 . . . 1 . . 1 . 1 . . 2 . 2 . 3 1 3 . a 99 9 2 . 4 2 . 10 3 1 5 8 2 6 5 2 10 8 3 . 7 . . 1 . 1 . . . . . . 1 . . . . . 5 2 5 u 99 5 6 3 . . 6 . 12 7 4 12 . 2 3 . 5 6 4 . . 3 . . . . . . 4 . . . 4 2 . 4 1 2 . . 4 e 99 . 8 1 . . 4 19 . 1 6 6 2 3 17 . 6 9 1 1 . . . 1 . . . 1 . . . . . 1 . 7 1 2 2 1 . o 99 21 2 1 . . . . 9 4 8 4 1 1 15 . 2 2 21 . 1 1 . 3 . . . 1 . . . . . . . . . . . 1 . n 99 17 9 10 3 3 6 1 . 1 2 . 4 . 7 . 4 10 . 1 1 . . 1 . . . . 1 2 4 . 1 . 1 2 1 3 3 . 2 r 99 11 11 20 1 . 12 2 2 . 1 . 1 . 1 1 1 2 3 . 1 . . . 13 . . 1 . 1 3 1 . 4 3 2 2 1 2 . . p 99 . 10 6 7 5 13 . 17 . . 4 . . 6 8 . 3 . . . . . . . . . . 16 . 4 . . . 1 . . . 1 . . c 99 11 17 10 9 14 6 . 1 . 3 1 . . . 2 . 2 . . . . . . . . . . 7 . 3 1 . . . 8 . . 2 . . l 99 6 28 9 2 9 22 . . . 2 7 . . . . 1 5 . . 1 . . . . . . . . . . . . 3 1 1 1 2 . . 1 g 99 2 15 3 7 1 12 16 1 . . 2 2 . . . . . . . . . . . . . . 8 1 . . . . . 11 . 11 . 9 . . b 99 6 17 16 6 16 5 1 1 . . 1 . . 3 . . . 1 . . . . . . . . . 2 . 2 . 7 2 . 1 . 15 . . . s 99 24 5 18 10 5 3 . 2 2 3 . . . 4 . . 7 . . . . . 1 . . . . 3 1 1 1 1 . . . . . 2 . 4 h 99 4 16 25 4 28 8 . 6 . . . . . 6 . . . . . . . . . . . . . 2 . . . . . . . . . . . . d 99 . 24 10 4 10 27 . . . . . . . . 1 1 . . . . . . . . . . . 2 . 7 . 4 . 1 . . . 4 . . t 99 . 14 10 16 6 3 . 5 . . . . . . 12 . . . . . . . 5 . . . . 4 . . . . 1 6 1 4 2 8 . . m 99 3 29 5 3 15 6 5 . 1 . . . 2 . . . 1 1 . . . . 3 . . . . . . 16 1 . 1 . 1 1 1 6 . . f 99 . 51 11 13 10 4 . 4 . . . . . . . . . . 1 . . . . . . . . 3 . 1 . . . . . . . . . . v 99 . 40 9 2 11 12 . . . . . . . . . . . . . . . . . . . . . . . . . 21 . . 3 1 . . . . x 99 9 18 . . . . . . . . . . . . . . 9 . . . . . . . . . . 23 . . . 41 . . . . . . . . z 99 . . . . 50 50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Q 99 . 24 19 . 3 14 . . . . . . . . . . . . . . . . . . . . . . . . . 1 3 . . . . 34 . . X 99 77 4 . . . . . . . . . . . . . . . . . . . . . . . . . 15 . . . 4 . . . . . . . . Y 99 . 12 6 6 . 12 . . . . . . 6 35 . . 6 . . . . . . . . . . . 12 . . 6 . . . . . . . . W 99 . . . . 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . R 99 . . . . . . 1 1 . . . 64 . 17 . 6 7 . . . . . . . . . 3 . . . . . . . . . . . . . K 99 22 4 11 2 . 1 3 5 . 3 . 7 . . . 10 . 3 2 8 . 1 . . . . . . 11 . . 4 . . . 1 . 3 . . N 99 . 16 5 3 . . . . . 5 . 3 . . . 3 13 . . . 5 . . . . . . . . . . . . . . . 3 . . 44 O 99 30 23 3 2 2 . 1 . 1 . . . . 3 . 5 1 . 2 1 . . . . . . . . . . . . . 11 5 3 2 2 . . E 99 9 17 12 . 4 2 7 3 5 6 1 . 4 11 1 5 1 2 4 2 . . 1 . . . 1 . 1 . 1 . . . . . . . . . I 99 8 5 8 . 4 3 1 4 5 7 . . 4 10 4 9 4 4 . 4 . . 1 . . . 4 3 5 . 3 . . . . . . . . . H 99 15 2 9 2 2 . . 2 2 . . . . 9 2 4 4 6 6 4 . . . . . . 11 2 2 . 13 . . . . . . . . . M 99 15 7 7 . 2 . . . 6 4 . . 2 15 . 7 4 4 7 . . 2 2 . . . . . . . 15 . . . . . . . . . U 99 17 10 3 . 5 . 5 . 6 2 . 3 . 7 . 7 8 3 3 1 . . . . . . 6 1 . . 9 . . . . . . . . . Z 99 28 2 2 . 4 . 2 . 9 . . . 6 2 . 9 4 4 . 2 . . 2 . . . 2 2 . . 17 . . . . . . . . . S 99 13 12 8 . 10 1 6 3 3 4 . . . 8 . 8 3 4 3 1 . . 1 1 . . 5 . . . 6 . . . . . . . . . 3 99 12 7 7 . 4 1 3 1 2 7 1 . 3 12 1 3 5 6 2 1 . . 3 1 1 . 2 1 1 . 14 . . . . . . . . . D 99 10 8 3 3 3 . 5 . . 5 . . 3 10 3 5 3 3 . 3 . . 5 . . . 13 3 . . 13 . . . . . . . . . T 99 13 15 8 . 12 1 3 4 1 7 . . 3 11 1 5 4 5 1 1 . . . . . . 1 3 . . . . . . . . . . . . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 10 10 8 3 5 5 5 3 2 3 3 2 2 6 1 3 4 3 1 2 0 0 1 0 0 0 1 2 1 1 2 1 1 1 1 1 1 2 1 1 Symbol entropy: 4.733 Next-symbol entropy: TT TT i a u e o n r p c l g b s h d t m f v x z Q X Y W R K N O E I H M U Z S 3 D T ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- u 4.273 215 0.219 0.257 0.144 . 0.036 0.245 . 0.369 0.268 0.177 0.361 0.036 0.107 0.161 . 0.206 0.257 0.177 0.036 0.036 0.144 . . . . . . 0.177 . . . 0.177 0.126 . 0.177 0.063 0.107 . 0.036 0.177 i 4.254 692 0.416 0.043 0.284 0.101 0.126 0.196 0.440 0.095 0.108 0.218 0.222 0.051 0.173 0.183 0.074 0.034 0.234 0.148 0.034 0.108 0.101 . 0.034 . 0.059 . 0.014 0.043 0.014 0.059 0.014 0.014 0.108 0.014 0.108 0.034 0.163 0.051 0.137 . 4.240 636 . 0.278 0.299 0.046 0.178 0.079 0.146 0.094 0.178 0.198 0.087 0.063 0.055 0.361 0.055 0.295 0.217 0.208 0.230 0.203 . . 0.247 0.026 0.055 0.015 0.173 0.094 0.036 . 0.321 . . . . . . . . . I 4.217 76 0.289 0.224 0.289 . 0.184 0.138 0.082 0.184 0.224 0.258 . . 0.184 0.342 0.184 0.317 0.184 0.184 . 0.184 . . 0.082 . . . 0.184 0.138 0.224 . 0.138 . . . . . . . . . a 4.180 524 0.323 0.092 0.017 0.174 0.117 . 0.327 0.154 0.064 0.204 0.300 0.092 0.256 0.231 0.101 0.327 0.296 0.140 . 0.261 . . 0.043 . 0.064 . . 0.031 . . . 0.043 . . . . . 0.204 0.117 0.204 n 4.130 317 0.435 0.309 0.340 0.146 0.157 0.243 0.064 . 0.064 0.108 . 0.199 . 0.259 . 0.179 0.334 . 0.046 0.080 . . 0.064 . . . . 0.080 0.094 0.189 0.026 0.046 . 0.064 0.121 0.046 0.157 0.146 . 0.134 3 4.077 152 0.365 0.258 0.274 . 0.184 0.082 0.162 0.082 0.112 0.258 0.082 . 0.138 0.375 0.048 0.162 0.224 0.241 0.112 0.082 . . 0.138 0.048 0.048 . 0.112 0.048 0.048 . 0.395 . . . . . . . . . E 3.942 137 0.308 0.432 0.362 . 0.198 0.121 0.258 0.149 0.219 0.239 0.052 . 0.198 0.349 0.052 0.219 0.052 0.121 0.174 0.121 . . 0.089 . . . 0.089 . 0.089 . 0.052 . . . . . . . . . S 3.916 77 0.382 0.362 0.287 . 0.339 0.081 0.256 0.137 0.137 0.182 . . . 0.287 . 0.287 0.137 0.182 0.137 0.081 . . 0.081 0.081 . . 0.222 . . . 0.256 . . . . . . . . . D 3.880 38 0.342 0.289 0.138 0.138 0.138 . 0.224 . . 0.224 . . 0.138 0.342 0.138 0.224 0.138 0.138 . 0.138 . . 0.224 . . . 0.385 0.138 . . 0.385 . . . . . . . . . H 3.822 46 0.413 0.120 0.306 0.120 0.120 . . 0.120 0.120 . . . . 0.306 0.120 0.197 0.197 0.257 0.257 0.197 . . . . . . 0.348 0.120 0.120 . 0.383 . . . . . . . . . U 3.797 85 0.442 0.343 0.170 . 0.208 . 0.208 . 0.240 0.127 . 0.170 . 0.270 . 0.270 0.297 0.170 0.170 0.075 . . . . . . 0.240 0.075 . . 0.321 . . . . . . . . . T 3.796 75 0.388 0.406 0.292 . 0.367 0.083 0.139 0.186 0.083 0.260 . . 0.139 0.344 0.083 0.226 0.186 0.226 0.083 0.083 . . . . . . 0.083 0.139 . . . . . . . . . . . . e 3.775 316 . 0.296 0.064 . . 0.179 0.455 . 0.080 0.235 0.244 0.109 0.169 0.436 . 0.235 0.322 0.064 0.064 0.026 . . 0.064 . . . 0.064 . . . . . 0.080 . 0.260 0.046 0.109 0.095 0.080 . r 3.763 177 0.355 0.355 0.467 0.042 . 0.365 0.100 0.124 . 0.042 . 0.042 . 0.042 0.042 0.073 0.100 0.145 . 0.073 . . . 0.383 . . 0.073 . 0.042 0.166 0.042 . 0.202 0.145 0.100 0.100 0.042 0.100 . . K 3.632 115 0.479 0.197 0.356 0.102 . 0.060 0.137 0.222 . 0.137 . 0.268 . . . 0.340 . 0.137 0.102 0.288 . 0.060 . . . . . . 0.356 . . 0.197 . . . 0.060 . 0.137 . . t 3.625 291 . 0.398 0.338 0.425 0.239 0.155 . 0.230 . . . . . . 0.362 . . . . . . . 0.221 . . . 0.028 0.200 . . 0.028 . 0.049 0.257 0.085 0.190 0.129 0.289 . . c 3.608 212 0.348 0.434 0.339 0.321 0.406 0.235 . 0.063 . 0.162 0.087 . . . 0.108 . 0.127 . . . . . . . . . . 0.259 0.036 0.162 0.063 . . . 0.292 0.036 . 0.127 . . s 3.596 392 0.497 0.219 0.446 0.336 0.226 0.163 . 0.125 0.104 0.154 . . . 0.180 . . 0.272 . . . . . 0.080 . . . . 0.154 0.067 0.039 0.080 0.054 0.022 . 0.022 0.022 0.022 0.115 . 0.196 M 3.563 53 0.412 0.281 0.281 . 0.108 . . . 0.235 0.178 . . 0.108 0.412 . 0.281 0.178 0.178 0.281 . . 0.108 0.108 . . . . . . . 0.412 . . . . . . . . . p 3.458 118 . 0.335 0.242 0.263 0.219 0.378 . 0.434 . . 0.193 . . 0.242 0.283 . 0.135 . . . . . . . . . . 0.424 . 0.193 . . . 0.058 . . . 0.058 . . g 3.429 103 0.110 0.417 0.149 0.264 0.065 0.361 0.429 0.065 . . 0.110 0.110 . . . . . . . . . . . . . . 0.286 0.065 . . . . . 0.345 . 0.345 . 0.307 . . b 3.426 108 0.256 0.431 0.420 0.232 0.420 0.205 0.063 0.063 . . 0.063 . . 0.144 . . . 0.063 . . . . . . . . . 0.107 . 0.107 . 0.278 0.107 . 0.063 . 0.408 . . . o 3.378 334 0.472 0.117 0.076 . 0.025 . . 0.312 0.182 0.300 0.201 0.044 0.091 0.406 0.025 0.129 0.129 0.475 . 0.076 0.044 . 0.152 . . . 0.044 . . . . . . . . . . . 0.076 . Z 3.374 46 0.515 0.120 0.120 . 0.197 . 0.120 . 0.306 . . . 0.257 0.120 . 0.306 0.197 0.197 . 0.120 . . 0.120 . . . 0.120 0.120 . . 0.439 . . . . . . . . . m 3.275 190 0.138 0.519 0.224 0.157 0.414 0.252 0.208 . 0.069 . . . 0.094 . . . 0.040 0.069 . . . . 0.138 . . . . . . 0.427 0.040 . 0.069 . 0.040 0.069 0.069 0.238 . . O 3.183 88 0.523 0.486 0.166 0.124 0.124 . 0.073 . 0.073 . . . . 0.166 . 0.203 0.073 . 0.124 0.073 . . . . . . . . . . . . . 0.357 0.203 0.166 0.124 0.124 . . l 3.134 174 0.237 0.517 0.317 0.125 0.317 0.484 . . . 0.101 0.266 . . . . 0.043 0.204 . . 0.043 . . . . . . . . . . . . 0.147 0.043 0.074 0.074 0.101 . . 0.043 d 3.036 228 . 0.497 0.334 0.198 0.342 0.513 . 0.034 0.034 . . . . . 0.082 0.082 . . . . . . . . . . . 0.102 . 0.258 0.034 0.198 0.034 0.060 . . 0.034 0.198 . . Y 2.822 17 . 0.363 0.240 0.240 . 0.363 . . . . . . 0.240 0.530 . . 0.240 . . . . . . . . . . . 0.363 . . 0.240 . . . . . . . . h 2.714 82 0.175 0.421 0.503 0.175 0.514 0.303 . 0.246 . . . . . 0.246 . . . . . . . . . . . . . 0.131 . . . . . . . . . . . . N 2.548 38 . 0.420 0.224 0.138 . . . . . 0.224 . 0.138 . . . 0.138 0.385 . . . 0.224 . . . . . . . . . . . . . . . 0.138 . . 0.519 v 2.347 115 . 0.528 0.324 0.102 0.356 0.370 . . . . . . . . . . . . . . . . . . . . . . . . . 0.472 . . 0.137 0.060 . . . . f 2.275 70 . 0.493 0.358 0.380 0.332 0.195 . 0.195 . . . . . . . . . . 0.088 . . . . . . . . 0.147 . 0.088 . . . . . . . . . . Q 2.262 98 . 0.497 0.459 . 0.154 0.401 . . . . . . . . . . . . . . . . . . . . . . . . . 0.067 0.154 . . . . 0.530 . . x 2.089 22 0.314 0.447 . . . . . . . . . . . . . . 0.314 . . . . . . . . . . 0.486 . . . 0.528 . . . . . . . . R 1.661 71 . . . . . . 0.087 0.087 . . . 0.406 . 0.433 . 0.234 0.270 . . . . . . . . . 0.145 . . . . . . . . . . . . . X 1.042 27 0.282 0.176 . . . . . . . . . . . . . . . . . . . . . . . . . 0.408 . . . 0.176 . . . . . . . . z 1.000 2 . . . . 0.500 0.500 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . W 0.000 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 3.695 6558 0.326 0.342 0.291 0.162 0.211 0.219 0.211 0.141 0.104 0.160 0.139 0.094 0.098 0.243 0.079 0.168 0.199 0.148 0.070 0.102 0.028 0.004 0.091 0.033 0.022 0.002 0.071 0.102 0.043 0.083 0.117 0.075 0.050 0.056 0.081 0.050 0.075 0.126 0.043 0.074 It seems that "vid" is useless, presumably because it should have been "vid " but was preempted by "d ". It seems that "ex" should have been "ex ", and "re" should be "reg". Other promising abbreviations are "fi" and "xit ". Also " et " deserves some special treatment. (We must be careful to preserve the preceding space, so as not to hinder other pattern matches.) cat latn.txt \ | sed \ -e 's/$/ /g' \ -e 's/ et / +/g' \ -e 's/vid /W/g' \ -e 's/xit /C/g' \ -e 's/ex /X/g' \ -e 's/et /E/g' \ -e 's/it /I/g' \ -e 's/am /H/g' \ -e 's/em /M/g' \ -e 's/um /U/g' \ -e 's/is /Z/g' \ -e 's/us /S/g' \ -e 's/e /3/g' \ -e 's/d /D/g' \ -e 's/t /T/g' \ -e 's/ver/Y/g' \ -e 's/reg/G/g' \ -e 's/qu/Q/g' \ -e 's/fi/F/g' \ -e 's/er/K/g' \ -e 's/un/N/g' \ -e 's/on/O/g' \ -e 's/ $//g' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' iaueonrpclgbshdtmfvxz+WCXEIHMUZS3DTYGQFKNO' Digraph counts: TT i a u e o n r p c l g b s h d t m f v x z + W C X E I H M U Z S 3 D T Y G Q F K N O ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 619 . 44 52 4 26 8 18 12 23 27 9 6 5 72 5 47 31 30 15 30 . . 44 . . . 15 . . . . . . . . . 4 21 38 20 10 3 . i 642 107 4 53 12 15 30 119 11 13 30 9 5 25 27 8 4 39 20 . 13 5 . . . 7 . 1 1 13 1 13 3 23 5 3 . 6 . 3 3 4 1 6 a 524 50 8 1 19 11 . 51 16 5 24 44 8 34 29 9 51 43 14 . 20 . . . 15 . . . 3 . . . . . 24 11 24 5 . 3 . 2 . . u 215 11 14 6 . 1 13 . 26 15 8 25 1 4 7 . 10 14 8 1 1 5 . . . 1 . . 8 5 . 8 2 4 . 1 8 . . . . 8 . . e 341 . 26 3 . . 12 61 . 4 18 19 6 11 66 . 22 35 3 2 1 5 . . . 1 . . . 4 . 21 2 6 5 4 . . . 3 1 . . . o 334 70 7 4 . 1 . . 32 13 28 15 2 5 49 1 8 8 71 . 4 2 . . . . . . . . . . . . . 4 . . . 10 . . . . n 317 54 28 33 9 10 19 3 . 3 6 . 14 . 21 . 12 32 . 2 4 . . . . . . 1 2 . 3 7 2 10 9 . 8 . . 3 . 4 5 13 r 196 20 20 36 1 19 21 3 6 . 1 . 1 . 1 1 2 3 5 . 2 . . . . . 21 1 . 8 5 3 3 1 3 . . . . . . 3 . 6 p 118 . 12 7 8 6 15 . 20 . . 5 . . 7 9 . 3 . . . . . . . . . . . . 1 . . . 1 . . . . . . 19 . 5 c 212 23 36 22 20 31 12 . 2 . 7 3 . . . 4 . 5 . . . . . . . . . 2 . . . 17 1 . 5 . . . . . . 14 1 7 l 174 10 50 16 4 16 39 . . . 3 12 . . . . 1 8 . . 1 . . . . . . . . 5 1 2 2 3 . . 1 . . . . . . . g 57 2 12 3 7 1 12 5 9 . . 2 2 . . . . . . . . . . . . . . . . . . . . . 1 . . . . . . 1 . . b 108 7 18 17 6 17 5 1 1 . . 1 . . 3 . . . 1 . . . . . . . . . 8 2 . 1 . 16 . . . . . . . 2 . 2 s 392 96 20 71 40 21 13 . 9 7 12 . . . 15 . . 28 . . . . . . . . . 5 3 1 . 1 1 1 8 . 17 . . 5 . 12 4 2 h 82 3 13 21 3 21 7 . 5 . . . . . 5 . . . . . . . . . . . . . . . . . . . . . . . . . . 4 . . d 229 . 56 23 10 25 63 . 1 1 . . . . . 3 3 . . . . . . . . . . 1 10 1 2 . . 1 10 . . . . . . 4 . 15 t 291 . 41 30 47 17 9 . 17 . . . . . . 34 . . . . . . . . . . . 1 . 2 19 4 12 7 23 . . . . 15 . 13 . . m 190 5 56 10 6 29 12 9 . 2 . . . 3 . . . 1 2 . . . . . . . . 1 . 2 . 1 2 2 11 . . . . 5 . . . 31 f 34 . . 8 9 6 3 . 3 . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . 3 . 1 v 101 . 33 11 2 13 14 . . . . . . . . . . . . . . . . . . . . . 24 . . 3 1 . . . . . . . . . . . x 18 2 5 . . . . . . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . 9 . . z 2 . . . . 1 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . + 109 12 21 11 . 4 2 6 3 6 6 1 . 6 13 1 5 . 1 3 3 . . . . . . . . . . . . . . . . . . 2 2 . 1 . W 15 2 1 . 1 . . 1 . . 1 . . . 2 1 2 . . . 1 . . 2 . . . . . . . . . . . . . . 1 . . . . . C 10 . 1 2 . 1 1 1 . . . . . . 1 . . . 1 . . . . 1 . . . . . . . . . . . . . . . 1 . . . . X 21 4 3 1 . . . . . 1 1 . . . 2 . 5 1 . . . . . 1 . . . . . . . . . . . . . 1 . 1 . . . . E 28 . 2 5 . 2 1 3 3 1 2 . . . 2 . 2 1 2 . . . . 1 . . . . . . . . . . . . . . . . . . 1 . I 66 6 3 4 . 2 1 . 3 4 5 . . 3 7 3 7 3 2 . 3 . . 1 . . . . . . . . . . . . . . 3 . . 2 4 . H 46 7 1 4 1 1 . . 1 1 . . . . 4 1 2 2 3 . 2 . . 6 . . . . . . . . . . . . . . 5 . 3 1 1 . M 53 8 4 4 . 1 . . . 3 2 . . 1 8 . 4 2 2 2 . . 1 8 . . . . . . . . . . . . . . . 1 2 . . . U 85 15 9 3 . 4 . 4 . 5 2 . 3 . 6 . 6 7 3 2 1 . . 8 . . . . . . . . . . . . . . 5 . 1 1 . . Z 46 13 1 1 . 2 . 1 1 4 . . . 3 1 . 4 2 2 . 1 . . 8 . . . . . . . . . . . . . . . 1 . 1 . . S 77 10 9 6 . 9 1 5 2 2 3 . . . 6 . 6 2 3 2 1 . . 5 . . . . . . . . . . . . . . 4 1 . . . . 3 152 18 10 11 . 7 2 5 3 3 10 2 . 4 19 1 5 8 9 3 2 . . 21 . . . . . . . . . . . . . 1 2 4 . 1 1 . D 23 2 2 1 . 1 . 1 . . 1 . . 1 2 . . 1 1 . . . . 3 . . . . . . . . . . . . . . 4 2 . 1 . . T 75 10 11 6 . 9 1 2 3 1 5 . . 2 8 1 4 3 4 . 1 . . . . . . . . . . . . . . . . . 1 . 1 2 . . Y 17 . 2 1 1 . 2 . . . . . . 1 6 . . 1 . . . . . . . . . . 1 . . . . . . . . . . . . . 2 . G 46 . 4 . . . . 12 . . . . . . . . . . . . . . . . . . . . . . 11 . 11 . 8 . . . . . . . . . Q 98 . 24 19 . 3 14 . . . . . . . . . . . . . . . . . . . . . 1 3 . . . . 34 . . . . . . . . . F 36 . . . . 1 . 2 1 . 5 27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . K 121 25 5 13 2 5 1 3 6 . 3 . 8 . . . 12 . 3 . 9 . 1 . . . . . 5 . . . 1 . 3 . . . . . 2 . 14 . N 38 . 6 2 1 . . . . . 2 . 1 . . . 1 5 . . . 1 . . . 1 . . . . . . . 1 . . 17 . . . . . . . O 88 27 20 3 2 2 . 1 . 1 . . . . 3 . 4 1 . 1 1 . . . . . . . . . 10 4 3 2 2 . . . . . 1 . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 6446 619 642 524 215 341 334 317 196 118 212 174 57 108 392 82 229 291 190 34 101 18 2 109 15 10 21 28 66 46 53 85 46 77 152 23 75 17 46 98 36 121 38 88 Next-symbol probability (× 99): ntrpy i a u e o n r p c l g b s h d t m f v x z + W C X E I H M U Z S 3 D T Y G Q F K N O ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 4.357 . 7 8 1 4 1 3 2 4 4 1 1 1 12 1 8 5 5 2 5 . . 7 . . . 2 . . . . . . . . . 1 3 6 3 2 . . u 4.291 5 6 3 . . 6 . 12 7 4 12 . 2 3 . 5 6 4 . . 2 . . . . . . 4 2 . 4 1 2 . . 4 . . . . 4 . . a 4.246 9 2 . 4 2 . 10 3 1 5 8 2 6 5 2 10 8 3 . 4 . . . 3 . . . 1 . . . . . 5 2 5 1 . 1 . . . . i 4.196 17 1 8 2 2 5 18 2 2 5 1 1 4 4 1 1 6 3 . 2 1 . . . 1 . . . 2 . 2 . 4 1 . . 1 . . . 1 . 1 n 4.130 17 9 10 3 3 6 1 . 1 2 . 4 . 7 . 4 10 . 1 1 . . . . . . . 1 . 1 2 1 3 3 . 2 . . 1 . 1 2 4 I 4.079 9 5 6 . 3 2 . 5 6 8 . . 5 11 5 11 5 3 . 5 . . 2 . . . . . . . . . . . . . . 5 . . 3 6 . 3 4.049 12 7 7 . 5 1 3 2 2 7 1 . 3 12 1 3 5 6 2 1 . . 14 . . . . . . . . . . . . . 1 1 3 . 1 1 . r 3.865 10 10 18 1 10 11 2 3 . 1 . 1 . 1 1 1 2 3 . 1 . . . . . 11 1 . 4 3 2 2 1 2 . . . . . . 2 . 3 S 3.857 13 12 8 . 12 1 6 3 3 4 . . . 8 . 8 3 4 3 1 . . 6 . . . . . . . . . . . . . . 5 1 . . . . U 3.830 17 10 3 . 5 . 5 . 6 2 . 3 . 7 . 7 8 3 2 1 . . 9 . . . . . . . . . . . . . . 6 . 1 1 . . H 3.822 15 2 9 2 2 . . 2 2 . . . . 9 2 4 4 6 . 4 . . 13 . . . . . . . . . . . . . . 11 . 6 2 2 . + 3.802 11 19 10 . 4 2 5 3 5 5 1 . 5 12 1 5 . 1 3 3 . . . . . . . . . . . . . . . . . . 2 2 . 1 . T 3.796 13 15 8 . 12 1 3 4 1 7 . . 3 11 1 5 4 5 . 1 . . . . . . . . . . . . . . . . . 1 . 1 3 . . e 3.762 . 8 1 . . 3 18 . 1 5 6 2 3 19 . 6 10 1 1 . 1 . . . . . . . 1 . 6 1 2 1 1 . . . 1 . . . . K 3.725 20 4 11 2 4 1 2 5 . 2 . 7 . . . 10 . 2 . 7 . 1 . . . . . 4 . . . 1 . 2 . . . . . 2 . 11 . M 3.638 15 7 7 . 2 . . . 6 4 . . 2 15 . 7 4 4 4 . . 2 15 . . . . . . . . . . . . . . . 2 4 . . . E 3.625 . 7 18 . 7 4 11 11 4 7 . . . 7 . 7 4 7 . . . . 4 . . . . . . . . . . . . . . . . . . 4 . D 3.621 9 9 4 . 4 . 4 . . 4 . . 4 9 . . 4 4 . . . . 13 . . . . . . . . . . . . . . 17 9 . 4 . . c 3.608 11 17 10 9 14 6 . 1 . 3 1 . . . 2 . 2 . . . . . . . . . 1 . . . 8 . . 2 . . . . . . 7 . 3 t 3.606 . 14 10 16 6 3 . 6 . . . . . . 12 . . . . . . . . . . . . . 1 6 1 4 2 8 . . . . 5 . 4 . . s 3.596 24 5 18 10 5 3 . 2 2 3 . . . 4 . . 7 . . . . . . . . . 1 1 . . . . . 2 . 4 . . 1 . 3 1 1 p 3.458 . 10 6 7 5 13 . 17 . . 4 . . 6 8 . 3 . . . . . . . . . . . . 1 . . . 1 . . . . . . 16 . 4 b 3.426 6 17 16 6 16 5 1 1 . . 1 . . 3 . . . 1 . . . . . . . . . 7 2 . 1 . 15 . . . . . . . 2 . 2 W 3.374 13 7 . 7 . . 7 . . 7 . . . 13 7 13 . . . 7 . . 13 . . . . . . . . . . . . . . 7 . . . . . Z 3.374 28 2 2 . 4 . 2 2 9 . . . 6 2 . 9 4 4 . 2 . . 17 . . . . . . . . . . . . . . . 2 . 2 . . o 3.346 21 2 1 . . . . 9 4 8 4 1 1 15 . 2 2 21 . 1 1 . . . . . . . . . . . . . 1 . . . 3 . . . . m 3.275 3 29 5 3 15 6 5 . 1 . . . 2 . . . 1 1 . . . . . . . . 1 . 1 . 1 1 1 6 . . . . 3 . . . 16 O 3.206 30 23 3 2 2 . 1 . 1 . . . . 3 . 5 1 . 1 1 . . . . . . . . . 11 5 3 2 2 . . . . . 1 . . . X 3.137 19 14 5 . . . . . 5 5 . . . 9 . 24 5 . . . . . 5 . . . . . . . . . . . . . 5 . 5 . . . . l 3.134 6 28 9 2 9 22 . . . 2 7 . . . . 1 5 . . 1 . . . . . . . . 3 1 1 1 2 . . 1 . . . . . . . C 3.122 . 10 20 . 10 10 10 . . . . . . 10 . . . 10 . . . . 10 . . . . . . . . . . . . . . . 10 . . . . g 3.086 3 21 5 12 2 21 9 16 . . 3 3 . . . . . . . . . . . . . . . . . . . . . 2 . . . . . . 2 . . d 3.037 . 24 10 4 11 27 . . . . . . . . 1 1 . . . . . . . . . . . 4 . 1 . . . 4 . . . . . . 2 . 6 Y 2.822 . 12 6 6 . 12 . . . . . . 6 35 . . 6 . . . . . . . . . . 6 . . . . . . . . . . . . . 12 . h 2.785 4 16 25 4 25 8 . 6 . . . . . 6 . . . . . . . . . . . . . . . . . . . . . . . . . . 5 . . f 2.667 . . 23 26 17 9 . 9 . . . . . . . . . . 3 . . . . . . . . . . . . . . . . . . . . . 9 . 3 N 2.600 . 16 5 3 . . . . . 5 . 3 . . . 3 13 . . . 3 . . . 3 . . . . . . . 3 . . 44 . . . . . . . v 2.473 . 32 11 2 13 14 . . . . . . . . . . . . . . . . . . . . . 24 . . 3 1 . . . . . . . . . . . Q 2.262 . 24 19 . 3 14 . . . . . . . . . . . . . . . . . . . . . 1 3 . . . . 34 . . . . . . . . . G 2.238 . 9 . . . . 26 . . . . . . . . . . . . . . . . . . . . . . 24 . 24 . 17 . . . . . . . . . x 1.718 11 28 . . . . . . . . . . . . . . 11 . . . . . . . . . . . . . . . . . . . . . . . 50 . . F 1.226 . . . . 3 . 6 3 . 14 74 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . z 1.000 . . . . 50 50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 3.717 10 10 8 3 5 5 5 3 2 3 3 1 2 6 1 4 4 3 1 2 0 0 2 0 0 0 0 1 1 1 1 1 1 2 0 1 0 1 2 1 2 1 1 Symbol entropy: 4.758 Next-symbol entropy: ntrpy count i a u e o n r p c l g b s h d t m f v x z + W C X E I H M U Z S 3 D T Y G Q F K N O ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 4.357 619 . 0.271 0.300 0.047 0.192 0.081 0.148 0.110 0.177 0.197 0.089 0.065 0.056 0.361 0.056 0.282 0.216 0.212 0.130 0.212 . . 0.271 . . . 0.130 . . . . . . . . . 0.047 0.166 0.247 0.160 0.096 0.037 . u 4.291 215 0.219 0.257 0.144 . 0.036 0.245 . 0.369 0.268 0.177 0.361 0.036 0.107 0.161 . 0.206 0.257 0.177 0.036 0.036 0.126 . . . 0.036 . . 0.177 0.126 . 0.177 0.063 0.107 . 0.036 0.177 . . . . 0.177 . . a 4.246 524 0.323 0.092 0.017 0.174 0.117 . 0.327 0.154 0.064 0.204 0.300 0.092 0.256 0.231 0.101 0.327 0.296 0.140 . 0.180 . . . 0.147 . . . 0.043 . . . . . 0.204 0.117 0.204 0.064 . 0.043 . 0.031 . . i 4.196 642 0.431 0.046 0.297 0.107 0.127 0.207 0.451 0.101 0.114 0.207 0.086 0.055 0.182 0.192 0.079 0.046 0.245 0.156 . 0.114 0.055 . . . 0.071 . 0.015 0.015 0.114 0.015 0.114 0.036 0.172 0.055 0.036 . 0.063 . 0.036 0.036 0.046 0.015 0.063 n 4.130 317 0.435 0.309 0.340 0.146 0.157 0.243 0.064 . 0.064 0.108 . 0.199 . 0.259 . 0.179 0.334 . 0.046 0.080 . . . . . . 0.026 0.046 . 0.064 0.121 0.046 0.157 0.146 . 0.134 . . 0.064 . 0.080 0.094 0.189 I 4.079 66 0.314 0.203 0.245 . 0.153 0.092 . 0.203 0.245 0.282 . . 0.203 0.343 0.203 0.343 0.203 0.153 . 0.203 . . 0.092 . . . . . . . . . . . . . . 0.203 . . 0.153 0.245 . 3 4.049 152 0.365 0.258 0.274 . 0.205 0.082 0.162 0.112 0.112 0.258 0.082 . 0.138 0.375 0.048 0.162 0.224 0.241 0.112 0.082 . . 0.395 . . . . . . . . . . . . . 0.048 0.082 0.138 . 0.048 0.048 . r 3.865 196 0.336 0.336 0.449 0.039 0.326 0.345 0.092 0.154 . 0.039 . 0.039 . 0.039 0.039 0.067 0.092 0.135 . 0.067 . . . . . 0.345 0.039 . 0.188 0.135 0.092 0.092 0.039 0.092 . . . . . . 0.092 . 0.154 S 3.857 77 0.382 0.362 0.287 . 0.362 0.081 0.256 0.137 0.137 0.182 . . . 0.287 . 0.287 0.137 0.182 0.137 0.081 . . 0.256 . . . . . . . . . . . . . . 0.222 0.081 . . . . U 3.830 85 0.442 0.343 0.170 . 0.208 . 0.208 . 0.240 0.127 . 0.170 . 0.270 . 0.270 0.297 0.170 0.127 0.075 . . 0.321 . . . . . . . . . . . . . . 0.240 . 0.075 0.075 . . H 3.822 46 0.413 0.120 0.306 0.120 0.120 . . 0.120 0.120 . . . . 0.306 0.120 0.197 0.197 0.257 . 0.197 . . 0.383 . . . . . . . . . . . . . . 0.348 . 0.257 0.120 0.120 . + 3.802 109 0.350 0.458 0.334 . 0.175 0.106 0.230 0.143 0.230 0.230 0.062 . 0.230 0.366 0.062 0.204 . 0.062 0.143 0.143 . . . . . . . . . . . . . . . . . . 0.106 0.106 . 0.062 . T 3.796 75 0.388 0.406 0.292 . 0.367 0.083 0.139 0.186 0.083 0.260 . . 0.139 0.344 0.083 0.226 0.186 0.226 . 0.083 . . . . . . . . . . . . . . . . . 0.083 . 0.083 0.139 . . e 3.762 341 . 0.283 0.060 . . 0.170 0.444 . 0.075 0.224 0.232 0.103 0.160 0.459 . 0.255 0.337 0.060 0.043 0.025 0.089 . . . 0.025 . . . 0.075 . 0.248 0.043 0.103 0.089 0.075 . . . 0.060 0.025 . . . K 3.725 121 0.470 0.190 0.346 0.098 0.190 0.057 0.132 0.215 . 0.132 . 0.259 . . . 0.331 . 0.132 . 0.279 . 0.057 . . . . . 0.190 . . . 0.057 . 0.132 . . . . . 0.098 . 0.360 . M 3.638 53 0.412 0.281 0.281 . 0.108 . . . 0.235 0.178 . . 0.108 0.412 . 0.281 0.178 0.178 0.178 . . 0.108 0.412 . . . . . . . . . . . . . . . 0.108 0.178 . . . E 3.625 28 . 0.272 0.444 . 0.272 0.172 0.345 0.345 0.172 0.272 . . . 0.272 . 0.272 0.172 0.272 . . . . 0.172 . . . . . . . . . . . . . . . . . . 0.172 . D 3.621 23 0.306 0.306 0.197 . 0.197 . 0.197 . . 0.197 . . 0.197 0.306 . . 0.197 0.197 . . . . 0.383 . . . . . . . . . . . . . . 0.439 0.306 . 0.197 . . c 3.608 212 0.348 0.434 0.339 0.321 0.406 0.235 . 0.063 . 0.162 0.087 . . . 0.108 . 0.127 . . . . . . . . . 0.063 . . . 0.292 0.036 . 0.127 . . . . . . 0.259 0.036 0.162 t 3.606 291 . 0.398 0.338 0.425 0.239 0.155 . 0.239 . . . . . . 0.362 . . . . . . . . . . . 0.028 . 0.049 0.257 0.085 0.190 0.129 0.289 . . . . 0.221 . 0.200 . . s 3.596 392 0.497 0.219 0.446 0.336 0.226 0.163 . 0.125 0.104 0.154 . . . 0.180 . . 0.272 . . . . . . . . . 0.080 0.054 0.022 . 0.022 0.022 0.022 0.115 . 0.196 . . 0.080 . 0.154 0.067 0.039 p 3.458 118 . 0.335 0.242 0.263 0.219 0.378 . 0.434 . . 0.193 . . 0.242 0.283 . 0.135 . . . . . . . . . . . . 0.058 . . . 0.058 . . . . . . 0.424 . 0.193 b 3.426 108 0.256 0.431 0.420 0.232 0.420 0.205 0.063 0.063 . . 0.063 . . 0.144 . . . 0.063 . . . . . . . . . 0.278 0.107 . 0.063 . 0.408 . . . . . . . 0.107 . 0.107 W 3.374 15 0.388 0.260 . 0.260 . . 0.260 . . 0.260 . . . 0.388 0.260 0.388 . . . 0.260 . . 0.388 . . . . . . . . . . . . . . 0.260 . . . . . Z 3.374 46 0.515 0.120 0.120 . 0.197 . 0.120 0.120 0.306 . . . 0.257 0.120 . 0.306 0.197 0.197 . 0.120 . . 0.439 . . . . . . . . . . . . . . . 0.120 . 0.120 . . o 3.346 334 0.472 0.117 0.076 . 0.025 . . 0.324 0.182 0.300 0.201 0.044 0.091 0.406 0.025 0.129 0.129 0.475 . 0.076 0.044 . . . . . . . . . . . . . 0.076 . . . 0.152 . . . . m 3.275 190 0.138 0.519 0.224 0.157 0.414 0.252 0.208 . 0.069 . . . 0.094 . . . 0.040 0.069 . . . . . . . . 0.040 . 0.069 . 0.040 0.069 0.069 0.238 . . . . 0.138 . . . 0.427 O 3.206 88 0.523 0.486 0.166 0.124 0.124 . 0.073 . 0.073 . . . . 0.166 . 0.203 0.073 . 0.073 0.073 . . . . . . . . . 0.357 0.203 0.166 0.124 0.124 . . . . . 0.073 . . . X 3.137 21 0.456 0.401 0.209 . . . . . 0.209 0.209 . . . 0.323 . 0.493 0.209 . . . . . 0.209 . . . . . . . . . . . . . 0.209 . 0.209 . . . . l 3.134 174 0.237 0.517 0.317 0.125 0.317 0.484 . . . 0.101 0.266 . . . . 0.043 0.204 . . 0.043 . . . . . . . . 0.147 0.043 0.074 0.074 0.101 . . 0.043 . . . . . . . C 3.122 10 . 0.332 0.464 . 0.332 0.332 0.332 . . . . . . 0.332 . . . 0.332 . . . . 0.332 . . . . . . . . . . . . . . . 0.332 . . . . g 3.086 57 0.170 0.473 0.224 0.372 0.102 0.473 0.308 0.420 . . 0.170 0.170 . . . . . . . . . . . . . . . . . . . . . 0.102 . . . . . . 0.102 . . d 3.037 229 . 0.497 0.333 0.197 0.349 0.512 . 0.034 0.034 . . . . . 0.082 0.082 . . . . . . . . . . 0.034 0.197 0.034 0.060 . . 0.034 0.197 . . . . . . 0.102 . 0.258 Y 2.822 17 . 0.363 0.240 0.240 . 0.363 . . . . . . 0.240 0.530 . . 0.240 . . . . . . . . . . 0.240 . . . . . . . . . . . . . 0.363 . h 2.785 82 0.175 0.421 0.503 0.175 0.503 0.303 . 0.246 . . . . . 0.246 . . . . . . . . . . . . . . . . . . . . . . . . . . 0.213 . . f 2.667 34 . . 0.491 0.508 0.442 0.309 . 0.309 . . . . . . . . . . 0.150 . . . . . . . . . . . . . . . . . . . . . 0.309 . 0.150 N 2.600 38 . 0.420 0.224 0.138 . . . . . 0.224 . 0.138 . . . 0.138 0.385 . . . 0.138 . . . 0.138 . . . . . . . 0.138 . . 0.519 . . . . . . . v 2.473 101 . 0.527 0.348 0.112 0.381 0.395 . . . . . . . . . . . . . . . . . . . . . 0.493 . . 0.151 0.066 . . . . . . . . . . . Q 2.262 98 . 0.497 0.459 . 0.154 0.401 . . . . . . . . . . . . . . . . . . . . . 0.067 0.154 . . . . 0.530 . . . . . . . . . G 2.238 46 . 0.306 . . . . 0.506 . . . . . . . . . . . . . . . . . . . . . . 0.494 . 0.494 . 0.439 . . . . . . . . . x 1.718 18 0.352 0.513 . . . . . . . . . . . . . . 0.352 . . . . . . . . . . . . . . . . . . . . . . . 0.500 . . F 1.226 36 . . . . 0.144 . 0.232 0.144 . 0.396 0.311 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . z 1.000 2 . . . . 0.500 0.500 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 3.717 6446 0.325 0.331 0.294 0.164 0.224 0.221 0.214 0.153 0.106 0.162 0.141 0.060 0.099 0.246 0.080 0.171 0.202 0.150 0.040 0.094 0.024 0.004 0.100 0.020 0.014 0.027 0.034 0.068 0.051 0.057 0.082 0.051 0.076 0.127 0.029 0.075 0.023 0.051 0.092 0.042 0.108 0.044 0.085 It seems that "fi" should be "fili", but that is peculiar to this text. So is "reg" (regem, regis, regno, regnorum). Half of "x" is "xer", but that is rare anyway. Now "qu" is now bad because most of it is "que ". Now "v" is mostly "vi" and "vit ". Also "N" = "un" is mostly "unt ", then "unt", "uni". We must insert blanks before line too. cat latn.txt \ | sed \ -e 's/^/ /g' \ -e 's/$/ /g' \ -e 's/ et / +/g' \ -e 's/que /G/g' \ -e 's/vit /V/g' \ -e 's/vid /W/g' \ -e 's/xit /C/g' \ -e 's/unt /N/g' \ -e 's/ex /X/g' \ -e 's/et /E/g' \ -e 's/it /I/g' \ -e 's/am /H/g' \ -e 's/em /M/g' \ -e 's/um /U/g' \ -e 's/is /Z/g' \ -e 's/us /S/g' \ -e 's/e /3/g' \ -e 's/d /D/g' \ -e 's/t /T/g' \ -e 's/ver/Y/g' \ -e 's/er/K/g' \ -e 's/qu/Q/g' \ -e 's/on/O/g' \ -e 's/ $//g' \ -e 's/^ //g' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' iaueonrpclgbshdtmfvxz+GVWCNXEIHMUZS3DTYKQO' Digraph counts: TT i a u e o n r p c l g b s h d t m f v x z + G V W C N X E I H M U Z S 3 D T Y K Q O ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 619 . 44 52 7 26 8 18 33 23 27 9 6 5 72 5 47 31 30 35 30 . . 59 . . . . . . . . . . . . . . . . 4 10 38 . i 678 107 4 53 12 16 30 121 12 13 35 36 5 25 27 8 4 39 20 3 8 5 . . 2 5 . 7 1 . 1 1 13 1 13 3 23 5 3 . 6 4 1 6 a 524 50 8 1 19 11 . 51 16 5 24 44 8 34 29 9 51 43 14 . 2 . . . 2 18 15 . . . . 3 . . . . . 24 11 24 5 2 1 . u 236 11 14 6 . 1 13 21 26 15 8 25 1 4 7 . 10 14 8 1 1 5 . . . . . 1 . . . 8 5 . 8 2 4 . 1 8 . 8 . . e 387 . 26 3 . . 12 61 . 4 18 19 52 11 66 . 22 35 3 3 1 5 . . 1 . . 1 . . . . 4 . 21 2 6 5 4 . . . 2 . o 334 70 7 4 . 1 . . 32 13 28 15 2 5 49 1 8 8 71 . 3 2 . . 6 1 . . . . . . . . . . . . 4 . . . 4 . n 338 54 34 35 15 10 19 3 . 3 8 . 15 . 21 . 13 37 . 2 4 1 . . . . . 1 . . 1 2 . 3 7 2 11 9 . 8 . 4 3 13 r 242 20 20 36 1 65 21 3 6 . 1 . 1 . 1 1 2 3 5 . 2 . . . . . . . . 21 1 . 8 5 3 3 1 3 . . . 3 . 6 p 118 . 12 7 8 6 15 . 20 . . 5 . . 7 9 . 3 . . . . . . . . . . . . . . . 1 . . . 1 . . . 19 . 5 c 212 23 36 22 21 31 12 . 2 . 7 3 . . . 4 . 5 . . . . . . . . . . . . 2 . . . 17 1 . 5 . . . 14 . 7 l 174 10 50 16 4 16 39 . . . 3 12 . . . . 1 8 . . 1 . . . . . . . . . . . 5 1 2 2 3 . . 1 . . . . g 103 2 16 3 7 1 12 17 9 . . 2 2 . . . . . . . . . . . . . . . . . . . . 11 . 11 . 9 . . . 1 . . b 108 7 18 17 6 17 5 1 1 . . 1 . . 3 . . . 1 . . . . . . . . . . . . 8 2 . 1 . 16 . . . . 2 . 2 s 392 96 20 71 42 21 13 . 9 7 12 . . . 15 . . 28 . . . . . . 4 . . . 2 . 5 3 1 . 1 1 1 8 . 17 . 12 1 2 h 82 3 13 21 3 21 7 . 5 . . . . . 5 . . . . . . . . . . . . . . . . . . . . . . . . . . 4 . . d 229 . 56 23 10 25 63 . 1 1 . . . . . 3 3 . . . . . . . . . . . . . 1 10 1 2 . . 1 10 . . . 4 . 15 t 291 . 41 30 47 17 9 . 17 . . . . . . 34 . . . . . . . . 15 . . . . . 1 . 2 19 4 12 7 23 . . . 13 . . m 190 5 56 10 6 29 12 9 . 2 . . . 3 . . . 1 2 . . . . . 4 . . . . . 1 . 2 . 1 2 2 11 . . . . 1 31 f 70 . 36 8 9 6 3 . 3 . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . 3 . 1 v 77 . 33 11 2 13 14 . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1 . . . . . . . . x 18 2 5 . . . . . . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . 9 . . z 2 . . . . 1 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . + 124 12 22 14 2 5 3 8 6 6 7 1 . 6 14 1 5 . 2 5 3 . . . . . . . . . . . . . . . . . . . . . 2 . G 34 4 3 2 . 2 1 2 1 1 5 . . 2 5 . 1 2 . . 1 . . 2 . . . . . . . . . . . . . . . . . . . . V 24 3 1 2 3 1 1 . 5 . . . . 2 2 1 2 1 . . . . . . . . . . . . . . . . . . . . . . . . . . W 15 2 1 . 1 . . 1 1 . 1 . . . 2 1 2 . . . 1 . . 2 . . . . . . . . . . . . . . . . . . . . C 10 . 1 2 . 1 1 1 . . . . . . 1 . . . 1 . . . . 1 . . . . . . . . . . . . . . . . . . 1 . N 17 2 3 1 . 2 1 . 1 . . . . 1 2 . 1 1 . . . . . . . . . . . . . . . . . . . . . . . 2 . . X 21 4 3 1 . . . . . 1 1 . . . 2 . 5 1 . . . . . 1 . . . . . . . . . . . . . . . . 1 . 1 . E 13 . 1 2 . 1 . 1 . 1 1 . . . 1 . 2 1 1 . . . . 1 . . . . . . . . . . . . . . . . . . . . I 42 3 2 2 1 1 . . 1 4 5 . . 1 5 2 5 2 2 . 3 . . 1 . . . . . . . . . . . . . . . . . 2 . . H 46 7 1 4 2 1 . . 6 1 . . . . 4 1 2 2 3 3 2 . . 6 . . . . . . . . . . . . . . . . . 1 . . M 53 8 4 4 . 1 . . . 3 2 . . 1 8 . 4 2 2 4 . . 1 8 . . . . . . . . . . . . . . . . . . 1 . U 85 15 9 3 . 4 . 4 5 5 2 . 3 . 6 . 6 7 3 3 1 . . 8 . . . . . . . . . . . . . . . . . 1 . . Z 46 13 1 1 . 2 . 1 1 4 . . . 3 1 . 4 2 2 . 1 . . 8 . . . . . . . . . . . . . . . . . 1 1 . S 77 10 9 6 . 9 1 5 6 2 3 . . . 6 . 6 2 3 2 1 . . 5 . . . . . . . . . . . . . . . . . . 1 . 3 118 14 7 9 1 5 1 3 4 2 5 2 . 2 14 1 4 6 9 3 1 . . 19 . . . . . . . . . . . . . . . . 1 1 4 . D 23 2 2 1 . 1 . 1 4 . 1 . . 1 2 . . 1 1 . . . . 3 . . . . . . . . . . . . . . . . . 1 2 . T 58 8 8 5 . 7 . 2 3 1 5 . . 1 6 1 3 2 4 1 1 . . . . . . . . . . . . . . . . . . . . . . . Y 17 . 2 1 1 . 2 . . . . . . 1 6 . . 1 . . . . . . . . . . 2 . . 1 . . . . . . . . . . . . K 121 25 5 13 4 5 1 3 6 . 3 . 8 . . . 12 . 3 2 9 . 1 . . . . . 12 . . 5 . . . 1 . 3 . . . . . . Q 64 . 24 19 . 3 14 . . . . . . . . . . . . . . . . . . . . . . . . 1 3 . . . . . . . . . . . O 88 27 20 3 2 2 . 1 . 1 . . . . 3 . 4 1 . 2 1 . . . . . . . . . . . . 10 4 3 2 2 . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 6520 619 678 524 236 387 334 338 242 118 212 174 103 108 392 82 229 291 190 70 77 18 2 124 34 24 15 10 17 21 13 42 46 53 85 46 77 118 23 58 17 121 64 88 Next-symbol probability (× 99): TT TT i a u e o n r p c l g b s h d t m f v x z + G V W C N X E I H M U Z S 3 D T Y K Q O ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- u 4.342 236 5 6 3 . . 5 9 11 6 3 10 . 2 3 . 4 6 3 . . 2 . . . . . . . . . 3 2 . 3 1 2 . . 3 . 3 . . a 4.269 524 9 2 . 4 2 . 10 3 1 5 8 2 6 5 2 10 8 3 . . . . . . 3 3 . . . . 1 . . . . . 5 2 5 1 . . . i 4.249 678 16 1 8 2 2 4 18 2 2 5 5 1 4 4 1 1 6 3 . 1 1 . . . 1 . 1 . . . . 2 . 2 . 3 1 . . 1 1 . 1 4.162 619 . 7 8 1 4 1 3 5 4 4 1 1 1 12 1 8 5 5 6 5 . . 9 . . . . . . . . . . . . . . . . 1 2 6 . n 4.108 338 16 10 10 4 3 6 1 . 1 2 . 4 . 6 . 4 11 . 1 1 . . . . . . . . . . 1 . 1 2 1 3 3 . 2 . 1 1 4 3 3.982 118 12 6 8 1 4 1 3 3 2 4 2 . 2 12 1 3 5 8 3 1 . . 16 . . . . . . . . . . . . . . . . 1 1 3 . I 3.860 42 7 5 5 2 2 . . 2 9 12 . . 2 12 5 12 5 5 . 7 . . 2 . . . . . . . . . . . . . . . . . 5 . . + 3.823 124 10 18 11 2 4 2 6 5 5 6 1 . 5 11 1 4 . 2 4 2 . . . . . . . . . . . . . . . . . . . . . 2 . U 3.797 85 17 10 3 . 5 . 5 6 6 2 . 3 . 7 . 7 8 3 3 1 . . 9 . . . . . . . . . . . . . . . . . 1 . . S 3.786 77 13 12 8 . 12 1 6 8 3 4 . . . 8 . 8 3 4 3 1 . . 6 . . . . . . . . . . . . . . . . . . 1 . e 3.772 387 . 7 1 . . 3 16 . 1 5 5 13 3 17 . 6 9 1 1 . 1 . . . . . . . . . . 1 . 5 1 2 1 1 . . . 1 . K 3.761 121 20 4 11 3 4 1 2 5 . 2 . 7 . . . 10 . 2 2 7 . 1 . . . . . 10 . . 4 . . . 1 . 2 . . . . . . H 3.694 46 15 2 9 4 2 . . 13 2 . . . . 9 2 4 4 6 6 4 . . 13 . . . . . . . . . . . . . . . . . 2 . . G 3.676 34 12 9 6 . 6 3 6 3 3 15 . . 6 15 . 3 6 . . 3 . . 6 . . . . . . . . . . . . . . . . . . . . T 3.653 58 14 14 9 . 12 . 3 5 2 9 . . 2 10 2 5 3 7 2 2 . . . . . . . . . . . . . . . . . . . . . . . D 3.621 23 9 9 4 . 4 . 4 17 . 4 . . 4 9 . . 4 4 . . . . 13 . . . . . . . . . . . . . . . . . 4 9 . t 3.606 291 . 14 10 16 6 3 . 6 . . . . . . 12 . . . . . . . . 5 . . . . . . . 1 6 1 4 2 8 . . . 4 . . r 3.598 242 8 8 15 . 27 9 1 2 . . . . . . . 1 1 2 . 1 . . . . . . . . 9 . . 3 2 1 1 . 1 . . . 1 . 2 s 3.586 392 24 5 18 11 5 3 . 2 2 3 . . . 4 . . 7 . . . . . . 1 . . . 1 . 1 1 . . . . . 2 . 4 . 3 . 1 c 3.581 212 11 17 10 10 14 6 . 1 . 3 1 . . . 2 . 2 . . . . . . . . . . . . 1 . . . 8 . . 2 . . . 7 . 3 M 3.563 53 15 7 7 . 2 . . . 6 4 . . 2 15 . 7 4 4 7 . . 2 15 . . . . . . . . . . . . . . . . . . 2 . p 3.458 118 . 10 6 7 5 13 . 17 . . 4 . . 6 8 . 3 . . . . . . . . . . . . . . . 1 . . . 1 . . . 16 . 4 b 3.426 108 6 17 16 6 16 5 1 1 . . 1 . . 3 . . . 1 . . . . . . . . . . . . 7 2 . 1 . 15 . . . . 2 . 2 E 3.393 13 . 8 15 . 8 . 8 . 8 8 . . . 8 . 15 8 8 . . . . 8 . . . . . . . . . . . . . . . . . . . . g 3.385 103 2 15 3 7 1 12 16 9 . . 2 2 . . . . . . . . . . . . . . . . . . . . 11 . 11 . 9 . . . 1 . . o 3.385 334 21 2 1 . . . . 9 4 8 4 1 1 15 . 2 2 21 . 1 1 . . 2 . . . . . . . . . . . . . 1 . . . 1 . W 3.374 15 13 7 . 7 . . 7 7 . 7 . . . 13 7 13 . . . 7 . . 13 . . . . . . . . . . . . . . . . . . . . Z 3.374 46 28 2 2 . 4 . 2 2 9 . . . 6 2 . 9 4 4 . 2 . . 17 . . . . . . . . . . . . . . . . . 2 2 . V 3.372 24 12 4 8 12 4 4 . 21 . . . . 8 8 4 8 4 . . . . . . . . . . . . . . . . . . . . . . . . . . N 3.337 17 12 17 6 . 12 6 . 6 . . . . 6 12 . 6 6 . . . . . . . . . . . . . . . . . . . . . . . 12 . . m 3.294 190 3 29 5 3 15 6 5 . 1 . . . 2 . . . 1 1 . . . . . 2 . . . . . 1 . 1 . 1 1 1 6 . . . . 1 16 O 3.183 88 30 23 3 2 2 . 1 . 1 . . . . 3 . 5 1 . 2 1 . . . . . . . . . . . . 11 5 3 2 2 . . . . . . X 3.137 21 19 14 5 . . . . . 5 5 . . . 9 . 24 5 . . . . . 5 . . . . . . . . . . . . . . . . 5 . 5 . l 3.134 174 6 28 9 2 9 22 . . . 2 7 . . . . 1 5 . . 1 . . . . . . . . . . . 3 1 1 1 2 . . 1 . . . . C 3.122 10 . 10 20 . 10 10 10 . . . . . . 10 . . . 10 . . . . 10 . . . . . . . . . . . . . . . . . . 10 . d 3.037 229 . 24 10 4 11 27 . . . . . . . . 1 1 . . . . . . . . . . . . . . 4 . 1 . . . 4 . . . 2 . 6 Y 2.822 17 . 12 6 6 . 12 . . . . . . 6 35 . . 6 . . . . . . . . . . 12 . . 6 . . . . . . . . . . . . h 2.785 82 4 16 25 4 25 8 . 6 . . . . . 6 . . . . . . . . . . . . . . . . . . . . . . . . . . 5 . . f 2.295 70 . 51 11 13 8 4 . 4 . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . 4 . 1 v 2.206 77 . 42 14 3 17 18 . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1 . . . . . . . . Q 2.038 64 . 37 29 . 5 22 . . . . . . . . . . . . . . . . . . . . . . . . 2 5 . . . . . . . . . . . x 1.718 18 11 28 . . . . . . . . . . . . . . 11 . . . . . . . . . . . . . . . . . . . . . . . 50 . . z 1.000 2 . . . . 50 50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 3.722 6520 9 10 8 4 6 5 5 4 2 3 3 2 2 6 1 3 4 3 1 1 0 0 2 1 0 0 0 0 0 0 1 1 1 1 1 1 2 0 1 0 2 1 1 Symbol entropy: 4.712 Next-symbol entropy: TT TT i a u e o n r p c l g b s h d t m f v x z + G V W C N X E I H M U Z S 3 D T Y K Q O ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- u 4.342 236 0.206 0.242 0.135 . 0.033 0.230 0.311 0.351 0.253 0.166 0.343 0.033 0.100 0.151 . 0.193 0.242 0.166 0.033 0.033 0.118 . . . . . 0.033 . . . 0.166 0.118 . 0.166 0.058 0.100 . 0.033 0.166 . 0.166 . . a 4.269 524 0.323 0.092 0.017 0.174 0.117 . 0.327 0.154 0.064 0.204 0.300 0.092 0.256 0.231 0.101 0.327 0.296 0.140 . 0.031 . . . 0.031 0.167 0.147 . . . . 0.043 . . . . . 0.204 0.117 0.204 0.064 0.031 0.017 . i 4.249 678 0.420 0.044 0.287 0.103 0.128 0.199 0.444 0.103 0.109 0.221 0.225 0.052 0.176 0.185 0.076 0.044 0.237 0.150 0.035 0.076 0.052 . . 0.025 0.052 . 0.068 0.014 . 0.014 0.014 0.109 0.014 0.109 0.035 0.166 0.052 0.035 . 0.060 0.044 0.014 0.060 4.162 619 . 0.271 0.300 0.073 0.192 0.081 0.148 0.225 0.177 0.197 0.089 0.065 0.056 0.361 0.056 0.282 0.216 0.212 0.234 0.212 . . 0.323 . . . . . . . . . . . . . . . . 0.047 0.096 0.247 . n 4.108 338 0.423 0.333 0.339 0.199 0.150 0.233 0.060 . 0.060 0.128 . 0.199 . 0.249 . 0.181 0.349 . 0.044 0.076 0.025 . . . . . 0.025 . . 0.025 0.044 . 0.060 0.116 0.044 0.161 0.139 . 0.128 . 0.076 0.060 0.181 3 3.982 118 0.365 0.242 0.283 0.058 0.193 0.058 0.135 0.166 0.100 0.193 0.100 . 0.100 0.365 0.058 0.166 0.219 0.283 0.135 0.058 . . 0.424 . . . . . . . . . . . . . . . . 0.058 0.058 0.166 . I 3.860 42 0.272 0.209 0.209 0.128 0.128 . . 0.128 0.323 0.366 . . 0.128 0.366 0.209 0.366 0.209 0.209 . 0.272 . . 0.128 . . . . . . . . . . . . . . . . . 0.209 . . + 3.823 124 0.326 0.443 0.355 0.096 0.187 0.130 0.255 0.211 0.211 0.234 0.056 . 0.211 0.355 0.056 0.187 . 0.096 0.187 0.130 . . . . . . . . . . . . . . . . . . . . . 0.096 . U 3.797 85 0.442 0.343 0.170 . 0.208 . 0.208 0.240 0.240 0.127 . 0.170 . 0.270 . 0.270 0.297 0.170 0.170 0.075 . . 0.321 . . . . . . . . . . . . . . . . . 0.075 . . S 3.786 77 0.382 0.362 0.287 . 0.362 0.081 0.256 0.287 0.137 0.182 . . . 0.287 . 0.287 0.137 0.182 0.137 0.081 . . 0.256 . . . . . . . . . . . . . . . . . . 0.081 . e 3.772 387 . 0.262 0.054 . . 0.155 0.420 . 0.068 0.206 0.213 0.389 0.146 0.435 . 0.235 0.314 0.054 0.054 0.022 0.081 . . 0.022 . . 0.022 . . . . 0.068 . 0.228 0.039 0.093 0.081 0.068 . . . 0.039 . K 3.761 121 0.470 0.190 0.346 0.163 0.190 0.057 0.132 0.215 . 0.132 . 0.259 . . . 0.331 . 0.132 0.098 0.279 . 0.057 . . . . . 0.331 . . 0.190 . . . 0.057 . 0.132 . . . . . . H 3.694 46 0.413 0.120 0.306 0.197 0.120 . . 0.383 0.120 . . . . 0.306 0.120 0.197 0.197 0.257 0.257 0.197 . . 0.383 . . . . . . . . . . . . . . . . . 0.120 . . G 3.676 34 0.363 0.309 0.240 . 0.240 0.150 0.240 0.150 0.150 0.407 . . 0.240 0.407 . 0.150 0.240 . . 0.150 . . 0.240 . . . . . . . . . . . . . . . . . . . . T 3.653 58 0.394 0.394 0.305 . 0.368 . 0.168 0.221 0.101 0.305 . . 0.101 0.339 0.101 0.221 0.168 0.266 0.101 0.101 . . . . . . . . . . . . . . . . . . . . . . . D 3.621 23 0.306 0.306 0.197 . 0.197 . 0.197 0.439 . 0.197 . . 0.197 0.306 . . 0.197 0.197 . . . . 0.383 . . . . . . . . . . . . . . . . . 0.197 0.306 . t 3.606 291 . 0.398 0.338 0.425 0.239 0.155 . 0.239 . . . . . . 0.362 . . . . . . . . 0.221 . . . . . 0.028 . 0.049 0.257 0.085 0.190 0.129 0.289 . . . 0.200 . . r 3.598 242 0.297 0.297 0.409 0.033 0.509 0.306 0.079 0.132 . 0.033 . 0.033 . 0.033 0.033 0.057 0.079 0.116 . 0.057 . . . . . . . . 0.306 0.033 . 0.163 0.116 0.079 0.079 0.033 0.079 . . . 0.079 . 0.132 s 3.586 392 0.497 0.219 0.446 0.345 0.226 0.163 . 0.125 0.104 0.154 . . . 0.180 . . 0.272 . . . . . . 0.067 . . . 0.039 . 0.080 0.054 0.022 . 0.022 0.022 0.022 0.115 . 0.196 . 0.154 0.022 0.039 c 3.581 212 0.348 0.434 0.339 0.330 0.406 0.235 . 0.063 . 0.162 0.087 . . . 0.108 . 0.127 . . . . . . . . . . . . 0.063 . . . 0.292 0.036 . 0.127 . . . 0.259 . 0.162 M 3.563 53 0.412 0.281 0.281 . 0.108 . . . 0.235 0.178 . . 0.108 0.412 . 0.281 0.178 0.178 0.281 . . 0.108 0.412 . . . . . . . . . . . . . . . . . . 0.108 . p 3.458 118 . 0.335 0.242 0.263 0.219 0.378 . 0.434 . . 0.193 . . 0.242 0.283 . 0.135 . . . . . . . . . . . . . . . 0.058 . . . 0.058 . . . 0.424 . 0.193 b 3.426 108 0.256 0.431 0.420 0.232 0.420 0.205 0.063 0.063 . . 0.063 . . 0.144 . . . 0.063 . . . . . . . . . . . . 0.278 0.107 . 0.063 . 0.408 . . . . 0.107 . 0.107 E 3.393 13 . 0.285 0.415 . 0.285 . 0.285 . 0.285 0.285 . . . 0.285 . 0.415 0.285 0.285 . . . . 0.285 . . . . . . . . . . . . . . . . . . . . g 3.385 103 0.110 0.417 0.149 0.264 0.065 0.361 0.429 0.307 . . 0.110 0.110 . . . . . . . . . . . . . . . . . . . . 0.345 . 0.345 . 0.307 . . . 0.065 . . o 3.385 334 0.472 0.117 0.076 . 0.025 . . 0.324 0.182 0.300 0.201 0.044 0.091 0.406 0.025 0.129 0.129 0.475 . 0.061 0.044 . . 0.104 0.025 . . . . . . . . . . . . 0.076 . . . 0.076 . W 3.374 15 0.388 0.260 . 0.260 . . 0.260 0.260 . 0.260 . . . 0.388 0.260 0.388 . . . 0.260 . . 0.388 . . . . . . . . . . . . . . . . . . . . Z 3.374 46 0.515 0.120 0.120 . 0.197 . 0.120 0.120 0.306 . . . 0.257 0.120 . 0.306 0.197 0.197 . 0.120 . . 0.439 . . . . . . . . . . . . . . . . . 0.120 0.120 . V 3.372 24 0.375 0.191 0.299 0.375 0.191 0.191 . 0.471 . . . . 0.299 0.299 0.191 0.299 0.191 . . . . . . . . . . . . . . . . . . . . . . . . . . N 3.337 17 0.363 0.442 0.240 . 0.363 0.240 . 0.240 . . . . 0.240 0.363 . 0.240 0.240 . . . . . . . . . . . . . . . . . . . . . . . 0.363 . . m 3.294 190 0.138 0.519 0.224 0.157 0.414 0.252 0.208 . 0.069 . . . 0.094 . . . 0.040 0.069 . . . . . 0.117 . . . . . 0.040 . 0.069 . 0.040 0.069 0.069 0.238 . . . . 0.040 0.427 O 3.183 88 0.523 0.486 0.166 0.124 0.124 . 0.073 . 0.073 . . . . 0.166 . 0.203 0.073 . 0.124 0.073 . . . . . . . . . . . . 0.357 0.203 0.166 0.124 0.124 . . . . . . X 3.137 21 0.456 0.401 0.209 . . . . . 0.209 0.209 . . . 0.323 . 0.493 0.209 . . . . . 0.209 . . . . . . . . . . . . . . . . 0.209 . 0.209 . l 3.134 174 0.237 0.517 0.317 0.125 0.317 0.484 . . . 0.101 0.266 . . . . 0.043 0.204 . . 0.043 . . . . . . . . . . . 0.147 0.043 0.074 0.074 0.101 . . 0.043 . . . . C 3.122 10 . 0.332 0.464 . 0.332 0.332 0.332 . . . . . . 0.332 . . . 0.332 . . . . 0.332 . . . . . . . . . . . . . . . . . . 0.332 . d 3.037 229 . 0.497 0.333 0.197 0.349 0.512 . 0.034 0.034 . . . . . 0.082 0.082 . . . . . . . . . . . . . 0.034 0.197 0.034 0.060 . . 0.034 0.197 . . . 0.102 . 0.258 Y 2.822 17 . 0.363 0.240 0.240 . 0.363 . . . . . . 0.240 0.530 . . 0.240 . . . . . . . . . . 0.363 . . 0.240 . . . . . . . . . . . . h 2.785 82 0.175 0.421 0.503 0.175 0.503 0.303 . 0.246 . . . . . 0.246 . . . . . . . . . . . . . . . . . . . . . . . . . . 0.213 . . f 2.295 70 . 0.493 0.358 0.380 0.304 0.195 . 0.195 . . . . . . . . . . 0.088 . . . . . . . . . . . . . . . . . . . . . 0.195 . 0.088 v 2.206 77 . 0.524 0.401 0.137 0.433 0.447 . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.182 0.081 . . . . . . . . Q 2.038 64 . 0.531 0.520 . 0.207 0.480 . . . . . . . . . . . . . . . . . . . . . . . . 0.094 0.207 . . . . . . . . . . . x 1.718 18 0.352 0.513 . . . . . . . . . . . . . . 0.352 . . . . . . . . . . . . . . . . . . . . . . . 0.500 . . z 1.000 2 . . . . 0.500 0.500 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 3.722 6520 0.322 0.340 0.292 0.173 0.242 0.220 0.221 0.176 0.105 0.161 0.140 0.095 0.098 0.244 0.079 0.170 0.200 0.149 0.070 0.076 0.023 0.004 0.109 0.040 0.030 0.020 0.014 0.022 0.027 0.018 0.047 0.050 0.056 0.082 0.050 0.076 0.105 0.029 0.061 0.022 0.107 0.065 0.084 Here "O" = "on" has low entropy possibly because of " non ". (Other common "on" are in "solomon" and "adonias"). Now "C" = "xit ", "W" = "vid ", and "E" = "et " seem relatively useless. If we remove them, I = "it " and "D" = "d " will compensate to soem extent. Useful abbreviations may be "i ", "in", "n ", and "s ". cat latn.txt \ | sed \ -e 's/^/ /g' \ -e 's/$/ /g' \ -e 's/ et / + /g' \ -e 's/ non / - /g' \ -e 's/que /G/g' \ -e 's/vit /J/g' \ -e 's/unt /W/g' \ -e 's/ex /X/g' \ -e 's/it /I/g' \ -e 's/am /H/g' \ -e 's/em /M/g' \ -e 's/um /U/g' \ -e 's/is /Z/g' \ -e 's/us /C/g' \ -e 's/e /E/g' \ -e 's/d /D/g' \ -e 's/t /T/g' \ -e 's/s /S/g' \ -e 's/n /N/g' \ -e 's/ver/V/g' \ -e 's/er/R/g' \ -e 's/in/Y/g' \ -e 's/qu/Q/g' \ -e 's/on/O/g' \ -e 's/ *\([-+]\) */\1/g' \ -e 's/ $//g' \ -e 's/^ //g' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' iaueonrpclgbshdtmfvxz+-GJWXIHMUZCEDTSNVRYQO' Digraph counts: TT i a u e o n r p c l g b s h d t m f v x z + - G J W X I H M U Z C E D T S N V R Y Q O ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- i 608 98 4 53 12 17 33 . 12 13 35 36 5 25 27 8 4 39 20 3 8 12 . 8 1 2 5 1 . 1 13 1 13 3 23 5 18 . . 36 6 4 . 1 3 a 524 43 8 1 19 11 . 38 16 5 24 44 8 34 9 9 51 43 14 . 17 . . 6 1 2 18 . . 3 . . . . . 24 11 24 20 13 5 2 . 1 . 438 . 28 38 7 17 3 14 25 12 19 6 3 4 59 2 39 23 29 24 21 . . 15 . . . . . . . . . . . . . . . . 3 8 10 29 . e 400 . 26 3 . . 12 56 . 4 18 19 52 11 33 . 22 35 3 3 1 6 . . . 1 . . . . 4 . 21 2 6 5 4 13 33 5 . . . 2 . o 349 62 7 4 . 1 . . 32 13 28 15 2 5 22 1 8 8 71 . 3 2 . 7 1 6 1 . . . . . . . . . 4 . 27 15 . . . 4 . s 296 . 19 71 42 26 13 . 9 7 12 . . . 15 . . 28 . . . . . . . 4 . 2 . 3 1 . 1 1 1 8 . 17 . . . 12 1 1 2 t 291 . 41 30 47 18 9 . 17 . . . . . . 34 . . . . . . . . . 15 . . . . 2 19 4 12 7 23 . . . . . 13 . . . r 242 20 17 36 1 66 22 3 6 . 1 . 1 . 1 1 2 3 5 . 2 . . . . . . . 21 . 8 5 3 3 1 3 . . . . . 3 3 . 5 u 236 11 12 6 . 1 13 21 26 15 8 25 1 4 7 . 10 14 8 1 1 6 . . . . . . . 8 5 . 8 2 4 . 1 8 . . . 8 2 . . d 229 . 56 23 10 26 63 . 1 1 . . . . . 3 3 . . . . . . . . . . . . 10 1 2 . . 1 10 . . . . . 4 . . 15 c 212 23 32 22 21 33 12 . 2 . 7 3 . . . 4 . 5 . . . . . . . . . . . . . . 17 1 . 5 . . . . . 14 4 . 7 m 190 5 25 10 6 30 23 9 . 2 . . . 3 . . . 1 2 . . . . . . 4 . . . . 2 . 1 2 2 11 . . . . . . 31 1 20 n 187 . 24 32 14 11 15 2 . . 4 . 4 . 2 . 10 30 . . . 2 . . . . . . . 2 . 1 3 2 1 2 . 6 16 . . 3 . . 1 l 174 7 49 16 4 16 39 . . . 3 12 . . . . 1 8 . . 1 . . 3 . . . . . . 5 1 2 2 3 . . 1 . . . . 1 . . + 124 12 14 14 2 5 3 7 6 6 7 1 . 6 14 1 5 . 2 5 3 . . . 1 . . . . . . . . . . . . . . . . . 8 2 . R 121 23 4 13 4 5 1 3 6 . 3 . 8 . . . 12 . 3 2 9 . 1 2 . . . 12 . 5 . . . 1 . 3 . . . . . . 1 . . E 118 14 6 9 1 5 1 3 4 2 5 2 . 2 14 1 4 6 9 3 1 . . 19 . . . . . . . . . . . . . . . . 1 1 1 4 . p 118 . 8 7 8 6 15 . 20 . . 5 . . 7 9 . 3 . . . . . . . . . . . . . 1 . . . 1 . . . . . 19 4 . 5 b 108 7 18 17 6 17 5 1 1 . . 1 . . 3 . . . 1 . . . . . . . . . . 8 2 . 1 . 16 . . . . . . 2 . . 2 g 103 2 12 3 7 1 12 17 9 . . 2 2 . . . . . . . . . . . . . . . . . . 11 . 11 . 9 . . . . . 1 4 . . S 96 14 4 9 . 8 1 . 7 2 3 1 1 . 4 1 4 3 . 7 3 . . 13 1 . . . . . . . . . . . . . . . . 1 1 8 . v 92 . 48 11 2 13 14 . . . . . . . . . . . . . . . . . . . . . . . . . 3 1 . . . . . . . . . . . U 85 15 6 3 . 4 . 1 5 5 2 . 3 . 6 . 6 7 3 3 1 . . 8 3 . . . . . . . . . . . . . . . . 1 3 . . Y 85 . 10 3 1 . 4 1 . 3 4 . 11 . 3 . 3 7 . 2 4 . . . . . . . . . . 2 4 . 10 7 . 2 . . . 1 . 3 . h 82 2 13 21 3 21 7 . 5 . . . . . 5 . . . . . . . . 1 . . . . . . . . . . . . . . . . . 4 . . . C 77 10 9 6 . 9 1 3 6 2 3 . . . 6 . 6 2 3 2 1 . . 5 2 . . . . . . . . . . . . . . . . . . 1 . T 71 8 6 7 . 8 . 3 3 2 6 . . 1 7 1 5 3 5 1 1 . . 1 . . . . . . . . . . . . . . . . . . 3 . . f 70 . 34 8 9 6 3 . 3 . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . 3 2 . 1 N 69 10 . 5 . 1 4 . 1 9 2 2 2 1 9 2 3 4 1 4 3 . . 4 . . . . . . . . . . . . . . . . 1 . . 1 . Q 64 . 23 19 . 3 14 . . . . . . . . . . . . . . . . . . . . . . 1 3 . . . . . . . . . . . 1 . . O 61 . 20 3 2 2 . 1 . 1 . . . . 3 . 4 1 . 2 1 . . . . . . . . . . 10 4 3 2 2 . . . . . . . . . M 53 8 4 4 . 1 . . . 3 2 . . 1 8 . 4 2 2 4 . . 1 8 . . . . . . . . . . . . . . . . . . . 1 . I 52 3 3 4 1 2 1 1 1 4 5 . . 1 6 2 5 2 3 . 3 . . 2 . . . . . . . . . . . . . . . . . 2 . 1 . H 46 7 1 4 2 1 . . 6 1 . . . . 4 1 2 2 3 3 2 . . 6 . . . . . . . . . . . . . . . . . 1 . . . Z 46 13 1 1 . 2 . 1 1 4 . . . 3 1 . 4 2 2 . 1 . . 8 . . . . . . . . . . . . . . . . . 1 . 1 . D 38 4 1 1 1 1 . . 5 . 2 . . 1 4 1 2 1 1 . 1 . . 5 2 . . . . . . . . . . . . . . . . 1 2 2 . G 34 4 3 2 . 2 1 2 1 1 5 . . 2 5 . 1 2 . . 1 . . 2 . . . . . . . . . . . . . . . . . . . . . x 28 2 5 . . . . . . . . . . . . . . 2 . . . . . . . . . . . 10 . . . . . . . . . . . 9 . . . J 24 3 1 2 3 1 1 . 5 . . . . 2 2 1 2 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . X 21 4 3 1 . . . . . 1 1 . . . 2 . 5 1 . . . . . 1 . . . . . . . . . . . . . . . . 1 . . 1 . V 17 . 1 1 1 . 2 . . . . . . 1 6 . . 1 . . . . . . . . . 2 . 1 . . . . . . . . . . . . 1 . . W 17 2 2 1 . 2 1 . 1 . . . . 1 2 . 1 1 . . . . . . . . . . . . . . . . . . . . . . . 2 1 . . - 12 2 . . . . . . . . 3 . . . . . 1 1 . . 3 . . . . . . . . . . . . . . . . . . . . 1 1 . . z 2 . . . . 1 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 6310 438 608 524 236 400 349 187 242 118 212 174 103 108 296 82 229 291 190 70 92 28 2 124 12 34 24 17 21 52 46 53 85 46 77 118 38 71 96 69 17 121 85 64 61 Next-symbol probability (× 99): TT TT i a u e o n r p c l g b s h d t m f v x z + - G J W X I H M U Z C E D T S N V R Y Q O ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- i 4.492 608 16 1 9 2 3 5 . 2 2 6 6 1 4 4 1 1 6 3 . 1 2 . 1 . . 1 . . . 2 . 2 . 4 1 3 . . 6 1 1 . . . a 4.445 524 8 2 . 4 2 . 7 3 1 5 8 2 6 2 2 10 8 3 . 3 . . 1 . . 3 . . 1 . . . . . 5 2 5 4 2 1 . . . . 4.178 438 . 6 9 2 4 1 3 6 3 4 1 1 1 13 . 9 5 7 5 5 . . 3 . . . . . . . . . . . . . . . . 1 2 2 7 . e 4.074 400 . 6 1 . . 3 14 . 1 4 5 13 3 8 . 5 9 1 1 . 1 . . . . . . . . 1 . 5 . 1 1 1 3 8 1 . . . . . o 3.750 349 18 2 1 . . . . 9 4 8 4 1 1 6 . 2 2 20 . 1 1 . 2 . 2 . . . . . . . . . . 1 . 8 4 . . . 1 . s 3.643 296 . 6 24 14 9 4 . 3 2 4 . . . 5 . . 9 . . . . . . . 1 . 1 . 1 . . . . . 3 . 6 . . . 4 . . 1 t 3.587 291 . 14 10 16 6 3 . 6 . . . . . . 12 . . . . . . . . . 5 . . . . 1 6 1 4 2 8 . . . . . 4 . . . r 3.609 242 8 7 15 . 27 9 1 2 . . . . . . . 1 1 2 . 1 . . . . . . . 9 . 3 2 1 1 . 1 . . . . . 1 1 . 2 u 4.361 236 5 5 3 . . 5 9 11 6 3 10 . 2 3 . 4 6 3 . . 3 . . . . . . . 3 2 . 3 1 2 . . 3 . . . 3 1 . . d 3.010 229 . 24 10 4 11 27 . . . . . . . . 1 1 . . . . . . . . . . . . 4 . 1 . . . 4 . . . . . 2 . . 6 c 3.615 212 11 15 10 10 15 6 . 1 . 3 1 . . . 2 . 2 . . . . . . . . . . . . . . 8 . . 2 . . . . . 7 2 . 3 m 3.585 190 3 13 5 3 16 12 5 . 1 . . . 2 . . . 1 1 . . . . . . 2 . . . . 1 . 1 1 1 6 . . . . . . 16 1 10 n 3.710 187 . 13 17 7 6 8 1 . . 2 . 2 . 1 . 5 16 . . . 1 . . . . . . . 1 . 1 2 1 1 1 . 3 8 . . 2 . . 1 l 3.226 174 4 28 9 2 9 22 . . . 2 7 . . . . 1 5 . . 1 . . 2 . . . . . . 3 1 1 1 2 . . 1 . . . . 1 . . + 4.026 124 10 11 11 2 4 2 6 5 5 6 1 . 5 11 1 4 . 2 4 2 . . . 1 . . . . . . . . . . . . . . . . . 6 2 . R 3.874 121 19 3 11 3 4 1 2 5 . 2 . 7 . . . 10 . 2 2 7 . 1 2 . . . 10 . 4 . . . 1 . 2 . . . . . . 1 . . E 4.017 118 12 5 8 1 4 1 3 3 2 4 2 . 2 12 1 3 5 8 3 1 . . 16 . . . . . . . . . . . . . . . . 1 1 1 3 . p 3.552 118 . 7 6 7 5 13 . 17 . . 4 . . 6 8 . 3 . . . . . . . . . . . . . 1 . . . 1 . . . . . 16 3 . 4 b 3.426 108 6 17 16 6 16 5 1 1 . . 1 . . 3 . . . 1 . . . . . . . . . . 7 2 . 1 . 15 . . . . . . 2 . . 2 g 3.511 103 2 12 3 7 1 12 16 9 . . 2 2 . . . . . . . . . . . . . . . . . . 11 . 11 . 9 . . . . . 1 4 . . S 3.903 96 14 4 9 . 8 1 . 7 2 3 1 1 . 4 1 4 3 . 7 3 . . 13 1 . . . . . . . . . . . . . . . . 1 1 8 . v 2.020 92 . 52 12 2 14 15 . . . . . . . . . . . . . . . . . . . . . . . . . 3 1 . . . . . . . . . . . U 3.933 85 17 7 3 . 5 . 1 6 6 2 . 3 . 7 . 7 8 3 3 1 . . 9 3 . . . . . . . . . . . . . . . . 1 3 . . Y 3.991 85 . 12 3 1 . 5 1 . 3 5 . 13 . 3 . 3 8 . 2 5 . . . . . . . . . . 2 5 . 12 8 . 2 . . . 1 . 3 . h 2.818 82 2 16 25 4 25 8 . 6 . . . . . 6 . . . . . . . . 1 . . . . . . . . . . . . . . . . . 5 . . . C 3.849 77 13 12 8 . 12 1 4 8 3 4 . . . 8 . 8 3 4 3 1 . . 6 3 . . . . . . . . . . . . . . . . . . 1 . T 3.860 71 11 8 10 . 11 . 4 4 3 8 . . 1 10 1 7 4 7 1 1 . . 1 . . . . . . . . . . . . . . . . . . 4 . . f 2.454 70 . 48 11 13 8 4 . 4 . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . 4 3 . 1 N 3.914 69 14 . 7 . 1 6 . 1 13 3 3 3 1 13 3 4 6 1 6 4 . . 6 . . . . . . . . . . . . . . . . 1 . . 1 . Q 2.132 64 . 36 29 . 5 22 . . . . . . . . . . . . . . . . . . . . . . 2 5 . . . . . . . . . . . 2 . . O 3.309 61 . 32 5 3 3 . 2 . 2 . . . . 5 . 6 2 . 3 2 . . . . . . . . . . 16 6 5 3 3 . . . . . . . . . M 3.563 53 15 7 7 . 2 . . . 6 4 . . 2 15 . 7 4 4 7 . . 2 15 . . . . . . . . . . . . . . . . . . . 2 . I 4.090 52 6 6 8 2 4 2 2 2 8 10 . . 2 11 4 10 4 6 . 6 . . 4 . . . . . . . . . . . . . . . . . 4 . 2 . H 3.694 46 15 2 9 4 2 . . 13 2 . . . . 9 2 4 4 6 6 4 . . 13 . . . . . . . . . . . . . . . . . 2 . . . Z 3.374 46 28 2 2 . 4 . 2 2 9 . . . 6 2 . 9 4 4 . 2 . . 17 . . . . . . . . . . . . . . . . . 2 . 2 . D 3.953 38 10 3 3 3 3 . . 13 . 5 . . 3 10 3 5 3 3 . 3 . . 13 5 . . . . . . . . . . . . . . . . 3 5 5 . G 3.676 34 12 9 6 . 6 3 6 3 3 15 . . 6 15 . 3 6 . . 3 . . 6 . . . . . . . . . . . . . . . . . . . . . x 2.045 28 7 18 . . . . . . . . . . . . . . 7 . . . . . . . . . . . 35 . . . . . . . . . . . 32 . . . J 3.372 24 12 4 8 12 4 4 . 21 . . . . 8 8 4 8 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . X 3.137 21 19 14 5 . . . . . 5 5 . . . 9 . 24 5 . . . . . 5 . . . . . . . . . . . . . . . . 5 . . 5 . V 2.940 17 . 6 6 6 . 12 . . . . . . 6 35 . . 6 . . . . . . . . . 12 . 6 . . . . . . . . . . . . 6 . . W 3.499 17 12 12 6 . 12 6 . 6 . . . . 6 12 . 6 6 . . . . . . . . . . . . . . . . . . . . . . . 12 6 . . - 2.626 12 17 . . . . . . . . 25 . . . . . 8 8 . . 25 . . . . . . . . . . . . . . . . . . . . 8 8 . . z 1.000 2 . . . . 50 50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 3.804 6310 7 10 8 4 6 5 3 4 2 3 3 2 2 5 1 4 5 3 1 1 0 0 2 0 1 0 0 0 1 1 1 1 1 1 2 1 1 2 1 0 2 1 1 1 Symbol entropy: 4.878 Next-symbol entropy: TT TT i a u e o n r p c l g b s h d t m f v x z + - G J W X I H M U Z C E D T S N V R Y Q O ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- i 4.492 608 0.424 0.048 0.307 0.112 0.144 0.228 . 0.112 0.119 0.237 0.241 0.057 0.189 0.200 0.082 0.048 0.254 0.162 0.038 0.082 0.112 . 0.082 0.015 0.027 0.057 0.015 . 0.015 0.119 0.015 0.119 0.038 0.179 0.057 0.150 . . 0.241 0.066 0.048 . 0.015 0.038 a 4.445 524 0.296 0.092 0.017 0.174 0.117 . 0.275 0.154 0.064 0.204 0.300 0.092 0.256 0.101 0.101 0.327 0.296 0.140 . 0.160 . . 0.074 0.017 0.031 0.167 . . 0.043 . . . . . 0.204 0.117 0.204 0.180 0.132 0.064 0.031 . 0.017 . u 4.361 236 0.206 0.219 0.135 . 0.033 0.230 0.311 0.351 0.253 0.166 0.343 0.033 0.100 0.151 . 0.193 0.242 0.166 0.033 0.033 0.135 . . . . . . . 0.166 0.118 . 0.166 0.058 0.100 . 0.033 0.166 . . . 0.166 0.058 . . 4.178 438 . 0.254 0.306 0.095 0.182 0.049 0.159 0.236 0.142 0.196 0.085 0.049 0.062 0.390 0.036 0.311 0.223 0.259 0.230 0.210 . . 0.167 . . . . . . . . . . . . . . . . 0.049 0.105 0.124 0.259 . I 4.090 52 0.237 0.237 0.285 0.110 0.181 0.110 0.110 0.110 0.285 0.325 . . 0.110 0.359 0.181 0.325 0.181 0.237 . 0.237 . . 0.181 . . . . . . . . . . . . . . . . . 0.181 . 0.110 . e 4.074 400 . 0.256 0.053 . . 0.152 0.397 . 0.066 0.201 0.209 0.383 0.143 0.297 . 0.230 0.308 0.053 0.053 0.022 0.091 . . . 0.022 . . . . 0.066 . 0.223 0.038 0.091 0.079 0.066 0.161 0.297 0.079 . . . 0.038 . + 4.026 124 0.326 0.355 0.355 0.096 0.187 0.130 0.234 0.211 0.211 0.234 0.056 . 0.211 0.355 0.056 0.187 . 0.096 0.187 0.130 . . . 0.056 . . . . . . . . . . . . . . . . . 0.255 0.096 . E 4.017 118 0.365 0.219 0.283 0.058 0.193 0.058 0.135 0.166 0.100 0.193 0.100 . 0.100 0.365 0.058 0.166 0.219 0.283 0.135 0.058 . . 0.424 . . . . . . . . . . . . . . . . 0.058 0.058 0.058 0.166 . Y 3.991 85 . 0.363 0.170 0.075 . 0.208 0.075 . 0.170 0.208 . 0.382 . 0.170 . 0.170 0.297 . 0.127 0.208 . . . . . . . . . . 0.127 0.208 . 0.363 0.297 . 0.127 . . . 0.075 . 0.170 . D 3.953 38 0.342 0.138 0.138 0.138 0.138 . . 0.385 . 0.224 . . 0.138 0.342 0.138 0.224 0.138 0.138 . 0.138 . . 0.385 0.224 . . . . . . . . . . . . . . . . 0.138 0.224 0.224 . U 3.933 85 0.442 0.270 0.170 . 0.208 . 0.075 0.240 0.240 0.127 . 0.170 . 0.270 . 0.270 0.297 0.170 0.170 0.075 . . 0.321 0.170 . . . . . . . . . . . . . . . . 0.075 0.170 . . N 3.914 69 0.404 . 0.274 . 0.089 0.238 . 0.089 0.383 0.148 0.148 0.148 0.089 0.383 0.148 0.197 0.238 0.089 0.238 0.197 . . 0.238 . . . . . . . . . . . . . . . . 0.089 . . 0.089 . S 3.903 96 0.405 0.191 0.320 . 0.299 0.069 . 0.275 0.116 0.156 0.069 0.069 . 0.191 0.069 0.191 0.156 . 0.275 0.156 . . 0.391 0.069 . . . . . . . . . . . . . . . . 0.069 0.069 0.299 . R 3.874 121 0.455 0.163 0.346 0.163 0.190 0.057 0.132 0.215 . 0.132 . 0.259 . . . 0.331 . 0.132 0.098 0.279 . 0.057 0.098 . . . 0.331 . 0.190 . . . 0.057 . 0.132 . . . . . . 0.057 . . T 3.860 71 0.355 0.301 0.330 . 0.355 . 0.193 0.193 0.145 0.301 . . 0.087 0.330 0.087 0.270 0.193 0.270 0.087 0.087 . . 0.087 . . . . . . . . . . . . . . . . . . 0.193 . . C 3.849 77 0.382 0.362 0.287 . 0.362 0.081 0.182 0.287 0.137 0.182 . . . 0.287 . 0.287 0.137 0.182 0.137 0.081 . . 0.256 0.137 . . . . . . . . . . . . . . . . . . 0.081 . o 3.750 349 0.443 0.113 0.074 . 0.024 . . 0.316 0.177 0.292 0.195 0.043 0.088 0.251 0.024 0.125 0.125 0.467 . 0.059 0.043 . 0.113 0.024 0.101 0.024 . . . . . . . . . 0.074 . 0.286 0.195 . . . 0.074 . n 3.710 187 . 0.380 0.436 0.280 0.240 0.292 0.070 . . 0.119 . 0.119 . 0.070 . 0.226 0.424 . . . 0.070 . . . . . . . 0.070 . 0.040 0.096 0.070 0.040 0.070 . 0.159 0.303 . . 0.096 . . 0.040 H 3.694 46 0.413 0.120 0.306 0.197 0.120 . . 0.383 0.120 . . . . 0.306 0.120 0.197 0.197 0.257 0.257 0.197 . . 0.383 . . . . . . . . . . . . . . . . . 0.120 . . . G 3.676 34 0.363 0.309 0.240 . 0.240 0.150 0.240 0.150 0.150 0.407 . . 0.240 0.407 . 0.150 0.240 . . 0.150 . . 0.240 . . . . . . . . . . . . . . . . . . . . . s 3.643 296 . 0.254 0.494 0.400 0.308 0.198 . 0.153 0.128 0.187 . . . 0.218 . . 0.322 . . . . . . . 0.084 . 0.049 . 0.067 0.028 . 0.028 0.028 0.028 0.141 . 0.237 . . . 0.187 0.028 0.028 0.049 c 3.615 212 0.348 0.412 0.339 0.330 0.418 0.235 . 0.063 . 0.162 0.087 . . . 0.108 . 0.127 . . . . . . . . . . . . . . 0.292 0.036 . 0.127 . . . . . 0.259 0.108 . 0.162 r 3.609 242 0.297 0.269 0.409 0.033 0.511 0.314 0.079 0.132 . 0.033 . 0.033 . 0.033 0.033 0.057 0.079 0.116 . 0.057 . . . . . . . 0.306 . 0.163 0.116 0.079 0.079 0.033 0.079 . . . . . 0.079 0.079 . 0.116 t 3.587 291 . 0.398 0.338 0.425 0.248 0.155 . 0.239 . . . . . . 0.362 . . . . . . . . . 0.221 . . . . 0.049 0.257 0.085 0.190 0.129 0.289 . . . . . 0.200 . . . m 3.585 190 0.138 0.385 0.224 0.157 0.420 0.369 0.208 . 0.069 . . . 0.094 . . . 0.040 0.069 . . . . . . 0.117 . . . . 0.069 . 0.040 0.069 0.069 0.238 . . . . . . 0.427 0.040 0.342 M 3.563 53 0.412 0.281 0.281 . 0.108 . . . 0.235 0.178 . . 0.108 0.412 . 0.281 0.178 0.178 0.281 . . 0.108 0.412 . . . . . . . . . . . . . . . . . . . 0.108 . p 3.552 118 . 0.263 0.242 0.263 0.219 0.378 . 0.434 . . 0.193 . . 0.242 0.283 . 0.135 . . . . . . . . . . . . . 0.058 . . . 0.058 . . . . . 0.424 0.166 . 0.193 g 3.511 103 0.110 0.361 0.149 0.264 0.065 0.361 0.429 0.307 . . 0.110 0.110 . . . . . . . . . . . . . . . . . . 0.345 . 0.345 . 0.307 . . . . . 0.065 0.182 . . W 3.499 17 0.363 0.363 0.240 . 0.363 0.240 . 0.240 . . . . 0.240 0.363 . 0.240 0.240 . . . . . . . . . . . . . . . . . . . . . . . 0.363 0.240 . . b 3.426 108 0.256 0.431 0.420 0.232 0.420 0.205 0.063 0.063 . . 0.063 . . 0.144 . . . 0.063 . . . . . . . . . . 0.278 0.107 . 0.063 . 0.408 . . . . . . 0.107 . . 0.107 Z 3.374 46 0.515 0.120 0.120 . 0.197 . 0.120 0.120 0.306 . . . 0.257 0.120 . 0.306 0.197 0.197 . 0.120 . . 0.439 . . . . . . . . . . . . . . . . . 0.120 . 0.120 . J 3.372 24 0.375 0.191 0.299 0.375 0.191 0.191 . 0.471 . . . . 0.299 0.299 0.191 0.299 0.191 . . . . . . . . . . . . . . . . . . . . . . . . . . . O 3.309 61 . 0.527 0.214 0.162 0.162 . 0.097 . 0.097 . . . . 0.214 . 0.258 0.097 . 0.162 0.097 . . . . . . . . . . 0.428 0.258 0.214 0.162 0.162 . . . . . . . . . l 3.226 174 0.186 0.515 0.317 0.125 0.317 0.484 . . . 0.101 0.266 . . . . 0.043 0.204 . . 0.043 . . 0.101 . . . . . . 0.147 0.043 0.074 0.074 0.101 . . 0.043 . . . . 0.043 . . X 3.137 21 0.456 0.401 0.209 . . . . . 0.209 0.209 . . . 0.323 . 0.493 0.209 . . . . . 0.209 . . . . . . . . . . . . . . . . 0.209 . . 0.209 . d 3.010 229 . 0.497 0.333 0.197 0.356 0.512 . 0.034 0.034 . . . . . 0.082 0.082 . . . . . . . . . . . . 0.197 0.034 0.060 . . 0.034 0.197 . . . . . 0.102 . . 0.258 V 2.940 17 . 0.240 0.240 0.240 . 0.363 . . . . . . 0.240 0.530 . . 0.240 . . . . . . . . . 0.363 . 0.240 . . . . . . . . . . . . 0.240 . . h 2.818 82 0.131 0.421 0.503 0.175 0.503 0.303 . 0.246 . . . . . 0.246 . . . . . . . . 0.078 . . . . . . . . . . . . . . . . . 0.213 . . . - 2.626 12 0.431 . . . . . . . . 0.500 . . . . . 0.299 0.299 . . 0.500 . . . . . . . . . . . . . . . . . . . . 0.299 0.299 . . f 2.454 70 . 0.506 0.358 0.380 0.304 0.195 . 0.195 . . . . . . . . . . 0.088 . . . . . . . . . . . . . . . . . . . . . 0.195 0.147 . 0.088 Q 2.132 64 . 0.531 0.520 . 0.207 0.480 . . . . . . . . . . . . . . . . . . . . . . 0.094 0.207 . . . . . . . . . . . 0.094 . . x 2.045 28 0.272 0.444 . . . . . . . . . . . . . . 0.272 . . . . . . . . . . . 0.531 . . . . . . . . . . . 0.526 . . . v 2.020 92 . 0.490 0.366 0.120 0.399 0.413 . . . . . . . . . . . . . . . . . . . . . . . . . 0.161 0.071 . . . . . . . . . . . z 1.000 2 . . . . 0.500 0.500 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 3.804 6310 0.267 0.325 0.298 0.177 0.252 0.231 0.150 0.180 0.107 0.164 0.143 0.097 0.100 0.207 0.081 0.174 0.205 0.152 0.072 0.089 0.035 0.004 0.111 0.017 0.041 0.031 0.023 0.027 0.057 0.052 0.058 0.084 0.052 0.078 0.107 0.044 0.073 0.092 0.071 0.023 0.109 0.084 0.067 0.065 OK, that is enough.... Now let's look again at Voynichese: cat .tmp-c-fsg.txt \ | sed \ -e 's/\/\///g' \ -e's/=//g' \ -e's/\*//g' \ -e 's/^ *//g' \ -e 's/ *$//g' \ -e 's/ *//g' \ > .voyn.fsg cat .voyn.fsg \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' COG8EDA4TSHRNM2ZPIKLF6' Digraph counts: TT C O G 8 E D A 4 T S H R N M 2 Z P I K L F 6 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 6451 . 29 1367 138 517 366 109 135 1654 764 694 153 134 . . 278 . 100 2 . 2 8 1 C 4297 11 954 172 843 1899 4 156 56 1 15 9 80 8 1 8 45 . 17 11 . 2 3 2 O 3909 35 19 4 14 31 1344 1435 4 8 7 9 570 301 7 14 7 . 68 9 7 1 13 2 G 3779 3523 1 7 . 19 21 71 2 10 20 25 55 14 . . 6 . 1 1 1 . 2 . 8 2740 73 19 72 2052 2 10 8 422 1 37 38 1 2 . . 1 . . 1 . 1 . . E 2353 1085 9 159 106 85 7 270 55 2 307 182 38 13 . . 16 . 11 . 2 . 6 . D 2192 15 873 79 169 2 11 . 742 . 69 29 . . . 1 . 199 . 3 . . . . A 1980 9 . 6 4 9 552 4 1 . . 1 4 395 475 399 7 . 2 51 43 12 . 6 4 1676 5 20 1629 3 . . 4 4 . . 1 5 . . . 2 . 2 . . . 1 . T 1453 2 1054 49 62 97 13 83 26 . 1 2 39 4 . . 6 . 12 . . . 3 . S 1078 4 868 37 28 40 5 45 21 . 3 . 25 1 . . 1 . . . . . . . H 973 6 343 58 88 3 3 1 259 . 61 25 . . . . 1 121 . 4 . . . . R 915 619 4 83 44 5 1 1 93 . 37 23 1 . . . . . 2 1 . . . 1 N 483 467 . 7 2 3 . . 2 . 1 . . . . . 1 . . . . . . . M 422 412 . 2 5 1 . . 1 . 1 . . . . . . . . . . . . . 2 372 73 4 114 10 3 1 5 131 . 14 13 2 . . . . . 1 1 . . . . Z 345 2 96 10 204 21 . . 9 . 2 . . . . . 1 . . . . . . . P 216 4 3 49 6 3 . . 14 . 91 25 . . . . . 21 . . . . . . I 155 . . . . . 11 . . . . . . 43 . . . . . 71 4 26 . . K 57 55 . 1 . . 1 . . . . . . . . . . . . . . . . . L 44 39 . 1 1 . 3 . . . . . . . . . . . . . . . . . F 36 1 1 3 . . . . 2 . 23 2 . . . . . 4 . . . . . . 6 12 11 . . . . . . 1 . . . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 35938 6451 4297 3909 3779 2740 2353 2192 1980 1676 1453 1078 973 915 483 422 372 345 216 155 57 44 36 12 Next-symbol probability (× 99): TT TT C O G 8 E D A 4 T S H R N M 2 Z P I K L F 6 ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 6451 99 . . 21 2 8 6 2 2 25 12 11 2 2 . . 4 . 2 . . . . . C 4297 99 . 22 4 19 44 . 4 1 . . . 2 . . . 1 . . . . . . . O 3909 99 1 . . . 1 34 36 . . . . 14 8 . . . . 2 . . . . . G 3779 99 92 . . . . 1 2 . . 1 1 1 . . . . . . . . . . . 8 2740 99 3 1 3 74 . . . 15 . 1 1 . . . . . . . . . . . . E 2353 99 46 . 7 4 4 . 11 2 . 13 8 2 1 . . 1 . . . . . . . D 2192 99 1 39 4 8 . . . 34 . 3 1 . . . . . 9 . . . . . . A 1980 99 . . . . . 28 . . . . . . 20 24 20 . . . 3 2 1 . . 4 1676 99 . 1 96 . . . . . . . . . . . . . . . . . . . . T 1453 99 . 72 3 4 7 1 6 2 . . . 3 . . . . . 1 . . . . . S 1078 99 . 80 3 3 4 . 4 2 . . . 2 . . . . . . . . . . . H 973 99 1 35 6 9 . . . 26 . 6 3 . . . . . 12 . . . . . . R 915 99 67 . 9 5 1 . . 10 . 4 2 . . . . . . . . . . . . N 483 99 96 . 1 . 1 . . . . . . . . . . . . . . . . . . M 422 99 97 . . 1 . . . . . . . . . . . . . . . . . . . 2 372 99 19 1 30 3 1 . 1 35 . 4 3 1 . . . . . . . . . . . Z 345 99 1 28 3 59 6 . . 3 . 1 . . . . . . . . . . . . . P 216 99 2 1 22 3 1 . . 6 . 42 11 . . . . . 10 . . . . . . I 155 99 . . . . . 7 . . . . . . 27 . . . . . 45 3 17 . . K 57 99 96 . 2 . . 2 . . . . . . . . . . . . . . . . . L 44 99 88 . 2 2 . 7 . . . . . . . . . . . . . . . . . F 36 99 3 3 8 . . . . 6 . 63 6 . . . . . 11 . . . . . . 6 12 99 91 . . . . . . 8 . . . . . . . . . . . . . . . ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 35938 99 18 12 11 10 8 6 6 5 5 4 3 3 3 1 1 1 1 1 0 0 0 0 0 Previous-symbol probability (× 99): TT C O G 8 E D A 4 T S H R N M 2 Z P I K L F 6 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 18 . 1 35 4 19 15 5 7 98 52 64 16 14 . . 74 . 46 1 . 5 22 8 C 12 . 22 4 22 69 . 7 3 . 1 1 8 1 . 2 12 . 8 7 . 5 8 17 O 11 1 . . . 1 57 65 . . . 1 58 33 1 3 2 . 31 6 12 2 36 17 G 10 54 . . . 1 1 3 . 1 1 2 6 2 . . 2 . . 1 2 . 6 . 8 8 1 . 2 54 . . . 21 . 3 3 . . . . . . . 1 . 2 . . E 6 17 . 4 3 3 . 12 3 . 21 17 4 1 . . 4 . 5 . 3 . 17 . D 6 . 20 2 4 . . . 37 . 5 3 . . . . . 57 . 2 . . . . A 5 . . . . . 23 . . . . . . 43 97 94 2 . 1 33 75 27 . 50 4 5 . . 41 . . . . . . . . 1 . . . 1 . 1 . . . 3 . T 4 . 24 1 2 4 1 4 1 . . . 4 . . . 2 . 6 . . . 8 . S 3 . 20 1 1 1 . 2 1 . . . 3 . . . . . . . . . . . H 3 . 8 1 2 . . . 13 . 4 2 . . . . . 35 . 3 . . . . R 3 9 . 2 1 . . . 5 . 3 2 . . . . . . 1 1 . . . 8 N 1 7 . . . . . . . . . . . . . . . . . . . . . . M 1 6 . . . . . . . . . . . . . . . . . . . . . . 2 1 1 . 3 . . . . 7 . 1 1 . . . . . . . 1 . . . . Z 1 . 2 . 5 1 . . . . . . . . . . . . . . . . . . P 1 . . 1 . . . . 1 . 6 2 . . . . . 6 . . . . . . I 0 . . . . . . . . . . . . 5 . . . . . 45 7 59 . . K 0 1 . . . . . . . . . . . . . . . . . . . . . . L 0 1 . . . . . . . . . . . . . . . . . . . . . . F 0 . . . . . . . . . 2 . . . . . . 1 . . . . . . 6 0 . . . . . . . . . . . . . . . . . . . . . . . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 Symbol entropy: 3.749 Next-symbol entropy: TT TT C O G 8 E D A 4 T S H R N M 2 Z P I K L F 6 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 3.139 6451 . 0.035 0.474 0.119 0.292 0.235 0.099 0.117 0.503 0.365 0.346 0.128 0.116 . . 0.195 . 0.093 0.004 . 0.004 0.012 0.002 E 2.624 2353 0.515 0.031 0.263 0.201 0.173 0.025 0.358 0.127 0.009 0.383 0.286 0.096 0.041 . . 0.049 . 0.036 . 0.009 . 0.022 . H 2.505 973 0.045 0.530 0.243 0.314 0.026 0.026 0.010 0.508 . 0.250 0.136 . . . . 0.010 0.374 . 0.033 . . . . A 2.464 1980 0.035 . 0.025 0.018 0.035 0.514 0.018 0.006 . . 0.006 0.018 0.464 0.494 0.466 0.029 . 0.010 0.136 0.120 0.045 . 0.025 P 2.375 216 0.107 0.086 0.486 0.144 0.086 . . 0.256 . 0.525 0.360 . . . . . 0.327 . . . . . . 2 2.321 372 0.461 0.070 0.523 0.140 0.056 0.023 0.084 0.530 . 0.178 0.169 0.041 . . . . . 0.023 0.023 . . . . C 2.270 4297 0.022 0.482 0.186 0.461 0.521 0.009 0.174 0.082 0.003 0.028 0.019 0.107 0.017 0.003 0.017 0.069 . 0.032 0.022 . 0.005 0.007 0.005 O 2.244 3909 0.061 0.037 0.010 0.029 0.055 0.530 0.531 0.010 0.018 0.016 0.020 0.405 0.285 0.016 0.029 0.016 . 0.102 0.020 0.016 0.003 0.027 0.006 D 2.185 2192 0.049 0.529 0.173 0.285 0.009 0.038 . 0.529 . 0.157 0.083 . . . 0.005 . 0.314 . 0.013 . . . . I 1.868 155 . . . . . 0.271 . . . . . . 0.513 . . . . . 0.516 0.136 0.432 . . F 1.814 36 0.144 0.144 0.299 . . . . 0.232 . 0.413 0.232 . . . . . 0.352 . . . . . . R 1.710 915 0.381 0.034 0.314 0.211 0.041 0.011 0.011 0.335 . 0.187 0.134 0.011 . . . . . 0.019 0.011 . . . 0.011 T 1.662 1453 0.013 0.336 0.165 0.194 0.261 0.061 0.236 0.104 . 0.007 0.013 0.140 0.023 . . 0.033 . 0.057 . . . 0.018 . Z 1.603 345 0.043 0.514 0.148 0.448 0.246 . . 0.137 . 0.043 . . . . . 0.024 . . . . . . . 8 1.315 2740 0.139 0.050 0.138 0.312 0.008 0.030 0.025 0.416 0.004 0.084 0.086 0.004 0.008 . . 0.004 . . 0.004 . 0.004 . . S 1.268 1078 0.030 0.252 0.167 0.137 0.176 0.036 0.191 0.111 . 0.024 . 0.126 0.009 . . 0.009 . . . . . . . L 0.667 44 0.154 . 0.124 0.124 . 0.264 . . . . . . . . . . . . . . . . . G 0.567 3779 0.094 0.003 0.017 . 0.038 0.042 0.108 0.006 0.023 0.040 0.048 0.089 0.030 . . 0.015 . 0.003 0.003 0.003 . 0.006 . 6 0.414 12 0.115 . . . . . . 0.299 . . . . . . . . . . . . . . . N 0.284 483 0.047 . 0.089 0.033 0.046 . . 0.033 . 0.018 . . . . . 0.018 . . . . . . . 4 0.260 1676 0.025 0.076 0.040 0.016 . . 0.021 0.021 . . 0.006 0.025 . . . 0.012 . 0.012 . . . 0.006 . K 0.254 57 0.050 . 0.102 . . 0.102 . . . . . . . . . . . . . . . . . M 0.208 422 0.034 . 0.037 0.076 0.021 . . 0.021 . 0.021 . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 1.979 35938 0.445 0.366 0.348 0.342 0.283 0.258 0.246 0.230 0.206 0.187 0.152 0.141 0.135 0.084 0.075 0.068 0.064 0.044 0.034 0.015 0.012 0.010 0.004 Some "bug fixes": "CM" -> "AN" "CI" -> "A" "IL" -> "N" "IN" -> "M" "IM" -> "M" "6" -> "8" "A " -> "G " Some obvious abbreviations: "G " -> "G" "M " -> "M "N " -> "N" "K " -> "K" "4O" -> "Q" " Q" -> "Q" cat .voyn.fsg \ | /n/gnu/bin/tr '\012' ' ' \ | /n/gnu/bin/sed \ -e 's/CM/AN/g' \ -e 's/CI/A/g' \ -e 's/IL/N/g' \ -e 's/IN/M/g' \ -e 's/6/8/g' \ -e 's/A /G /g' \ \ -e 's/G /G/g' \ -e 's/M /M/g' \ -e 's/N /N/g' \ -e 's/K /K/g' \ -e 's/4O/Q/g' \ -e 's/ Q/Q/g' \ | /n/gnu/bin/fold -s -w 200 \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' COG8EDATSHRNM2ZPIKFG' Digraph counts: TT C O G 8 E D A T S H R N M 2 Z P I K F 4 Q L ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- C 4278 8 953 172 844 1901 4 156 56 15 9 80 8 1 . 45 . 17 . . 3 1 3 2 G 3788 2 9 583 70 323 323 123 22 244 202 151 124 . . 166 . 62 1 1 2 39 1339 2 8 2752 58 15 72 2057 2 10 8 422 37 38 1 2 . . 1 . . 1 . . . 27 1 E 2353 951 9 159 106 85 7 270 55 307 182 38 13 . . 16 . 11 . 2 6 . 136 . O 2280 21 9 1 13 24 1153 354 1 4 7 299 286 6 14 7 . 45 9 7 8 1 10 1 D 2192 15 867 79 170 2 11 . 747 69 29 . . . 1 . 199 . 3 . . . . . A 1990 . . 6 4 15 554 4 1 . 1 4 399 483 401 7 . 2 54 43 . . . 12 1896 159 17 493 47 148 56 52 103 310 321 49 22 . . 76 . 30 1 . 7 5 . . Q 1629 7 10 3 1 9 191 1081 3 3 2 271 15 1 . . . 23 . . 5 . 4 . T 1453 2 1053 49 62 97 13 83 27 1 2 39 4 . . 6 . 12 . . 3 . . . S 1078 2 866 37 28 40 5 45 23 3 . 25 1 . . 1 . . . . . . 2 . H 973 6 341 58 88 3 3 1 261 61 25 . . . . 1 121 . 4 . . . . . R 915 575 4 83 44 6 1 1 93 37 23 1 . . . . . 2 1 . . . 44 . N 491 . 3 167 11 34 4 . 11 115 103 5 1 . . 10 . 5 . . . . 22 . M 440 . 1 132 14 27 3 5 4 115 91 2 1 . . 15 . 3 1 . 1 . 25 . 2 372 68 2 114 10 3 1 5 133 14 13 2 . . . . . 1 1 . . . 5 . Z 345 2 95 10 204 21 . . 10 2 . . . . . 1 . . . . . . . . P 216 4 3 49 7 3 . . 13 91 25 . . . . . 21 . . . . . . . I 92 . . . . . 9 . . . . . 39 . 24 . . . 16 4 . . . . K 57 . . 9 3 9 2 . . 2 2 1 . . . 18 . 1 . . . 1 9 . 4 47 4 20 . 4 . . 4 3 . 1 5 . . . 2 . 2 . . 1 . 1 . F 36 1 1 3 . . . . 2 23 2 . . . . . 4 . . . . . . . L 18 11 . 1 1 . 3 . . . . . . . . . . . . . . . 2 . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 29691 1896 4278 2280 3788 2752 2353 2192 1990 1453 1078 973 915 491 440 372 345 216 92 57 36 47 1629 18 Next-symbol probability (× 99): TT TT TT C O G 8 E D A T S H R N M 2 Z P I K F 4 Q L ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 3.217 1896 99 8 1 26 2 8 3 3 5 16 17 3 1 . . 4 . 2 . . . . . . G 3.096 3788 99 . . 15 2 8 8 3 1 6 5 4 3 . . 4 . 2 . . . 1 35 . E 2.866 2353 99 40 . 7 4 4 . 11 2 13 8 2 1 . . 1 . . . . . . 6 . K 2.826 57 99 . . 16 5 16 3 . . 3 3 2 . . . 31 . 2 . . . 2 16 . 4 2.772 47 99 8 42 . 8 . . 8 6 . 2 11 . . . 4 . 4 . . 2 . 2 . M 2.652 440 99 . . 30 3 6 1 1 1 26 20 . . . . 3 . 1 . . . . 6 . N 2.574 491 99 . 1 34 2 7 1 . 2 23 21 1 . . . 2 . 1 . . . . 4 . H 2.505 973 99 1 35 6 9 . . . 27 6 3 . . . . . 12 . . . . . . . A 2.427 1990 99 . . . . 1 28 . . . . . 20 24 20 . . . 3 2 . . . 1 P 2.380 216 99 2 1 22 3 1 . . 6 42 11 . . . . . 10 . . . . . . . 2 2.362 372 99 18 1 30 3 1 . 1 35 4 3 1 . . . . . . . . . . 1 . O 2.267 2280 99 1 . . 1 1 50 15 . . . 13 12 . 1 . . 2 . . . . . . C 2.231 4278 99 . 22 4 20 44 . 4 1 . . 2 . . . 1 . . . . . . . . D 2.186 2192 99 1 39 4 8 . . . 34 3 1 . . . . . 9 . . . . . . . I 1.994 92 99 . . . . . 10 . . . . . 42 . 26 . . . 17 4 . . . . R 1.956 915 99 62 . 9 5 1 . . 10 4 2 . . . . . . . . . . . 5 . F 1.814 36 99 3 3 8 . . . . 6 63 6 . . . . . 11 . . . . . . . L 1.681 18 99 61 . 6 6 . 17 . . . . . . . . . . . . . . . 11 . T 1.665 1453 99 . 72 3 4 7 1 6 2 . . 3 . . . . . 1 . . . . . . Z 1.613 345 99 1 27 3 59 6 . . 3 1 . . . . . . . . . . . . . . Q 1.577 1629 99 . 1 . . 1 12 66 . . . 16 1 . . . . 1 . . . . . . 8 1.345 2752 99 2 1 3 74 . . . 15 1 1 . . . . . . . . . . . 1 . S 1.281 1078 99 . 80 3 3 4 . 4 2 . . 2 . . . . . . . . . . . . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 2.295 29691 99 6 14 8 13 9 8 7 7 5 4 3 3 2 1 1 1 1 0 0 0 0 5 0 Previous-symbol probability (× 99): TT C O G 8 E D A T S H R N M 2 Z P I K F 4 Q L -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 6 8 . 21 1 5 2 2 5 21 29 5 2 . . 20 . 14 1 . 19 11 . . C 14 . 22 7 22 68 . 7 3 1 1 8 1 . . 12 . 8 . . 8 2 . 11 O 8 1 . . . 1 49 16 . . 1 30 31 1 3 2 . 21 10 12 22 2 1 6 G 13 . . 25 2 12 14 6 1 17 19 15 13 . . 44 . 28 1 2 6 82 81 11 8 9 3 . 3 54 . . . 21 3 3 . . . . . . . 1 . . . 2 6 E 8 50 . 7 3 3 . 12 3 21 17 4 1 . . 4 . 5 . 3 17 . 8 . D 7 1 20 3 4 . . . 37 5 3 . . . . . 57 . 3 . . . . . A 7 . . . . 1 23 . . . . . 43 97 90 2 . 1 58 75 . . . 66 T 5 . 24 2 2 3 1 4 1 . . 4 . . . 2 . 6 . . 8 . . . S 4 . 20 2 1 1 . 2 1 . . 3 . . . . . . . . . . . . H 3 . 8 3 2 . . . 13 4 2 . . . . . 35 . 4 . . . . . R 3 30 . 4 1 . . . 5 3 2 . . . . . . 1 1 . . . 3 . N 2 . . 7 . 1 . . 1 8 9 1 . . . 3 . 2 . . . . 1 . M 1 . . 6 . 1 . . . 8 8 . . . . 4 . 1 1 . 3 . 2 . 2 1 4 . 5 . . . . 7 1 1 . . . . . . . 1 . . . . . Z 1 . 2 . 5 1 . . . . . . . . . . . . . . . . . . P 1 . . 2 . . . . 1 6 2 . . . . . 6 . . . . . . . I 0 . . . . . . . . . . . 4 . 5 . . . 17 7 . . . . K 0 . . . . . . . . . . . . . . 5 . . . . . 2 1 . F 0 . . . . . . . . 2 . . . . . . 1 . . . . . . . 4 0 . . . . . . . . . . 1 . . . 1 . 1 . . 3 . . . Q 5 . . . . . 8 49 . . . 28 2 . . . . 11 . . 14 . . . L 0 1 . . . . . . . . . . . . . . . . . . . . . . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 Symbol entropy: 3.869 Next-symbol entropy: TT TT C O G 8 E D A T S H R N M 2 Z P I K F 4 Q L ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 3.217 1896 0.300 0.061 0.505 0.132 0.287 0.150 0.142 0.228 0.427 0.434 0.136 0.075 . . 0.186 . 0.095 0.006 . 0.030 0.023 . . G 3.096 3788 0.006 0.021 0.416 0.106 0.303 0.303 0.161 0.043 0.255 0.226 0.185 0.161 . . 0.198 . 0.097 0.003 0.003 0.006 0.068 0.530 0.006 E 2.866 2353 0.528 0.031 0.263 0.201 0.173 0.025 0.358 0.127 0.383 0.286 0.096 0.041 . . 0.049 . 0.036 . 0.009 0.022 . 0.238 . K 2.826 57 . . 0.420 0.224 0.420 0.170 . . 0.170 0.170 0.102 . . . 0.525 . 0.102 . . . 0.102 0.420 . 4 2.772 47 0.303 0.525 . 0.303 . . 0.303 0.253 . 0.118 0.344 . . . 0.194 . 0.194 . . 0.118 . 0.118 . M 2.652 440 . 0.020 0.521 0.158 0.247 0.049 0.073 0.062 0.506 0.470 0.035 0.020 . . 0.166 . 0.049 0.020 . 0.020 . 0.235 . N 2.574 491 . 0.045 0.529 0.123 0.267 0.057 . 0.123 0.490 0.473 0.067 0.018 . . 0.114 . 0.067 . . . . 0.201 . H 2.505 973 0.045 0.530 0.243 0.314 0.026 0.026 0.010 0.509 0.250 0.136 . . . . 0.010 0.374 . 0.033 . . . . . A 2.427 1990 . . 0.025 0.018 0.053 0.514 0.018 0.006 . 0.006 0.018 0.465 0.496 0.466 0.029 . 0.010 0.141 0.120 . . . 0.044 P 2.380 216 0.107 0.086 0.486 0.160 0.086 . . 0.244 0.525 0.360 . . . . . 0.327 . . . . . . . 2 2.362 372 0.448 0.041 0.523 0.140 0.056 0.023 0.084 0.531 0.178 0.169 0.041 . . . . . 0.023 0.023 . . . 0.084 . O 2.267 2280 0.062 0.032 0.005 0.043 0.069 0.497 0.417 0.005 0.016 0.026 0.384 0.376 0.023 0.045 0.026 . 0.112 0.032 0.026 0.029 0.005 0.034 0.005 C 2.231 4278 0.017 0.483 0.186 0.462 0.520 0.009 0.174 0.082 0.029 0.019 0.107 0.017 0.003 . 0.069 . 0.032 . . 0.007 0.003 0.007 0.005 D 2.186 2192 0.049 0.529 0.173 0.286 0.009 0.038 . 0.529 0.157 0.083 . . . 0.005 . 0.314 . 0.013 . . . . . I 1.994 92 . . . . . 0.328 . . . . . 0.525 . 0.506 . . . 0.439 0.197 . . . . R 1.956 915 0.421 0.034 0.314 0.211 0.048 0.011 0.011 0.335 0.187 0.134 0.011 . . . . . 0.019 0.011 . . . 0.211 . F 1.814 36 0.144 0.144 0.299 . . . . 0.232 0.413 0.232 . . . . . 0.352 . . . . . . . L 1.681 18 0.434 . 0.232 0.232 . 0.431 . . . . . . . . . . . . . . . 0.352 . T 1.665 1453 0.013 0.337 0.165 0.194 0.261 0.061 0.236 0.107 0.007 0.013 0.140 0.023 . . 0.033 . 0.057 . . 0.018 . . . Z 1.613 345 0.043 0.512 0.148 0.448 0.246 . . 0.148 0.043 . . . . . 0.024 . . . . . . . . Q 1.577 1629 0.034 0.045 0.017 0.007 0.041 0.363 0.393 0.017 0.017 0.012 0.430 0.062 0.007 . . . 0.087 . . 0.026 . 0.021 . 8 1.345 2752 0.117 0.041 0.138 0.314 0.008 0.029 0.024 0.415 0.084 0.085 0.004 0.008 . . 0.004 . . 0.004 . . . 0.065 0.004 S 1.281 1078 0.017 0.254 0.167 0.137 0.176 0.036 0.191 0.118 0.024 . 0.126 0.009 . . 0.009 . . . . . . 0.017 . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 2.295 29691 0.253 0.403 0.284 0.379 0.318 0.290 0.278 0.261 0.213 0.174 0.162 0.155 0.098 0.090 0.079 0.075 0.052 0.026 0.017 0.012 0.015 0.230 0.006 Previous-symbol entropy: C O G 8 E D A T S H R N M 2 Z P I K F 4 Q L ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 0.300 0.032 0.478 0.079 0.227 0.128 0.128 0.221 0.475 0.520 0.217 0.129 . . 0.468 . 0.396 0.071 . 0.459 0.344 . . C 0.033 0.483 0.281 0.483 0.369 0.016 0.271 0.145 0.068 0.058 0.296 0.060 0.018 . 0.369 . 0.289 . . 0.299 0.118 0.017 0.352 O 0.072 0.019 0.005 0.028 0.060 0.504 0.425 0.006 0.023 0.047 0.523 0.524 0.078 0.158 0.108 . 0.471 0.328 0.372 0.482 0.118 0.045 0.232 G 0.010 0.019 0.503 0.106 0.363 0.393 0.233 0.072 0.432 0.453 0.417 0.391 . . 0.519 . 0.517 0.071 0.102 0.232 0.223 0.232 0.352 8 0.154 0.029 0.157 0.478 0.008 0.033 0.030 0.474 0.135 0.170 0.010 0.019 . . 0.023 . . 0.071 . . . 0.098 0.232 E 0.499 0.019 0.268 0.144 0.155 0.025 0.372 0.143 0.474 0.433 0.183 0.087 . . 0.195 . 0.219 . 0.170 0.431 . 0.299 . D 0.055 0.467 0.168 0.201 0.008 0.036 . 0.531 0.209 0.140 . . . 0.020 . 0.458 . 0.161 . . . . . A . . 0.023 0.010 0.041 0.491 0.017 0.006 . 0.009 0.033 0.522 0.023 0.122 0.108 . 0.063 0.451 0.307 . . . 0.390 T 0.010 0.498 0.119 0.097 0.170 0.041 0.179 0.084 0.007 0.017 0.186 0.034 . . 0.096 . 0.232 . . 0.299 . . . S 0.010 0.467 0.096 0.052 0.089 0.019 0.115 0.074 0.018 . 0.136 0.011 . . 0.023 . . . . . . 0.012 . H 0.026 0.291 0.135 0.126 0.011 0.012 0.005 0.384 0.192 0.126 . . . . 0.023 0.530 . 0.197 . . . . . R 0.522 0.009 0.174 0.075 0.019 0.005 0.005 0.207 0.135 0.118 0.010 . . . . . 0.063 0.071 . . . 0.141 . N . 0.007 0.276 0.024 0.078 0.016 . 0.041 0.290 0.324 0.039 0.011 . . 0.140 . 0.126 . . . . 0.084 . M . 0.003 0.238 0.030 0.065 0.012 0.020 0.018 0.290 0.301 0.018 0.011 . . 0.187 . 0.086 0.071 . 0.144 . 0.092 . 2 0.172 0.005 0.216 0.023 0.011 0.005 0.020 0.261 0.065 0.077 0.018 . . . . . 0.036 0.071 . . . 0.026 . Z 0.010 0.122 0.034 0.227 0.054 . . 0.038 0.013 . . . . . 0.023 . . . . . . . . P 0.019 0.007 0.119 0.017 0.011 . . 0.047 0.250 0.126 . . . . . 0.246 . . . . . . . I . . . . . 0.031 . . . . . 0.194 . 0.229 . . . 0.439 0.269 . . . . K . . 0.032 0.008 0.027 0.009 . . 0.013 0.017 0.010 . . . 0.211 . 0.036 . . . 0.118 0.041 . F 0.006 0.003 0.013 . . . . 0.010 0.095 0.017 . . . . . 0.075 . . . . . . . 4 0.019 0.036 . 0.010 . . 0.017 0.014 . 0.009 0.039 . . . 0.041 . 0.063 . . 0.144 . 0.007 . Q 0.030 0.020 0.013 0.003 0.027 0.294 0.503 0.014 0.018 0.017 0.514 0.097 0.018 . . . 0.344 . . 0.396 . 0.021 . L 0.043 . 0.005 0.003 . 0.012 . . . . . . . . . . . . . . . 0.012 . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- cnt 1896 4278 2280 3788 2752 2353 2192 1990 1453 1078 973 915 491 440 372 345 216 92 57 36 47 1629 18 tpy 1.992 2.534 3.353 2.226 1.791 2.083 2.339 2.791 3.203 2.980 2.650 2.091 0.137 0.529 2.534 1.308 2.938 2.001 1.219 2.884 0.922 1.127 1.558 Now we have too few spaces. We could insert some before "OD" "OH" "OP" OF". "OE" "SC" "TC" "8G" "QD" "QH" should be separate letters. cat .voyn.fsg \ | /n/gnu/bin/tr '\012' ' ' \ | /n/gnu/bin/sed \ -e 's/CM/AN/g' \ -e 's/CI/A/g' \ -e 's/IL/N/g' \ -e 's/IN/M/g' \ -e 's/6/8/g' \ -e 's/A /G /g' \ \ -e 's/G /G/g' \ -e 's/M /M/g' \ -e 's/N /N/g' \ -e 's/K /K/g' \ -e 's/4O/Q/g' \ -e 's/ Q/Q/g' \ \ -e 's/O\([DHPF]\)/ O\1/g' \ \ -e 's/OE/U/g' \ -e 's/SC/X/g' \ -e 's/TC/Y/g' \ -e 's/8G/B/g' \ -e 's/QD/V/g' \ -e 's/QH/W/g' \ | /n/gnu/bin/fold -s -w 200 \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' CO8EDAQSHRNM2ZPIKFGUXYBVW' Digraph counts: TT C O 8 E D A Q S H R N M 2 Z P I K F G U X Y B V 4 T W L ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 2567 309 17 778 129 56 52 103 . 47 49 22 . . 76 . 30 1 . 7 47 236 274 234 19 . 5 76 . . C 2359 3 677 10 66 4 39 20 1 6 18 6 . . 28 . 6 . . 2 488 32 3 5 935 2 . 8 . . B 2057 198 6 21 127 149 36 16 137 32 62 58 . . 74 . 36 1 1 . 37 104 81 105 21 559 18 35 143 . A 1990 . . 5 10 554 4 1 . 1 4 399 483 401 7 . 2 54 43 . 4 1 . . 5 . . . . 12 G 1731 137 3 31 151 174 87 6 87 24 89 66 . . 92 . 26 . . 2 33 94 65 72 24 329 21 32 84 2 E 1200 470 2 51 14 2 86 33 17 20 13 9 . . 11 . 5 . 2 2 57 46 86 156 28 46 . 37 7 . U 1153 488 7 37 9 5 184 22 11 14 25 4 . . 5 . 6 . . 4 49 18 62 87 34 39 . 27 16 . O 1127 21 9 1 13 . 354 1 3 1 299 286 6 14 7 . 45 9 7 8 13 . 6 4 11 7 1 . . 1 D 1111 12 379 14 1 5 . 312 . 5 . . . 1 . 192 . 3 . . 103 30 15 22 . . . 17 . . V 1081 5 488 10 . 6 . 435 . 1 . . . . . 7 . . . . 67 23 8 12 1 . . 18 . . Y 1053 6 126 11 51 . 56 22 . . 35 2 1 . 14 . 5 . . . 206 55 . . 460 . . 2 . 1 R 915 578 4 28 2 1 1 93 4 1 1 . . . . . 2 1 . . 44 52 22 31 4 31 . 6 9 . X 866 5 150 15 32 . 61 14 . . 27 . . . 3 . 6 . . 1 150 43 . . 357 . 1 . . 1 H 702 6 225 11 1 2 1 169 . 4 . . . . 1 119 . 3 . . 59 35 16 26 1 . . 23 . . 8 695 61 15 15 . 10 8 422 6 5 1 2 . . 1 . . 1 . . . 54 33 25 2 19 . 12 2 1 N 491 74 3 14 28 4 . 11 5 14 5 1 . . 10 . 5 . . . 11 79 89 77 6 14 . 38 3 . M 440 63 1 9 21 3 5 4 2 22 2 1 . . 15 . 3 1 . 1 14 60 69 85 6 19 . 30 4 . T 400 6 . 14 16 13 83 27 . 1 39 4 . . 6 . 12 . . 3 62 31 1 . 81 . . 1 . . 2 372 77 2 25 . 1 5 133 . 2 2 . . . . . 1 1 . . 10 80 11 10 3 4 . 4 1 . Z 345 2 95 7 3 . . 10 . . . . . . 1 . . . . . 204 3 . 1 18 . . 1 . . Q 277 8 10 . 5 191 . 3 . . . 15 1 . . . 23 . . 5 1 2 2 2 4 4 . 1 . . W 271 3 116 1 1 1 . 92 . 2 . . . . . 2 . 1 . . 29 8 3 6 . . . 6 . . P 216 7 3 9 2 . . 13 . 8 . . . . . 21 . . . . 7 37 17 70 1 . . 21 . . S 212 9 . 5 4 5 45 23 1 . 25 1 . . 1 . . . . . 28 25 . 2 36 1 . 1 . . I 92 . . . . 9 . . . . . 39 . 24 . . . 16 4 . . . . . . . . . . . K 57 3 . 4 9 2 . . 2 . 1 . . . 18 . 1 . . . 3 2 2 2 . 6 1 . 1 . 4 47 4 20 . . . 4 3 . . 5 . . . 2 . 2 . . 1 4 . 1 . . . . . 1 . F 36 1 1 . . . . 2 . 2 . . . . . 4 . . . . . 3 . 19 . . . 4 . . L 18 11 . 1 . 3 . . 1 . . . . . . . . . . . 1 . . . . 1 . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 23881 2567 2359 1127 695 1200 1111 1990 277 212 702 915 491 440 372 345 216 92 57 36 1731 1153 866 1053 2057 1081 47 400 271 18 Next-symbol probability (× 99): TT TT TT C O 8 E D A Q S H R N M 2 Z P I K F G U X Y B V 4 T W L ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- G 3.978 1731 99 8 . 2 9 10 5 . 5 1 5 4 . . 5 . 1 . . . 2 5 4 4 1 19 1 2 5 . B 3.763 2057 99 10 . 1 6 7 2 1 7 2 3 3 . . 4 . 2 . . . 2 5 4 5 1 27 1 2 7 . M 3.525 440 99 14 . 2 5 1 1 1 . 5 . . . . 3 . 1 . . . 3 13 16 19 1 4 . 7 1 . N 3.466 491 99 15 1 3 6 1 . 2 1 3 1 . . . 2 . 1 . . . 2 16 18 16 1 3 . 8 1 . 3.403 2567 99 12 1 30 5 2 2 4 . 2 2 1 . . 3 . 1 . . . 2 9 11 9 1 . . 3 . . T 3.264 400 99 1 . 3 4 3 21 7 . . 10 1 . . 1 . 3 . . 1 15 8 . . 20 . . . . . K 3.261 57 99 5 . 7 16 3 . . 3 . 2 . . . 31 . 2 . . . 5 3 3 3 . 10 2 . 2 . E 3.228 1200 99 39 . 4 1 . 7 3 1 2 1 1 . . 1 . . . . . 5 4 7 13 2 4 . 3 1 . S 3.172 212 99 4 . 2 2 2 21 11 . . 12 . . . . . . . . . 13 12 . 1 17 . . . . . U 3.064 1153 99 42 1 3 1 . 16 2 1 1 2 . . . . . 1 . . . 4 2 5 7 3 3 . 2 1 . P 3.021 216 99 3 1 4 1 . . 6 . 4 . . . . . 10 . . . . 3 17 8 32 . . . 10 . . 4 2.772 47 99 8 42 . . . 8 6 . . 11 . . . 4 . 4 . . 2 8 . 2 . . . . . 2 . H 2.740 702 99 1 32 2 . . . 24 . 1 . . . . . 17 . . . . 8 5 2 4 . . . 3 . . 2 2.664 372 99 20 1 7 . . 1 35 . 1 1 . . . . . . . . . 3 21 3 3 1 1 . 1 . . O 2.595 1127 99 2 1 . 1 . 31 . . . 26 25 1 1 1 . 4 1 1 1 1 . 1 . 1 1 . . . . X 2.572 866 99 1 17 2 4 . 7 2 . . 3 . . . . . 1 . . . 17 5 . . 41 . . . . . Y 2.572 1053 99 1 12 1 5 . 5 2 . . 3 . . . 1 . . . . . 19 5 . . 43 . . . . . D 2.490 1111 99 1 34 1 . . . 28 . . . . . . . 17 . . . . 9 3 1 2 . . . 2 . . A 2.436 1990 99 . . . . 28 . . . . . 20 24 20 . . . 3 2 . . . . . . . . . . 1 8 2.295 695 99 9 2 2 . 1 1 60 1 1 . . . . . . . . . . . 8 5 4 . 3 . 2 . . F 2.240 36 99 3 3 . . . . 6 . 6 . . . . . 11 . . . . . 8 . 52 . . . 11 . . C 2.239 2359 99 . 28 . 3 . 2 1 . . 1 . . . 1 . . . . . 20 1 . . 39 . . . . . W 2.159 271 99 1 42 . . . . 34 . 1 . . . . . 1 . . . . 11 3 1 2 . . . 2 . . R 2.122 915 99 63 . 3 . . . 10 . . . . . . . . . . . . 5 6 2 3 . 3 . 1 1 . I 1.994 92 99 . . . . 10 . . . . . 42 . 26 . . . 17 4 . . . . . . . . . . . Q 1.915 277 99 3 4 . 2 68 . 1 . . . 5 . . . . 8 . . 2 . 1 1 1 1 1 . . . . V 1.842 1081 99 . 45 1 . 1 . 40 . . . . . . . 1 . . . . 6 2 1 1 . . . 2 . . L 1.792 18 99 61 . 6 . 17 . . 6 . . . . . . . . . . . 6 . . . . 6 . . . . Z 1.680 345 99 1 27 2 1 . . 3 . . . . . . . . . . . . 59 1 . . 5 . . . . . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 2.854 23881 99 11 10 5 3 5 5 8 1 1 3 4 2 2 2 1 1 0 0 0 7 5 4 4 9 4 0 2 1 0 Previous-symbol probability (× 99): TT C O 8 E D A Q S H R N M 2 Z P I K F G U X Y B V 4 T W L -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 11 12 1 68 18 5 5 5 . 22 7 2 . . 20 . 14 1 . 19 3 20 31 22 1 . 11 19 . . C 10 . 28 1 9 . 3 1 . 3 3 1 . . 7 . 3 . . 6 28 3 . . 45 . . 2 . . O 5 1 . . 2 . 32 . 1 . 42 31 1 3 2 . 21 10 12 22 1 . 1 . 1 1 2 . . 6 8 3 2 1 1 . 1 1 21 2 2 . . . . . . . 1 . . . 5 4 2 . 2 . 3 1 6 E 5 18 . 4 2 . 8 2 6 9 2 1 . . 3 . 2 . 3 6 3 4 10 15 1 4 . 9 3 . D 5 . 16 1 . . . 16 . 2 . . . . . 55 . 3 . . 6 3 2 2 . . . 4 . . A 8 . . . 1 46 . . . . 1 43 97 90 2 . 1 58 75 . . . . . . . . . . 66 Q 1 . . . 1 16 . . . . . 2 . . . . 11 . . 14 . . . . . . . . . . S 1 . . . 1 . 4 1 . . 4 . . . . . . . . . 2 2 . . 2 . . . . . H 3 . 9 1 . . . 8 . 2 . . . . . 34 . 3 . . 3 3 2 2 . . . 6 . . R 4 22 . 2 . . . 5 1 . . . . . . . 1 1 . . 3 4 3 3 . 3 . 1 3 . N 2 3 . 1 4 . . 1 2 7 1 . . . 3 . 2 . . . 1 7 10 7 . 1 . 9 1 . M 2 2 . 1 3 . . . 1 10 . . . . 4 . 1 1 . 3 1 5 8 8 . 2 . 7 1 . 2 2 3 . 2 . . . 7 . 1 . . . . . . . 1 . . 1 7 1 1 . . . 1 . . Z 1 . 4 1 . . . . . . . . . . . . . . . . 12 . . . 1 . . . . . P 1 . . 1 . . . 1 . 4 . . . . . 6 . . . . . 3 2 7 . . . 5 . . I 0 . . . . 1 . . . . . 4 . 5 . . . 17 7 . . . . . . . . . . . K 0 . . . 1 . . . 1 . . . . . 5 . . . . . . . . . . 1 2 . . . F 0 . . . . . . . . 1 . . . . . 1 . . . . . . . 2 . . . 1 . . G 7 5 . 3 22 14 8 . 31 11 13 7 . . 24 . 12 . . 6 2 8 7 7 1 30 44 8 31 11 U 5 19 . 3 1 . 16 1 4 7 4 . . . 1 . 3 . . 11 3 2 7 8 2 4 . 7 6 . X 4 . 6 1 5 . 5 1 . . 4 . . . 1 . 3 . . 3 9 4 . . 17 . 2 . . 6 Y 4 . 5 1 7 . 5 1 . . 5 . . . 4 . 2 . . . 12 5 . . 22 . . . . 6 B 9 8 . 2 18 12 3 1 49 15 9 6 . . 20 . 17 1 2 . 2 9 9 10 1 51 38 9 52 . V 4 . 20 1 . . . 22 . . . . . . . 2 . . . . 4 2 1 1 . . . 4 . . 4 0 . 1 . . . . . . . 1 . . . 1 . 1 . . 3 . . . . . . . . . . T 2 . . 1 2 1 7 1 . . 6 . . . 2 . 6 . . 8 4 3 . . 4 . . . . . W 1 . 5 . . . . 5 . 1 . . . . . 1 . 1 . . 2 1 . 1 . . . 1 . . L 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 Symbol entropy: 4.311 Next-symbol entropy: TT TT C O 8 E D A Q S H R N M 2 Z P I K F G U X Y B V 4 T W L ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- G 3.978 1731 0.290 0.016 0.104 0.307 0.333 0.217 0.028 0.217 0.086 0.220 0.180 . . 0.225 . 0.091 . . 0.011 0.109 0.228 0.178 0.191 0.086 0.455 0.077 0.106 0.212 0.011 B 3.763 2057 0.325 0.025 0.068 0.248 0.274 0.102 0.054 0.260 0.093 0.152 0.145 . . 0.173 . 0.102 0.005 0.005 . 0.104 0.218 0.184 0.219 0.068 0.511 0.060 0.100 0.267 . M 3.525 440 0.401 0.020 0.115 0.209 0.049 0.073 0.062 0.035 0.216 0.035 0.020 . . 0.166 . 0.049 0.020 . 0.020 0.158 0.392 0.419 0.458 0.084 0.196 . 0.264 0.062 . N 3.466 491 0.411 0.045 0.146 0.236 0.057 . 0.123 0.067 0.146 0.067 0.018 . . 0.114 . 0.067 . . . 0.123 0.424 0.447 0.419 0.078 0.146 . 0.286 0.045 . 3.403 2567 0.368 0.048 0.522 0.217 0.120 0.114 0.186 . 0.106 0.109 0.059 . . 0.150 . 0.075 0.004 . 0.023 0.106 0.317 0.345 0.315 0.052 . 0.018 0.150 . . T 3.264 400 0.091 . 0.169 0.186 0.161 0.471 0.263 . 0.022 0.327 0.066 . . 0.091 . 0.152 . . 0.053 0.417 0.286 0.022 . 0.467 . . 0.022 . . K 3.261 57 0.224 . 0.269 0.420 0.170 . . 0.170 . 0.102 . . . 0.525 . 0.102 . . . 0.224 0.170 0.170 0.170 . 0.342 0.102 . 0.102 . E 3.228 1200 0.530 0.015 0.194 0.075 0.015 0.273 0.143 0.087 0.098 0.071 0.053 . . 0.062 . 0.033 . 0.015 0.015 0.209 0.180 0.273 0.383 0.127 0.180 . 0.155 0.043 . S 3.172 212 0.193 . 0.127 0.108 0.127 0.475 0.348 0.036 . 0.364 0.036 . . 0.036 . . . . . 0.386 0.364 . 0.063 0.434 0.036 . 0.036 . . U 3.064 1153 0.525 0.045 0.159 0.055 0.034 0.423 0.109 0.064 0.077 0.120 0.028 . . 0.034 . 0.039 . . 0.028 0.194 0.094 0.227 0.281 0.150 0.165 . 0.127 0.086 . P 3.021 216 0.160 0.086 0.191 0.063 . . 0.244 . 0.176 . . . . . 0.327 . . . . 0.160 0.436 0.289 0.527 0.036 . . 0.327 . . 4 2.772 47 0.303 0.525 . . . 0.303 0.253 . . 0.344 . . . 0.194 . 0.194 . . 0.118 0.303 . 0.118 . . . . . 0.118 . H 2.740 702 0.059 0.526 0.094 0.013 0.024 0.013 0.495 . 0.042 . . . . 0.013 0.434 . 0.034 . . 0.300 0.216 0.124 0.176 0.013 . . 0.162 . . 2 2.664 372 0.470 0.041 0.262 . 0.023 0.084 0.531 . 0.041 0.041 . . . . . 0.023 0.023 . . 0.140 0.477 0.150 0.140 0.056 0.070 . 0.070 0.023 . O 2.595 1127 0.107 0.056 0.009 0.074 . 0.525 0.009 0.023 0.009 0.508 0.502 0.040 0.079 0.046 . 0.186 0.056 0.046 0.051 0.074 . 0.040 0.029 0.065 0.046 0.009 . . 0.009 X 2.572 866 0.043 0.438 0.101 0.176 . 0.270 0.096 . . 0.156 . . . 0.028 . 0.050 . . 0.011 0.438 0.215 . . 0.527 . 0.011 . . 0.011 Y 2.572 1053 0.042 0.367 0.069 0.212 . 0.225 0.117 . . 0.163 0.017 0.010 . 0.083 . 0.037 . . . 0.460 0.222 . . 0.522 . . 0.017 . 0.010 D 2.490 1111 0.071 0.529 0.080 0.009 0.035 . 0.515 . 0.035 . . . 0.009 . 0.438 . 0.023 . . 0.318 0.141 0.084 0.112 . . . 0.092 . . A 2.436 1990 . . 0.022 0.038 0.514 0.018 0.006 . 0.006 0.018 0.465 0.496 0.466 0.029 . 0.010 0.141 0.120 . 0.018 0.006 . . 0.022 . . . . 0.044 8 2.295 695 0.308 0.119 0.119 . 0.088 0.074 0.437 0.059 0.051 0.014 0.024 . . 0.014 . . 0.014 . . . 0.286 0.209 0.173 0.024 0.142 . 0.101 0.024 0.014 F 2.240 36 0.144 0.144 . . . . 0.232 . 0.232 . . . . . 0.352 . . . . . 0.299 . 0.487 . . . 0.352 . . C 2.239 2359 0.012 0.517 0.033 0.144 0.016 0.098 0.058 0.005 0.022 0.054 0.022 . . 0.076 . 0.022 . . 0.009 0.470 0.084 0.012 0.019 0.529 0.009 . 0.028 . . W 2.159 271 0.072 0.524 0.030 0.030 0.030 . 0.529 . 0.052 . . . . . 0.052 . 0.030 . . 0.345 0.150 0.072 0.122 . . . 0.122 . . R 2.122 915 0.419 0.034 0.154 0.019 0.011 0.011 0.335 0.034 0.011 0.011 . . . . . 0.019 0.011 . . 0.211 0.235 0.129 0.165 0.034 0.165 . 0.048 0.066 . I 1.994 92 . . . . 0.328 . . . . . 0.525 . 0.506 . . . 0.439 0.197 . . . . . . . . . . . Q 1.915 277 0.148 0.173 . 0.105 0.370 . 0.071 . . . 0.228 0.029 . . . 0.298 . . 0.105 0.029 0.051 0.051 0.051 0.088 0.088 . 0.029 . . V 1.842 1081 0.036 0.518 0.062 . 0.042 . 0.528 . 0.009 . . . . . 0.047 . . . . 0.249 0.118 0.052 0.072 0.009 . . 0.098 . . L 1.792 18 0.434 . 0.232 . 0.431 . . 0.232 . . . . . . . . . . . 0.232 . . . . 0.232 . . . . Z 1.680 345 0.043 0.512 0.114 0.060 . . 0.148 . . . . . . 0.024 . . . . . 0.448 0.060 . 0.024 0.222 . . 0.024 . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 2.854 23881 0.346 0.330 0.208 0.149 0.217 0.206 0.299 0.075 0.061 0.150 0.180 0.115 0.106 0.094 0.088 0.061 0.031 0.021 0.014 0.274 0.211 0.174 0.199 0.305 0.202 0.018 0.099 0.073 0.008 The big problems now are "V" = "QD" ("QDC", "QDA") and "C" ("CC", "CG", "C8G"). "DZG" "HZG" "PZG" "FZG" should be separate letters. cat .voyn.fsg \ | /n/gnu/bin/tr '\012' ' ' \ | /n/gnu/bin/sed \ -e 's/CM/AN/g' \ -e 's/CI/A/g' \ -e 's/IL/N/g' \ -e 's/IN/M/g' \ -e 's/6/8/g' \ -e 's/A /G /g' \ \ -e 's/G /G/g' \ -e 's/M /M/g' \ -e 's/N /N/g' \ -e 's/K /K/g' \ -e 's/4O/Q/g' \ -e 's/ Q/Q/g' \ \ -e 's/O\([DHPF]\)/ O\1/g' \ \ -e 's/DZ/a/g' \ -e 's/FZ/e/g' \ -e 's/HZ/i/g' \ -e 's/PZ/o/g' \ -e 's/OE/U/g' \ -e 's/SC/X/g' \ -e 's/TC/Y/g' \ -e 's/CC/W/g' \ -e 's/8G/B/g' \ -e 's/QD/q/g' \ -e 's/QH/p/g' \ | /n/gnu/bin/fold -s -w 200 \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' CO8EDAQSHRNM2ZPIKFGaeioUWXYBqp' Digraph counts: TT C O 8 E D A Q S H R N M 2 P I K F G a e i o U W X Y B q 4 T p L ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 2561 303 6 778 129 56 49 103 . 47 46 22 . . 76 28 1 . 6 47 3 1 3 2 236 11 274 234 19 . 5 76 . . B 2057 198 6 21 127 149 35 16 138 32 56 58 . . 74 34 1 1 . 37 1 . 6 2 104 . 81 105 21 559 18 35 142 . A 1990 . . 5 10 554 3 1 . 1 2 399 483 401 7 1 54 43 . 4 1 . 2 1 1 . . . 5 . . . . 12 G 1731 137 2 31 151 174 85 6 91 24 86 66 . . 92 25 . . 2 33 2 . 3 1 94 1 65 72 24 326 21 32 83 2 E 1200 470 1 51 14 2 86 33 17 20 13 9 . . 11 5 . 2 2 57 . . . . 46 1 86 156 28 46 . 37 7 . U 1153 488 1 37 9 5 184 22 13 14 25 4 . . 5 6 . . 4 49 . . . . 18 6 62 87 34 37 . 27 16 . O 1127 21 3 1 13 . 348 1 3 1 294 286 6 14 7 44 9 7 8 13 6 . 5 1 . 6 6 4 11 7 1 . . 1 q 1074 5 236 10 . 6 . 435 . 1 . . . . . . . . . 67 . . . . 23 252 8 12 1 . . 18 . . C 1063 2 . 8 41 3 35 15 2 6 15 4 . . 22 5 . . 2 281 3 . 2 1 26 . 3 5 574 1 . 7 . . Y 1053 6 124 11 51 . 24 22 . . 14 2 1 . 14 4 . . . 206 32 . 21 1 55 2 . . 460 . . 2 . 1 D 919 12 176 14 1 5 . 312 . 5 . . . 1 . . 3 . . 103 . . . . 30 203 15 22 . . . 17 . . R 915 578 2 28 2 1 1 93 4 1 1 . . . . 2 1 . . 44 . . . . 52 2 22 31 4 31 . 6 9 . X 866 5 150 15 32 . 26 14 . . 11 . . . 3 4 . . 1 150 35 . 16 2 43 . . . 357 . 1 . . 1 8 695 61 6 15 . 10 8 422 7 5 1 2 . . 1 . 1 . . . . . . . 54 9 33 25 2 18 . 12 2 1 W 648 1 29 2 25 1 1 5 . . 1 2 . . 6 . . . . 207 . . . . 6 . . . 361 . . 1 . . H 583 6 148 11 1 2 1 169 . 4 . . . . 1 . 3 . . 59 . . . . 35 77 16 26 1 . . 23 . . N 491 74 1 14 28 4 . 11 5 14 1 1 . . 10 3 . . . 11 . . 4 2 79 2 89 77 6 14 . 38 3 . M 440 63 1 9 21 3 3 4 2 22 2 1 . . 15 3 1 . . 14 2 1 . . 60 . 69 85 6 19 . 30 4 . T 400 6 . 14 16 13 17 27 . 1 8 4 . . 6 4 . . 1 62 66 2 31 8 31 . 1 . 81 . . 1 . . 2 372 77 2 25 . 1 4 133 . 2 1 . . . . 1 1 . . 10 1 . 1 . 80 . 11 10 3 4 . 4 1 . Q 286 8 . . 5 191 . 3 . . . 15 1 . . 23 . . 5 1 7 . 2 . 2 10 2 2 4 4 . 1 . . p 269 3 62 1 1 1 . 92 . 2 . . . . . . 1 . . 29 . . . . 8 54 3 6 . . . 6 . . S 212 9 . 5 4 5 6 23 1 . 6 1 . . 1 . . . . 28 39 . 19 . 25 . . 2 36 1 . 1 . . a 199 1 52 2 1 . . 5 . . . . . . . . . . . 125 . . . . 1 1 . 1 9 . . 1 . . P 195 7 1 9 2 . . 13 . 8 . . . . . . . . . 7 . . . . 37 2 17 70 1 . . 21 . . i 121 1 30 4 . . . 3 . . . . . . 1 . . . . 74 . . . . 1 1 . . 6 . . . . . I 92 . . . . 9 . . . . . 39 . 24 . . 16 4 . . . . . . . . . . . . . . . . K 57 3 . 4 9 2 . . 2 . . . . . 18 1 . . . 3 . . 1 . 2 . 2 2 . 6 1 . 1 . 4 47 4 13 . . . 3 3 . . . . . . 2 2 . . 1 4 1 . 5 . . 7 1 . . . . . 1 . F 32 1 1 . . . . 2 . 2 . . . . . . . . . . . . . . 3 . . 19 . . . 4 . . o 21 . 9 1 1 . . 2 . . . . . . . . . . . 5 . . . . 1 . . . 2 . . . . . L 18 11 . 1 . 3 . . 1 . . . . . . . . . . 1 . . . . . . . . . 1 . . . . e 4 . 1 . 1 . . . . . . . . . . . . . . . . . . . . 1 . . 1 . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 22891 2561 1063 1127 695 1200 919 1990 286 212 583 915 491 440 372 195 92 57 32 1731 199 4 121 21 1153 648 866 1053 2057 1074 47 400 269 18 Next-symbol probability (× 99): TT TT C O 8 E D A Q S H R N M 2 P I K F G a e i o U W X Y B q 4 T p L ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- G 4.005 1731 8 . 2 9 10 5 . 5 1 5 4 . . 5 1 . . . 2 . . . . 5 . 4 4 1 19 1 2 5 . B 3.786 2057 10 . 1 6 7 2 1 7 2 3 3 . . 4 2 . . . 2 . . . . 5 . 4 5 1 27 1 2 7 . M 3.536 440 14 . 2 5 1 1 1 . 5 . . . . 3 1 . . . 3 . . . . 13 . 16 19 1 4 . 7 1 . T 3.521 400 1 . 3 4 3 4 7 . . 2 1 . . 1 1 . . . 15 16 . 8 2 8 . . . 20 . . . . . N 3.489 491 15 . 3 6 1 . 2 1 3 . . . . 2 1 . . . 2 . . 1 . 16 . 18 16 1 3 . 8 1 . 3.429 2561 12 . 30 5 2 2 4 . 2 2 1 . . 3 1 . . . 2 . . . . 9 . 11 9 1 . . 3 . . S 3.386 212 4 . 2 2 2 3 11 . . 3 . . . . . . . . 13 18 . 9 . 12 . . 1 17 . . . . . K 3.261 57 5 . 7 16 3 . . 3 . . . . . 31 2 . . . 5 . . 2 . 3 . 3 3 . 10 2 . 2 . 4 3.238 47 8 27 . . . 6 6 . . . . . . 4 4 . . 2 8 2 . 11 . . 15 2 . . . . . 2 . E 3.230 1200 39 . 4 1 . 7 3 1 2 1 1 . . 1 . . . . 5 . . . . 4 . 7 13 2 4 . 3 1 . U 3.070 1153 42 . 3 1 . 16 2 1 1 2 . . . . 1 . . . 4 . . . . 2 1 5 7 3 3 . 2 1 . H 2.866 583 1 25 2 . . . 29 . 1 . . . . . . 1 . . 10 . . . . 6 13 3 4 . . . 4 . . P 2.851 195 4 1 5 1 . . 7 . 4 . . . . . . . . . 4 . . . . 19 1 9 36 1 . . 11 . . O 2.680 1127 2 . . 1 . 31 . . . 26 25 1 1 1 4 1 1 1 1 1 . . . . 1 1 . 1 1 . . . . 2 2.679 372 20 1 7 . . 1 35 . 1 . . . . . . . . . 3 . . . . 21 . 3 3 1 1 . 1 . . X 2.678 866 1 17 2 4 . 3 2 . . 1 . . . . . . . . 17 4 . 2 . 5 . . . 41 . . . . . Y 2.674 1053 1 12 1 5 . 2 2 . . 1 . . . 1 . . . . 19 3 . 2 . 5 . . . 43 . . . . . D 2.618 919 1 19 2 . 1 . 34 . 1 . . . . . . . . . 11 . . . . 3 22 2 2 . . . 2 . . p 2.542 269 1 23 . . . . 34 . 1 . . . . . . . . . 11 . . . . 3 20 1 2 . . . 2 . . A 2.441 1990 . . . . 28 . . . . . 20 24 20 . . 3 2 . . . . . . . . . . . . . . . 1 8 2.318 695 9 1 2 . 1 1 60 1 1 . . . . . . . . . . . . . . 8 1 5 4 . 3 . 2 . . o 2.290 21 . 42 5 5 . . 9 . . . . . . . . . . . 24 . . . . 5 . . . 9 . . . . . q 2.251 1074 . 22 1 . 1 . 40 . . . . . . . . . . . 6 . . . . 2 23 1 1 . . . 2 . . C 2.156 1063 . . 1 4 . 3 1 . 1 1 . . . 2 . . . . 26 . . . . 2 . . . 53 . . 1 . . R 2.126 915 63 . 3 . . . 10 . . . . . . . . . . . 5 . . . . 6 . 2 3 . 3 . 1 1 . Q 2.080 286 3 . . 2 66 . 1 . . . 5 . . . 8 . . 2 . 2 . 1 . 1 3 1 1 1 1 . . . . e 2.000 4 . 25 . 25 . . . . . . . . . . . . . . . . . . . . 25 . . 25 . . . . . I 1.994 92 . . . . 10 . . . . . 42 . 26 . . 17 4 . . . . . . . . . . . . . . . . F 1.954 32 3 3 . . . . 6 . 6 . . . . . . . . . . . . . . 9 . . 59 . . . 12 . . L 1.792 18 61 . 6 . 17 . . 6 . . . . . . . . . . 6 . . . . . . . . . 6 . . . . W 1.681 648 . 4 . 4 . . 1 . . . . . . 1 . . . . 32 . . . . 1 . . . 55 . . . . . i 1.671 121 1 25 3 . . . 2 . . . . . . 1 . . . . 61 . . . . 1 1 . . 5 . . . . . a 1.560 199 . 26 1 . . . 2 . . . . . . . . . . . 62 . . . . . . . . 4 . . . . . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 2.917 22891 11 5 5 3 5 4 9 1 1 3 4 2 2 2 1 0 0 0 7 1 0 1 0 5 3 4 5 9 5 0 2 1 0 Previous-symbol probability (× 99): TT C O 8 E D A Q S H R N M 2 P I K F G a e i o U W X Y B q 4 T p L -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 11 12 1 68 18 5 5 5 . 22 8 2 . . 20 14 1 . 19 3 1 25 2 9 20 2 31 22 1 . 11 19 . . C 5 . . 1 6 . 4 1 1 3 3 . . . 6 3 . . 6 16 1 . 2 5 2 . . . 28 . . 2 . . O 5 1 . . 2 . 37 . 1 . 50 31 1 3 2 22 10 12 25 1 3 . 4 5 . 1 1 . 1 1 2 . . 6 8 3 2 1 1 . 1 1 21 2 2 . . . . . . 1 . . . . . . . 5 1 4 2 . 2 . 3 1 6 E 5 18 . 4 2 . 9 2 6 9 2 1 . . 3 3 . 3 6 3 . . . . 4 . 10 15 1 4 . 9 3 . D 4 . 16 1 . . . 16 . 2 . . . . . . 3 . . 6 . . . . 3 31 2 2 . . . 4 . . A 9 . . . 1 46 . . . . . 43 97 90 2 1 58 75 . . . . 2 5 . . . . . . . . . 66 Q 1 . . . 1 16 . . . . . 2 . . . 12 . . 15 . 3 . 2 . . 2 . . . . . . . . S 1 . . . 1 . 1 1 . . 1 . . . . . . . . 2 19 . 16 . 2 . . . 2 . . . . . H 3 . 14 1 . . . 8 . 2 . . . . . . 3 . . 3 . . . . 3 12 2 2 . . . 6 . . R 4 22 . 2 . . . 5 1 . . . . . . 1 1 . . 3 . . . . 4 . 3 3 . 3 . 1 3 . N 2 3 . 1 4 . . 1 2 7 . . . . 3 2 . . . 1 . . 3 9 7 . 10 7 . 1 . 9 1 . M 2 2 . 1 3 . . . 1 10 . . . . 4 2 1 . . 1 1 25 . . 5 . 8 8 . 2 . 7 1 . 2 2 3 . 2 . . . 7 . 1 . . . . . 1 1 . . 1 . . 1 . 7 . 1 1 . . . 1 . . P 1 . . 1 . . . 1 . 4 . . . . . . . . . . . . . . 3 . 2 7 . . . 5 . . I 0 . . . . 1 . . . . . 4 . 5 . . 17 7 . . . . . . . . . . . . . . . . K 0 . . . 1 . . . 1 . . . . . 5 1 . . . . . . 1 . . . . . . 1 2 . . . F 0 . . . . . . . . 1 . . . . . . . . . . . . . . . . . 2 . . . 1 . . G 7 5 . 3 22 14 9 . 32 11 15 7 . . 24 13 . . 6 2 1 . 2 5 8 . 7 7 1 30 44 8 31 11 a 1 . 5 . . . . . . . . . . . . . . . . 7 . . . . . . . . . . . . . . e 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i 1 . 3 . . . . . . . . . . . . . . . . 4 . . . . . . . . . . . . . . o 0 . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . U 5 19 . 3 1 . 20 1 5 7 4 . . . 1 3 . . 12 3 . . . . 2 1 7 8 2 3 . 7 6 . W 3 . 3 . 4 . . . . . . . . . 2 . . . . 12 . . . . 1 . . . 17 . . . . . X 4 . 14 1 5 . 3 1 . . 2 . . . 1 2 . . 3 9 17 . 13 9 4 . . . 17 . 2 . . 6 Y 5 . 12 1 7 . 3 1 . . 2 . . . 4 2 . . . 12 16 . 17 5 5 . . . 22 . . . . 6 B 9 8 1 2 18 12 4 1 48 15 10 6 . . 20 17 1 2 . 2 . . 5 9 9 . 9 10 1 52 38 9 52 . q 5 . 22 1 . . . 22 . . . . . . . . . . . 4 . . . . 2 39 1 1 . . . 4 . . 4 0 . 1 . . . . . . . . . . . 1 1 . . 3 . . . 4 . . 1 . . . . . . . . T 2 . . 1 2 1 2 1 . . 1 . . . 2 2 . . 3 4 33 50 25 38 3 . . . 4 . . . . . p 1 . 6 . . . . 5 . 1 . . . . . . 1 . . 2 . . . . 1 8 . 1 . . . 1 . . L 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 Symbol entropy: 4.416 Next-symbol entropy: TT TT C O 8 E D A Q S H R N M 2 P I K F G a e i o U W X Y B q 4 T p L ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- G 4.005 1731 0.290 0.011 0.104 0.307 0.333 0.214 0.028 0.223 0.086 0.215 0.180 . . 0.225 0.088 . . 0.011 0.109 0.011 . 0.016 0.006 0.228 0.006 0.178 0.191 0.086 0.454 0.077 0.106 0.210 0.011 B 3.786 2057 0.325 0.025 0.068 0.248 0.274 0.100 0.054 0.261 0.093 0.142 0.145 . . 0.173 0.098 0.005 0.005 . 0.104 0.005 . 0.025 0.010 0.218 . 0.184 0.219 0.068 0.511 0.060 0.100 0.266 . M 3.536 440 0.401 0.020 0.115 0.209 0.049 0.049 0.062 0.035 0.216 0.035 0.020 . . 0.166 0.049 0.020 . . 0.158 0.035 0.020 . . 0.392 . 0.419 0.458 0.084 0.196 . 0.264 0.062 . T 3.521 400 0.091 . 0.169 0.186 0.161 0.194 0.263 . 0.022 0.113 0.066 . . 0.091 0.066 . . 0.022 0.417 0.429 0.038 0.286 0.113 0.286 . 0.022 . 0.467 . . 0.022 . . N 3.489 491 0.411 0.018 0.146 0.236 0.057 . 0.123 0.067 0.146 0.018 0.018 . . 0.114 0.045 . . . 0.123 . . 0.057 0.032 0.424 0.032 0.447 0.419 0.078 0.146 . 0.286 0.045 . 3.429 2561 0.364 0.020 0.522 0.217 0.121 0.109 0.186 . 0.106 0.104 0.059 . . 0.151 0.071 0.004 . 0.020 0.106 0.011 0.004 0.011 0.008 0.317 0.034 0.345 0.315 0.052 . 0.018 0.151 . . S 3.386 212 0.193 . 0.127 0.108 0.127 0.146 0.348 0.036 . 0.146 0.036 . . 0.036 . . . . 0.386 0.449 . 0.312 . 0.364 . . 0.063 0.434 0.036 . 0.036 . . K 3.261 57 0.224 . 0.269 0.420 0.170 . . 0.170 . . . . . 0.525 0.102 . . . 0.224 . . 0.102 . 0.170 . 0.170 0.170 . 0.342 0.102 . 0.102 . 4 3.238 47 0.303 0.513 . . . 0.253 0.253 . . . . . . 0.194 0.194 . . 0.118 0.303 0.118 . 0.344 . . 0.409 0.118 . . . . . 0.118 . E 3.230 1200 0.530 0.009 0.194 0.075 0.015 0.273 0.143 0.087 0.098 0.071 0.053 . . 0.062 0.033 . 0.015 0.015 0.209 . . . . 0.180 0.009 0.273 0.383 0.127 0.180 . 0.155 0.043 . U 3.070 1153 0.525 0.009 0.159 0.055 0.034 0.423 0.109 0.073 0.077 0.120 0.028 . . 0.034 0.039 . . 0.028 0.194 . . . . 0.094 0.039 0.227 0.281 0.150 0.159 . 0.127 0.086 . H 2.866 583 0.068 0.502 0.108 0.016 0.028 0.016 0.518 . 0.049 . . . . 0.016 . 0.039 . . 0.334 . . . . 0.244 0.386 0.142 0.200 0.016 . . 0.184 . . P 2.851 195 0.172 0.039 0.205 0.068 . . 0.260 . 0.189 . . . . . . . . . 0.172 . . . . 0.455 0.068 0.307 0.531 0.039 . . 0.346 . . O 2.680 1127 0.107 0.023 0.009 0.074 . 0.523 0.009 0.023 0.009 0.506 0.502 0.040 0.079 0.046 0.183 0.056 0.046 0.051 0.074 0.040 . 0.035 0.009 . 0.040 0.040 0.029 0.065 0.046 0.009 . . 0.009 2 2.679 372 0.470 0.041 0.262 . 0.023 0.070 0.531 . 0.041 0.023 . . . . 0.023 0.023 . . 0.140 0.023 . 0.023 . 0.477 . 0.150 0.140 0.056 0.070 . 0.070 0.023 . X 2.678 866 0.043 0.438 0.101 0.176 . 0.152 0.096 . . 0.080 . . . 0.028 0.036 . . 0.011 0.438 0.187 . 0.106 0.020 0.215 . . . 0.527 . 0.011 . . 0.011 Y 2.674 1053 0.042 0.363 0.069 0.212 . 0.124 0.117 . . 0.083 0.017 0.010 . 0.083 0.031 . . . 0.460 0.153 . 0.113 0.010 0.222 0.017 . . 0.522 . . 0.017 . 0.010 D 2.618 919 0.082 0.457 0.092 0.011 0.041 . 0.529 . 0.041 . . . 0.011 . . 0.027 . . 0.354 . . . . 0.161 0.481 0.097 0.129 . . . 0.106 . . p 2.542 269 0.072 0.488 0.030 0.030 0.030 . 0.529 . 0.053 . . . . . . 0.030 . . 0.346 . . . . 0.151 0.465 0.072 0.122 . . . 0.122 . . A 2.441 1990 . . 0.022 0.038 0.514 0.014 0.006 . 0.006 0.010 0.465 0.496 0.466 0.029 0.006 0.141 0.120 . 0.018 0.006 . 0.010 0.006 0.006 . . . 0.022 . . . . 0.044 8 2.318 695 0.308 0.059 0.119 . 0.088 0.074 0.437 0.067 0.051 0.014 0.024 . . 0.014 . 0.014 . . . . . . . 0.286 0.081 0.209 0.173 0.024 0.137 . 0.101 0.024 0.014 o 2.290 21 . 0.524 0.209 0.209 . . 0.323 . . . . . . . . . . . 0.493 . . . . 0.209 . . . 0.323 . . . . . q 2.251 1074 0.036 0.480 0.063 . 0.042 . 0.528 . 0.009 . . . . . . . . . 0.250 . . . . 0.119 0.491 0.053 0.072 0.009 . . 0.099 . . C 2.156 1063 0.017 . 0.053 0.181 0.024 0.162 0.087 0.017 0.042 0.087 0.030 . . 0.116 0.036 . . 0.017 0.507 0.024 . 0.017 0.009 0.131 . 0.024 0.036 0.480 0.009 . 0.048 . . R 2.126 915 0.419 0.019 0.154 0.019 0.011 0.011 0.335 0.034 0.011 0.011 . . . . 0.019 0.011 . . 0.211 . . . . 0.235 0.019 0.129 0.165 0.034 0.165 . 0.048 0.066 . Q 2.080 286 0.144 . . 0.102 0.389 . 0.069 . . . 0.223 0.029 . . 0.292 . . 0.102 0.029 0.131 . 0.050 . 0.050 0.169 0.050 0.050 0.086 0.086 . 0.029 . . e 2.000 4 . 0.500 . 0.500 . . . . . . . . . . . . . . . . . . . . 0.500 . . 0.500 . . . . . I 1.994 92 . . . . 0.328 . . . . . 0.525 . 0.506 . . 0.439 0.197 . . . . . . . . . . . . . . . . F 1.954 32 0.156 0.156 . . . . 0.250 . 0.250 . . . . . . . . . . . . . . 0.320 . . 0.447 . . . 0.375 . . L 1.792 18 0.434 . 0.232 . 0.431 . . 0.232 . . . . . . . . . . 0.232 . . . . . . . . . 0.232 . . . . W 1.681 648 0.014 0.201 0.026 0.181 0.014 0.014 0.054 . . 0.014 0.026 . . 0.063 . . . . 0.526 . . . . 0.063 . . . 0.470 . . 0.014 . . i 1.671 121 0.057 0.499 0.163 . . . 0.132 . . . . . . 0.057 . . . . 0.434 . . . . 0.057 0.057 . . 0.215 . . . . . a 1.560 199 0.038 0.506 0.067 0.038 . . 0.134 . . . . . . . . . . . 0.421 . . . . 0.038 0.038 . 0.038 0.202 . . 0.038 . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 2.917 22891 0.354 0.206 0.214 0.153 0.223 0.186 0.306 0.079 0.063 0.135 0.186 0.119 0.110 0.097 0.059 0.032 0.022 0.013 0.282 0.060 0.002 0.040 0.009 0.217 0.146 0.179 0.204 0.312 0.207 0.018 0.102 0.075 0.008 Now we have too many spaces. The abbreviations "e" = "FZ" and "o" = "PZ" are useless. Big problems: "W" = "CC" ("CCG" "CC8G" ), "C" ("CG", "C8G"), "a" = "DZ" ("DZG", "DZC"), "i" = "HZ" ("HZG", "HZC"), "q" = "QD" = "4OD" ("4ODA", "4ODC", "4ODCC"), "R" ("R ") Let's get rid of the remaining "I". Let's also map "AM" "AN" and final "AR" to "m" "n" "r". Let's go by steps: cat .voyn.fsg \ | /n/gnu/bin/tr '\012' ' ' \ | /n/gnu/bin/sed \ -e 's/CM/AN/g' \ -e 's/CI/A/g' \ -e 's/IL/N/g' \ -e 's/IN/M/g' \ -e 's/I*\([MNRK]\)/\1/g' \ -e 's/6/8/g' \ -e 's/A /G /g' \ \ -e 's/G /G/g' \ -e 's/AM */m/g' \ -e 's/AN */n/g' \ -e 's/AK */k/g' \ -e 's/ *4O/Q/g' \ \ -e 's/O\([DHPF]\)/ O\1/g' \ \ -e 's/OE/U/g' \ -e 's/AR/r/g' \ -e 's/OR/s/g' \ -e 's/SC/X/g' \ -e 's/TC/Y/g' \ -e 's/CCG/x/g' \ -e 's/CC8G/y/g' \ -e 's/CG/u/g' \ -e 's/C8G/v/g' \ -e 's/CC/W/g' \ -e 's/DZ/a/g' \ -e 's/HZ/i/g' \ -e 's/8G/B/g' \ -e 's/QD/q/g' \ -e 's/QH/p/g' \ | /n/gnu/bin/fold -s -w 200 \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' CO8EDAQSHRNM2PKGmnkrsaiUWXYxyuvBqpFZ4LI' Digraph counts: TT C O 8 E D A Q S H R N M 2 P K G m n k r s a i U W X Y x y u v B q p F Z 4 L T I ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 2584 291 5 730 130 57 50 33 . 47 46 22 . 1 82 30 . 48 32 16 4 18 50 3 4 243 5 279 243 2 3 1 1 19 . . 7 . 5 . 77 . G 1243 88 2 6 118 106 76 1 64 18 71 36 . . 78 19 . 26 1 . 1 2 15 2 3 62 . 51 58 1 . . . 21 223 58 2 . 14 1 19 . E 1200 470 1 21 14 2 86 9 17 20 13 9 . . 11 5 2 57 8 5 2 9 30 . . 46 . 86 156 . 1 . . 28 46 7 2 . . . 37 . U 1153 488 2 9 9 5 184 5 13 14 25 4 . . 5 6 . 49 6 7 . 4 28 . . 18 3 62 87 1 . . 1 34 37 16 4 . . . 27 . B 1122 91 4 2 74 64 24 3 89 18 42 26 . . 45 26 1 19 2 . . 5 8 . 3 53 . 35 53 . . . 1 11 321 77 . . 11 . 13 1 q 1074 5 34 6 . 6 . 137 . 1 . . . . . . . 67 85 157 4 52 4 . . 23 7 8 12 87 153 41 166 1 . . . . . . 18 . Y 1053 6 36 1 51 . 24 12 . . 14 2 1 . 14 5 . 206 . 1 1 8 10 32 21 55 1 . . 1 . 55 33 460 . . . . . 1 2 . D 919 12 41 4 1 5 . 63 . 5 . 2 . 2 . . . 103 70 118 8 53 10 . . 30 19 15 22 67 107 30 115 . . . . . . . 17 . X 866 5 42 2 32 . 26 8 . . 11 . . . 3 6 . 150 . . 1 5 13 35 16 43 . . . . . 51 57 357 . . 1 . 1 1 . . O 839 21 3 . 13 . 348 . 3 1 294 . 6 20 7 45 8 13 . 1 . . 1 6 5 . . 6 4 2 3 . 1 11 7 . 8 . 1 1 . . 8 695 61 1 . . 10 8 133 7 5 1 2 . . 1 . 1 . 98 55 11 125 15 . . 54 . 33 25 4 4 3 3 2 18 2 . . . 1 12 . A 616 . . 5 10 554 3 1 . 1 2 . . . 7 2 . 4 . . . . . 1 2 1 . . . . . . . 5 . . . . . 12 . 6 H 583 6 25 1 1 2 1 57 . 4 . 1 . 1 1 . 1 59 23 43 1 45 10 . . 35 8 16 26 30 38 25 99 1 . . . . . . 23 . v 558 69 1 . 36 51 7 1 28 9 9 19 . . 18 7 . 13 . 1 . 1 6 1 2 31 . 32 29 . . . . 7 126 33 . . 6 . 15 . n 483 73 1 8 28 4 . 6 5 14 1 1 . . 10 5 . 11 1 1 . 3 6 . 4 77 1 86 76 . 1 . . 6 14 3 . . . . 37 . r 431 330 . 2 . . . 9 3 . . . . . . 1 . 21 1 1 1 5 7 . . 12 . 2 6 . . . . 2 20 7 . . . . 1 . m 416 60 1 3 21 3 2 2 1 22 2 1 . . 15 3 . 12 . . . 2 5 2 . 55 . 67 77 . . . . 6 18 4 1 . . . 30 1 T 400 6 . 5 16 13 17 14 . 1 8 4 . . 6 12 . 62 . 1 4 8 9 66 31 31 . 1 . . . . . 81 . . 3 . . . 1 . y 377 38 . 3 17 34 4 3 21 5 5 13 . . 11 3 . 5 . . . . 2 . 1 20 . 14 23 . . . . 3 112 32 . . 1 . 7 . 2 372 77 1 7 . 1 4 32 . 2 1 1 . . . 1 . 10 41 31 1 28 18 1 1 80 . 11 10 . . 1 . 3 4 1 . . . . 4 . s 288 198 . 3 . . 1 7 . . . . . . . . . 15 7 6 . 5 3 . . 19 . 6 5 . . . 1 . 9 2 . . . . 1 . Q 286 8 2 . 5 191 . 1 . . . 15 1 . . 23 . 1 1 . . 1 . 7 2 2 1 2 2 1 6 . . 4 4 . 5 . . . 1 . u 271 22 . 1 19 33 6 . 19 4 11 11 . . 10 5 . 5 . . . . 4 . . 16 . 7 6 . . . . 3 63 16 . . 2 1 7 . p 269 3 9 . 1 1 . 34 . 2 . 1 . . . . . 29 15 24 1 18 1 . . 8 5 3 6 7 41 8 46 . . . . . . . 6 . C 234 2 . 2 41 3 35 6 2 6 15 4 . . 22 6 . . 1 2 . 6 6 3 2 26 . 3 5 10 16 . . . 1 . 2 . . . 7 . x 217 27 . 1 14 35 3 . 8 2 4 19 . . 4 2 . 2 1 . . . 4 . . 16 . 7 8 . . . . . 40 9 . . 5 . 6 . P 216 7 1 4 2 . . 6 . 8 . . . . . . . 7 2 1 . 4 5 . . 37 . 17 70 1 1 . . 1 . . . 21 . . 21 . S 212 9 . 1 4 5 6 10 1 . 6 1 . . 1 . . 28 1 1 1 10 4 39 19 25 . . 2 . . . . 36 1 . . . . . 1 . a 199 1 2 1 1 . . 4 . . . . . . . . . 125 . 1 . . 1 . . 1 1 . 1 . . 30 20 9 . . . . . . 1 . R 196 50 . 4 2 1 . 11 1 1 1 . . . . 1 . 8 19 10 3 8 9 . . 21 . 14 20 1 1 . 1 2 2 . . . . . 4 1 i 121 1 4 1 . . . 2 . . . . . . 1 . . 74 . . . 1 3 . . 1 1 . . . . 18 8 6 . . . . . . . . W 54 1 3 1 25 1 1 2 . . 1 2 . . 6 . . . . . . 3 1 . . 6 . . . . . . . . . . . . . . 1 . 4 47 4 13 . . . 3 2 . . . . . . 2 2 . 4 . . . 1 . 1 5 . 2 1 . 1 2 1 1 . . 1 1 . . . . . k 44 3 . 3 8 . . . 2 . . . . . 12 1 . 3 . . . . . . . 1 . 2 2 . . . . . 5 1 . . 1 . . . F 36 1 . . . . . 1 . 2 . . . . . . . . 1 . . . . . . 3 . . 19 . . 1 . . . . . 4 . . 4 . Z 25 . . 1 2 . . 1 . . . . . . . . . 5 . . . 1 . . . 1 . . . 1 . 6 4 3 . . . . . . . . M 24 21 . . . . . . 1 . . . . . . . . 1 . . . . . . . . . . . . . . . . 1 . . . . . . . L 18 11 . 1 . 3 . . 1 . . . . . . . . 1 . . . . . . . . . . . . . . . . 1 . . . . . . . K 13 11 . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . . . . . . . I 11 . . . . 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 N 8 7 . . . . . . . . . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 19773 2584 234 839 695 1200 919 616 286 212 583 196 8 24 372 216 13 1243 416 483 44 431 288 199 121 1153 54 866 1053 217 377 271 558 1122 1074 269 36 25 47 18 400 11 Next-symbol probability (× 99): TT TT TT C O 8 E D A Q S H R N M 2 P K G m n k r s a i U W X Y x y u v B q p F Z 4 L T I ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- G 4.057 1243 99 7 . . 9 8 6 . 5 1 6 3 . . 6 2 . 2 . . . . 1 . . 5 . 4 5 . . . . 2 18 5 . . 1 . 2 . H 3.953 583 99 1 4 . . . . 10 . 1 . . . . . . . 10 4 7 . 8 2 . . 6 1 3 4 5 6 4 17 . . . . . . . 4 . C 3.946 234 99 1 . 1 17 1 15 3 1 3 6 2 . . 9 3 . . . 1 . 3 3 1 1 11 . 1 2 4 7 . . . . . 1 . . . 3 . D 3.879 919 99 1 4 . . 1 . 7 . 1 . . . . . . . 11 8 13 1 6 1 . . 3 2 2 2 7 12 3 12 . . . . . . . 2 . v 3.850 558 99 12 . . 6 9 1 . 5 2 2 3 . . 3 1 . 2 . . . . 1 . . 6 . 6 5 . . . . 1 22 6 . . 1 . 3 . u 3.816 271 99 8 . . 7 12 2 . 7 1 4 4 . . 4 2 . 2 . . . . 1 . . 6 . 3 2 . . . . 1 23 6 . . 1 . 3 . B 3.787 1122 99 8 . . 7 6 2 . 8 2 4 2 . . 4 2 . 2 . . . . 1 . . 5 . 3 5 . . . . 1 28 7 . . 1 . 1 . x 3.721 217 99 12 . . 6 16 1 . 4 1 2 9 . . 2 1 . 1 . . . . 2 . . 7 . 3 4 . . . . . 18 4 . . 2 . 3 . R 3.689 196 99 25 . 2 1 1 . 6 1 1 1 . . . . 1 . 4 10 5 2 4 5 . . 11 . 7 10 1 1 . 1 1 1 . . . . . 2 1 p 3.679 269 99 1 3 . . . . 13 . 1 . . . . . . . 11 6 9 . 7 . . . 3 2 1 2 3 15 3 17 . . . . . . . 2 . 4 3.630 47 99 8 27 . . . 6 4 . . . . . . 4 4 . 8 . . . 2 . 2 11 . 4 2 . 2 4 2 2 . . 2 2 . . . . . 3.629 2584 99 11 . 28 5 2 2 1 . 2 2 1 . . 3 1 . 2 1 1 . 1 2 . . 9 . 11 9 . . . . 1 . . . . . . 3 . T 3.627 400 99 1 . 1 4 3 4 3 . . 2 1 . . 1 3 . 15 . . 1 2 2 16 8 8 . . . . . . . 20 . . 1 . . . . . y 3.598 377 99 10 . 1 4 9 1 1 6 1 1 3 . . 3 1 . 1 . . . . 1 . . 5 . 4 6 . . . . 1 29 8 . . . . 2 . 8 3.592 695 99 9 . . . 1 1 19 1 1 . . . . . . . . 14 8 2 18 2 . . 8 . 5 4 1 1 . . . 3 . . . . . 2 . S 3.580 212 99 4 . . 2 2 3 5 . . 3 . . . . . . 13 . . . 5 2 18 9 12 . . 1 . . . . 17 . . . . . . . . q 3.572 1074 99 . 3 1 . 1 . 13 . . . . . . . . . 6 8 14 . 5 . . . 2 1 1 1 8 14 4 15 . . . . . . . 2 . m 3.568 416 99 14 . 1 5 1 . . . 5 . . . . 4 1 . 3 . . . . 1 . . 13 . 16 18 . . . . 1 4 1 . . . . 7 . n 3.561 483 99 15 . 2 6 1 . 1 1 3 . . . . 2 1 . 2 . . . 1 1 . 1 16 . 18 16 . . . . 1 3 1 . . . . 8 . 2 3.469 372 99 20 . 2 . . 1 9 . 1 . . . . . . . 3 11 8 . 7 5 . . 21 . 3 3 . . . . 1 1 . . . . . 1 . E 3.331 1200 99 39 . 2 1 . 7 1 1 2 1 1 . . 1 . . 5 1 . . 1 2 . . 4 . 7 13 . . . . 2 4 1 . . . . 3 . k 3.212 44 99 7 . 7 18 . . . 5 . . . . . 27 2 . 7 . . . . . . . 2 . 5 5 . . . . . 11 2 . . 2 . . . P 3.189 216 99 3 . 2 1 . . 3 . 4 . . . . . . . 3 1 . . 2 2 . . 17 . 8 32 . . . . . . . . 10 . . 10 . U 3.141 1153 99 42 . 1 1 . 16 . 1 1 2 . . . . 1 . 4 1 1 . . 2 . . 2 . 5 7 . . . . 3 3 1 . . . . 2 . X 2.975 866 99 1 5 . 4 . 3 1 . . 1 . . . . 1 . 17 . . . 1 1 4 2 5 . . . . . 6 7 41 . . . . . . . . Z 2.969 25 99 . . 4 8 . . 4 . . . . . . . . . 20 . . . 4 . . . 4 . . . 4 . 24 16 12 . . . . . . . . Y 2.889 1053 99 1 3 . 5 . 2 1 . . 1 . . . 1 . . 19 . . . 1 1 3 2 5 . . . . . 5 3 43 . . . . . . . . W 2.780 54 99 2 6 2 46 2 2 4 . . 2 4 . . 11 . . . . . . 6 2 . . 11 . . . . . . . . . . . . . . 2 . O 2.467 839 99 2 . . 2 . 41 . . . 35 . 1 2 1 5 1 2 . . . . . 1 1 . . 1 . . . . . 1 1 . 1 . . . . . F 2.296 36 99 3 . . . . . 3 . 6 . . . . . . . . 3 . . . . . . 8 . . 52 . . 3 . . . . . 11 . . 11 . Q 2.152 286 99 3 1 . 2 66 . . . . . 5 . . . 8 . . . . . . . 2 1 1 . 1 1 . 2 . . 1 1 . 2 . . . . . i 2.053 121 99 1 3 1 . . . 2 . . . . . . 1 . . 61 . . . 1 2 . . 1 1 . . . . 15 7 5 . . . . . . . . s 1.977 288 99 68 . 1 . . . 2 . . . . . . . . . 5 2 2 . 2 1 . . 7 . 2 2 . . . . . 3 1 . . . . . . a 1.893 199 99 . 1 . . . . 2 . . . . . . . . . 62 . . . . . . . . . . . . . 15 10 4 . . . . . . . . L 1.792 18 99 61 . 6 . 17 . . 6 . . . . . . . . 6 . . . . . . . . . . . . . . . . 6 . . . . . . . r 1.586 431 99 76 . . . . . 2 1 . . . . . . . . 5 . . . 1 2 . . 3 . . 1 . . . . . 5 2 . . . . . . A 0.821 616 99 . . 1 2 89 . . . . . . . . 1 . . 1 . . . . . . . . . . . . . . . 1 . . . . . 2 . 1 K 0.773 13 99 84 . . . 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 . . . . . . . M 0.742 24 99 87 . . . . . . 4 . . . . . . . . 4 . . . . . . . . . . . . . . . . 4 . . . . . . . I 0.684 11 99 . . . . 81 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 N 0.544 8 99 87 . . . . . . . . . . . . . . . . . . . . . . . 12 . . . . . . . . . . . . . . . . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 3.300 19773 99 13 1 4 3 6 5 3 1 1 3 1 0 0 2 1 0 6 2 2 0 2 1 1 1 6 0 4 5 1 2 1 3 6 5 1 0 0 0 0 2 0 Previous-symbol probability (× 99): TT C O 8 E D A Q S H R N M 2 P K G m n k r s a i U W X Y x y u v B q p F Z 4 L T I -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 13 11 2 86 19 5 5 5 . 22 8 11 . 4 22 14 . 4 8 3 9 4 17 1 3 21 9 32 23 1 1 . . 2 . . 19 . 11 . 19 . C 1 . . . 6 . 4 1 1 3 3 2 . . 6 3 . . . . . 1 2 1 2 2 . . . 5 4 . . . . . 6 . . . 2 . O 4 1 1 . 2 . 37 . 1 . 50 . 74 83 2 21 61 1 . . . . . 3 4 . . 1 . 1 1 . . 1 1 . 22 . 2 6 . . 8 3 2 . . . 1 1 21 2 2 . 1 . . . . 8 . 23 11 25 29 5 . . 5 . 4 2 2 1 1 1 . 2 1 . . . 6 3 . E 6 18 . 2 2 . 9 1 6 9 2 5 . . 3 2 15 5 2 1 5 2 10 . . 4 . 10 15 . . . . 2 4 3 6 . . . 9 . D 5 . 17 . . . . 10 . 2 . 1 . 8 . . . 8 17 24 18 12 3 . . 3 35 2 2 31 28 11 20 . . . . . . . 4 . A 3 . . 1 1 46 . . . . . . . . 2 1 . . . . . . . . 2 . . . . . . . . . . . . . . 66 . 54 Q 1 . 1 . 1 16 . . . . . 8 12 . . 11 . . . . . . . 3 2 . 2 . . . 2 . . . . . 14 . . . . . S 1 . . . 1 . 1 2 . . 1 1 . . . . . 2 . . 2 2 1 19 16 2 . . . . . . . 3 . . . . . . . . H 3 . 11 . . . . 9 . 2 . 1 . 4 . . 8 5 5 9 2 10 3 . . 3 15 2 2 14 10 9 18 . . . . . . . 6 . R 1 2 . . . . . 2 . . . . . . . . . 1 5 2 7 2 3 . . 2 . 2 2 . . . . . . . . . . . 1 9 N 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . M 0 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 3 . 1 . . . 5 . 1 . 1 . . . . . 1 10 6 2 6 6 . 1 7 . 1 1 . . . . . . . . . . . 1 . P 1 . . . . . . 1 . 4 . . . . . . . 1 . . . 1 2 . . 3 . 2 7 . . . . . . . . 83 . . 5 . K 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G 6 3 1 1 17 9 8 . 22 8 12 18 . . 21 9 . 2 . . 2 . 5 1 2 5 . 6 5 . . . . 2 21 21 6 . 29 6 5 . m 2 2 . . 3 . . . . 10 . 1 . . 4 1 . 1 . . . . 2 1 . 5 . 8 7 . . . . 1 2 1 3 . . . 7 9 n 2 3 . 1 4 . . 1 2 7 . 1 . . 3 2 . 1 . . . 1 2 . 3 7 2 10 7 . . . . 1 1 1 . . . . 9 . k 0 . . . 1 . . . 1 . . . . . 3 . . . . . . . . . . . . . . . . . . . . . . . 2 . . . r 2 13 . . . . . 1 1 . . . . . . . . 2 . . 2 1 2 . . 1 . . 1 . . . . . 2 3 . . . . . . s 1 8 . . . . . 1 . . . . . . . . . 1 2 1 . 1 1 . . 2 . 1 . . . . . . 1 1 . . . . . . a 1 . 1 . . . . 1 . . . . . . . . . 10 . . . . . . . . 2 . . . . 11 4 1 . . . . . . . . i 1 . 2 . . . . . . . . . . . . . . 6 . . . . 1 . . . 2 . . . . 7 1 1 . . . . . . . . U 6 19 1 1 1 . 20 1 5 7 4 2 . . 1 3 . 4 1 1 . 1 10 . . 2 6 7 8 . . . . 3 3 6 11 . . . 7 . W 0 . 1 . 4 . . . . . . 1 . . 2 . . . . . . 1 . . . 1 . . . . . . . . . . . . . . . . X 4 . 18 . 5 . 3 1 . . 2 . . . 1 3 . 12 . . 2 1 4 17 13 4 . . . . . 19 10 32 . . 3 . 2 6 . . Y 5 . 15 . 7 . 3 2 . . 2 1 12 . 4 2 . 16 . . 2 2 3 16 17 5 2 . . . . 20 6 41 . . . . . 6 . . x 1 1 . . 2 3 . . 3 1 1 10 . . 1 1 . . . . . . 1 . . 1 . 1 1 . . . . . 4 3 . . 11 . 1 . y 2 1 . . 2 3 . . 7 2 1 7 . . 3 1 . . . . . . 1 . 1 2 . 2 2 . . . . . 10 12 . . 2 . 2 . u 1 1 . . 3 3 1 . 7 2 2 6 . . 3 2 . . . . . . 1 . . 1 . 1 1 . . . . . 6 6 . . 4 6 2 . v 3 3 . . 5 4 1 . 10 4 2 10 . . 5 3 . 1 . . . . 2 . 2 3 . 4 3 . . . . 1 12 12 . . 13 . 4 . B 6 3 2 . 11 5 3 . 31 8 7 13 . . 12 12 8 2 . . . 1 3 . 2 5 . 4 5 . . . . 1 30 28 . . 23 . 3 9 q 5 . 14 1 . . . 22 . . . . . . . . . 5 20 32 9 12 1 . . 2 13 1 1 40 40 15 29 . . . . . . . 4 . p 1 . 4 . . . . 5 . 1 . 1 . . . . . 2 4 5 2 4 . . . 1 9 . 1 3 11 3 8 . . . . . . . 1 . F 0 . . . . . . . . 1 . . . . . . . . . . . . . . . . . . 2 . . . . . . . . 16 . . 1 . Z 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1 . . . . . . . . . 4 0 . 6 . . . . . . . . . . . 1 1 . . . . . . . . 4 . 4 . . . 1 . . . . . 3 . . . . . L 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T 2 . . 1 2 1 2 2 . . 1 2 . . 2 6 . 5 . . 9 2 3 33 25 3 . . . . . . . 7 . . 8 . . . . . I 0 . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 Symbol entropy: 4.668 Next-symbol entropy: TT TT C O 8 E D A Q S H R N M 2 P K G m n k r s a i U W X Y x y u v B q p F Z 4 L T I ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- G 4.057 1243 0.270 0.015 0.037 0.322 0.303 0.247 0.008 0.220 0.088 0.236 0.148 . . 0.251 0.092 . 0.117 0.008 . 0.008 0.015 0.077 0.015 0.021 0.216 . 0.189 0.206 0.008 . . . 0.099 0.445 0.206 0.015 . 0.073 0.008 0.092 . H 3.953 583 0.068 0.195 0.016 0.016 0.028 0.016 0.328 . 0.049 . 0.016 . 0.016 0.016 . 0.016 0.334 0.184 0.277 0.016 0.285 0.101 . . 0.244 0.085 0.142 0.200 0.220 0.257 0.195 0.434 0.016 . . . . . . 0.184 . C 3.946 234 0.059 . 0.059 0.440 0.081 0.410 0.136 0.059 0.136 0.254 0.100 . . 0.321 0.136 . . 0.034 0.059 . 0.136 0.136 0.081 0.059 0.352 . 0.081 0.119 0.194 0.265 . . . 0.034 . 0.059 . . . 0.151 . D 3.879 919 0.082 0.200 0.034 0.011 0.041 . 0.265 . 0.041 . 0.019 . 0.019 . . . 0.354 0.283 0.380 0.060 0.237 0.071 . . 0.161 0.116 0.097 0.129 0.275 0.361 0.161 0.375 . . . . . . . 0.106 . v 3.850 558 0.373 0.016 . 0.255 0.315 0.079 0.016 0.217 0.096 0.096 0.166 . . 0.160 0.079 . 0.126 . 0.016 . 0.016 0.070 0.016 0.029 0.232 . 0.237 0.222 . . . . 0.079 0.485 0.241 . . 0.070 . 0.140 . u 3.816 271 0.294 . 0.030 0.269 0.370 0.122 . 0.269 0.090 0.188 0.188 . . 0.176 0.106 . 0.106 . . . . 0.090 . . 0.241 . 0.136 0.122 . . . . 0.072 0.489 0.241 . . 0.052 0.030 0.136 . B 3.787 1122 0.294 0.029 0.016 0.259 0.236 0.119 0.023 0.290 0.096 0.177 0.126 . . 0.186 0.126 0.009 0.100 0.016 . . 0.035 0.051 . 0.023 0.208 . 0.156 0.208 . . . 0.009 0.065 0.517 0.265 . . 0.065 . 0.075 0.009 x 3.721 217 0.374 . 0.036 0.255 0.425 0.085 . 0.176 0.062 0.106 0.308 . . 0.106 0.062 . 0.062 0.036 . . . 0.106 . . 0.277 . 0.160 0.176 . . . . . 0.450 0.190 . . 0.125 . 0.143 . R 3.689 196 0.503 . 0.115 0.067 0.039 . 0.233 0.039 0.039 0.039 . . . . 0.039 . 0.188 0.326 0.219 0.092 0.188 0.204 . . 0.345 . 0.272 0.336 0.039 0.039 . 0.039 0.067 0.067 . . . . . 0.115 0.039 p 3.679 269 0.072 0.164 . 0.030 0.030 . 0.377 . 0.053 . 0.030 . . . . . 0.346 0.232 0.311 0.030 0.261 0.030 . . 0.151 0.107 0.072 0.122 0.137 0.414 0.151 0.436 . . . . . . . 0.122 . 4 3.630 47 0.303 0.513 . . . 0.253 0.194 . . . . . . 0.194 0.194 . 0.303 . . . 0.118 . 0.118 0.344 . 0.194 0.118 . 0.118 0.194 0.118 0.118 . . 0.118 0.118 . . . . . 3.629 2584 0.355 0.017 0.515 0.217 0.121 0.110 0.080 . 0.105 0.103 0.059 . 0.004 0.158 0.075 . 0.107 0.078 0.045 0.014 0.050 0.110 0.011 0.014 0.321 0.017 0.347 0.321 0.008 0.011 0.004 0.004 0.052 . . 0.023 . 0.017 . 0.151 . T 3.627 400 0.091 . 0.079 0.186 0.161 0.194 0.169 . 0.022 0.113 0.066 . . 0.091 0.152 . 0.417 . 0.022 0.066 0.113 0.123 0.429 0.286 0.286 . 0.022 . . . . . 0.467 . . 0.053 . . . 0.022 . y 3.598 377 0.334 . 0.055 0.202 0.313 0.070 0.055 0.232 0.083 0.083 0.168 . . 0.149 0.055 . 0.083 . . . . 0.040 . 0.023 0.225 . 0.176 0.246 . . . . 0.055 0.520 0.302 . . 0.023 . 0.107 . 8 3.592 695 0.308 0.014 . . 0.088 0.074 0.457 0.067 0.051 0.014 0.024 . . 0.014 . 0.014 . 0.399 0.290 0.095 0.445 0.119 . . 0.286 . 0.209 0.173 0.043 0.043 0.034 0.034 0.024 0.137 0.024 . . . 0.014 0.101 . S 3.580 212 0.193 . 0.036 0.108 0.127 0.146 0.208 0.036 . 0.146 0.036 . . 0.036 . . 0.386 0.036 0.036 0.036 0.208 0.108 0.449 0.312 0.364 . . 0.063 . . . . 0.434 0.036 . . . . . 0.036 . q 3.572 1074 0.036 0.158 0.042 . 0.042 . 0.379 . 0.009 . . . . . . . 0.250 0.290 0.406 0.030 0.212 0.030 . . 0.119 0.047 0.053 0.072 0.294 0.401 0.180 0.416 0.009 . . . . . . 0.099 . m 3.568 416 0.403 0.021 0.051 0.217 0.051 0.037 0.037 0.021 0.224 0.037 0.021 . . 0.173 0.051 . 0.148 . . . 0.037 0.077 0.037 . 0.386 . 0.424 0.450 . . . . 0.088 0.196 0.064 0.021 . . . 0.274 0.021 n 3.561 483 0.412 0.018 0.098 0.238 0.057 . 0.079 0.068 0.148 0.018 0.018 . . 0.116 0.068 . 0.124 0.018 0.018 . 0.046 0.079 . 0.057 0.422 0.018 0.443 0.420 . 0.018 . . 0.079 0.148 0.046 . . . . 0.284 . 2 3.469 372 0.470 0.023 0.108 . 0.023 0.070 0.304 . 0.041 0.023 0.023 . . . 0.023 . 0.140 0.351 0.299 0.023 0.281 0.211 0.023 0.023 0.477 . 0.150 0.140 . . 0.023 . 0.056 0.070 0.023 . . . . 0.070 . E 3.331 1200 0.530 0.009 0.102 0.075 0.015 0.273 0.053 0.087 0.098 0.071 0.053 . . 0.062 0.033 0.015 0.209 0.048 0.033 0.015 0.053 0.133 . . 0.180 . 0.273 0.383 . 0.009 . . 0.127 0.180 0.043 0.015 . . . 0.155 . k 3.212 44 0.264 . 0.264 0.447 . . . 0.203 . . . . . 0.511 0.124 . 0.264 . . . . . . . 0.124 . 0.203 0.203 . . . . . 0.357 0.124 . . 0.124 . . . P 3.189 216 0.160 0.036 0.107 0.063 . . 0.144 . 0.176 . . . . . . . 0.160 0.063 0.036 . 0.107 0.126 . . 0.436 . 0.289 0.527 0.036 0.036 . . 0.036 . . . 0.327 . . 0.327 . U 3.141 1153 0.525 0.016 0.055 0.055 0.034 0.423 0.034 0.073 0.077 0.120 0.028 . . 0.034 0.039 . 0.194 0.039 0.045 . 0.028 0.130 . . 0.094 0.022 0.227 0.281 0.009 . . 0.009 0.150 0.159 0.086 0.028 . . . 0.127 . X 2.975 866 0.043 0.212 0.020 0.176 . 0.152 0.062 . . 0.080 . . . 0.028 0.050 . 0.438 . . 0.011 0.043 0.091 0.187 0.106 0.215 . . . . . 0.241 0.258 0.527 . . 0.011 . 0.011 0.011 . . Z 2.969 25 . . 0.186 0.292 . . 0.186 . . . . . . . . . 0.464 . . . 0.186 . . . 0.186 . . . 0.186 . 0.494 0.423 0.367 . . . . . . . . Y 2.889 1053 0.042 0.167 0.010 0.212 . 0.124 0.074 . . 0.083 0.017 0.010 . 0.083 0.037 . 0.460 . 0.010 0.010 0.053 0.064 0.153 0.113 0.222 0.010 . . 0.010 . 0.222 0.157 0.522 . . . . . 0.010 0.017 . W 2.780 54 0.107 0.232 0.107 0.514 0.107 0.107 0.176 . . 0.107 0.176 . . 0.352 . . . . . . 0.232 0.107 . . 0.352 . . . . . . . . . . . . . . 0.107 . O 2.467 839 0.133 0.029 . 0.093 . 0.527 . 0.029 0.012 0.530 . 0.051 0.129 0.058 0.226 0.064 0.093 . 0.012 . . 0.012 0.051 0.044 . . 0.051 0.037 0.021 0.029 . 0.012 0.082 0.058 . 0.064 . 0.012 0.012 . . F 2.296 36 0.144 . . . . . 0.144 . 0.232 . . . . . . . . 0.144 . . . . . . 0.299 . . 0.487 . . 0.144 . . . . . 0.352 . . 0.352 . Q 2.152 286 0.144 0.050 . 0.102 0.389 . 0.029 . . . 0.223 0.029 . . 0.292 . 0.029 0.029 . . 0.029 . 0.131 0.050 0.050 0.029 0.050 0.050 0.029 0.117 . . 0.086 0.086 . 0.102 . . . 0.029 . i 2.053 121 0.057 0.163 0.057 . . . 0.098 . . . . . . 0.057 . . 0.434 . . . 0.057 0.132 . . 0.057 0.057 . . . . 0.409 0.259 0.215 . . . . . . . . s 1.977 288 0.372 . 0.069 . . 0.028 0.130 . . . . . . . . . 0.222 0.130 0.116 . 0.102 0.069 . . 0.259 . 0.116 0.102 . . . 0.028 . 0.156 0.050 . . . . 0.028 . a 1.893 199 0.038 0.067 0.038 0.038 . . 0.113 . . . . . . . . . 0.421 . 0.038 . . 0.038 . . 0.038 0.038 . 0.038 . . 0.412 0.333 0.202 . . . . . . 0.038 . L 1.792 18 0.434 . 0.232 . 0.431 . . 0.232 . . . . . . . . 0.232 . . . . . . . . . . . . . . . . 0.232 . . . . . . . r 1.586 431 0.295 . 0.036 . . . 0.117 0.050 . . . . . . 0.020 . 0.212 0.020 0.020 0.020 0.075 0.097 . . 0.144 . 0.036 0.086 . . . . 0.036 0.206 0.097 . . . . 0.020 . A 0.821 616 . . 0.056 0.097 0.138 0.037 0.015 . 0.015 0.027 . . . 0.073 0.027 . 0.047 . . . . . 0.015 0.027 0.015 . . . . . . . 0.056 . . . . . 0.111 . 0.065 K 0.773 13 0.204 . . . 0.285 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.285 . . . . . . . M 0.742 24 0.169 . . . . . . 0.191 . . . . . . . . 0.191 . . . . . . . . . . . . . . . . 0.191 . . . . . . . I 0.684 11 . . . . 0.237 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.447 N 0.544 8 0.169 . . . . . . . . . . . . . . . . . . . . . . . 0.375 . . . . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 3.300 19773 0.384 0.076 0.193 0.170 0.245 0.206 0.156 0.088 0.070 0.150 0.066 0.005 0.012 0.108 0.071 0.007 0.251 0.117 0.131 0.020 0.120 0.089 0.067 0.045 0.239 0.023 0.198 0.225 0.071 0.109 0.085 0.145 0.235 0.228 0.084 0.017 0.012 0.021 0.009 0.114 0.006 Now the characters Z M L K I N are discardable. Big problemas are "A" ("AE"), "R" ("r "), and "s" ("s "). I suppose we can assume that the cases of non-word-final "R" and "S" are due to omission of space. When inverting the map we must remember to insert spaces randomly after "R", with 2/3 probability. The remaining instances of "R" seem to be indistingushable from "2"s. But let them stay for now. cat .voyn.fsg \ | /n/gnu/bin/tr '\012' ' ' \ | /n/gnu/bin/sed \ -e 's/CM/AN/g' \ -e 's/CI/A/g' \ -e 's/IL/N/g' \ -e 's/IN/M/g' \ -e 's/I*\([MNRK]\)/\1/g' \ -e 's/6/8/g' \ -e 's/A /G /g' \ \ -e 's/G /G/g' \ -e 's/AM */m/g' \ -e 's/AN */n/g' \ -e 's/AK */k/g' \ -e 's/AR */r/g' \ -e 's/OR */s/g' \ -e 's/ *4O/Q/g' \ \ -e 's/O\([DHPF]\)/ O\1/g' \ \ -e 's/OE/U/g' \ -e 's/AE/J/g' \ -e 's/SC/X/g' \ -e 's/TC/Y/g' \ -e 's/CCG/x/g' \ -e 's/CC8G/y/g' \ -e 's/CG/u/g' \ -e 's/C8G/v/g' \ -e 's/CC/W/g' \ -e 's/DZ/a/g' \ -e 's/HZ/i/g' \ -e 's/8G/B/g' \ -e 's/QD/q/g' \ -e 's/QH/p/g' \ -e 's/[ZMNKLI]//g' \ | /n/gnu/bin/fold -s -w 200 \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' CO8EDAQSTHR2PGmnkrsaiUJWXYxyuvBqpF4' Digraph counts: TT C O 8 E D A Q S T H R 2 P G m n k r s a i U J W X Y x y u v B q p F 4 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 2046 211 5 721 111 52 46 1 . 32 54 43 21 74 19 33 21 8 2 5 31 2 3 149 16 4 168 182 1 3 . 1 15 . . 6 6 G 1243 88 2 6 118 107 76 1 58 18 19 71 36 78 19 26 1 . 1 2 15 2 3 62 . . 51 58 1 . . . 21 223 58 2 20 U 1153 490 2 9 9 5 184 2 11 14 27 25 4 5 6 49 6 7 . 4 28 . . 18 3 3 62 87 1 . . 1 34 37 16 4 . B 1122 92 4 2 74 65 24 1 85 18 13 42 26 45 26 19 2 . . 5 8 . 3 53 2 . 35 53 . . . 1 11 321 77 . 15 q 1074 5 34 6 . 6 . 15 . 1 18 . . . . 67 85 157 4 52 4 . . 23 122 7 8 12 87 153 41 166 1 . . . . Y 1053 7 36 1 51 . 24 1 . . 2 14 2 14 5 207 . 1 1 8 10 32 21 55 11 1 . . 1 . 55 33 460 . . . . D 919 14 41 4 1 5 . 11 . 5 17 . 2 . . 103 70 118 8 53 10 . . 30 52 19 15 22 67 107 30 115 . . . . . X 866 5 42 2 32 1 26 . . . . 11 . 3 6 150 . . 1 5 13 35 16 43 8 . . . . . 51 57 357 . . 1 1 O 839 51 3 . 13 . 348 . 4 1 . 294 . 7 45 14 . 1 . . 1 6 5 1 . . 6 4 2 3 . 1 11 9 . 8 1 8 695 62 1 . . 11 8 9 7 5 12 1 2 1 . . 98 55 11 125 15 . . 54 124 . 33 25 4 4 3 3 2 18 2 . . E 646 126 1 16 10 3 78 . 5 11 28 10 7 6 5 20 6 3 2 7 18 . . 37 7 . 73 139 . 1 . . 13 11 1 2 . H 583 8 25 1 1 2 1 2 . 4 23 . 1 1 . 59 23 43 1 45 10 . . 35 55 8 16 26 30 38 25 99 1 . . . . v 558 69 1 . 36 51 7 1 27 9 15 9 19 18 7 13 . 1 . 1 6 1 2 31 . . 32 29 . . . . 7 126 33 . 7 J 554 345 . 5 4 . 8 . 12 9 9 3 2 5 . 37 2 2 . 2 12 . . 9 2 . 13 17 . . . . 15 35 6 . . n 483 73 1 8 28 4 . 3 5 14 37 1 1 10 5 11 1 1 . 3 6 . 4 77 3 1 86 76 . 1 . . 6 14 3 . . r 431 51 . 7 10 3 2 4 3 12 17 . 1 7 5 29 4 4 2 11 18 . 1 75 17 1 70 42 . . 1 . 6 20 7 1 . m 416 60 1 3 21 4 2 . 1 22 30 2 1 15 3 12 . . . 2 5 2 . 55 2 . 67 77 . . . . 6 18 4 1 . T 400 6 . 5 16 13 17 . . 1 1 8 4 6 12 62 . 1 4 8 9 66 31 31 14 . 1 . . . . . 81 . . 3 . y 377 38 . 3 17 34 4 . 20 5 7 5 13 11 3 5 . . . . 2 . 1 20 3 . 14 23 . . . . 3 112 32 . 2 2 372 77 1 7 . 1 4 3 . 2 4 1 1 . 1 10 41 31 1 28 18 1 1 80 29 . 11 10 . . 1 . 3 4 1 . . s 303 25 . 7 9 2 3 . . 3 8 3 . 1 7 22 18 12 1 12 11 1 . 50 11 . 49 31 2 1 . 2 . 9 2 . 1 Q 271 9 2 . 5 191 . . . . 1 . . . 23 1 1 . . 1 . 7 2 2 1 1 2 2 1 6 . . 4 4 . 5 . u 271 22 . 2 19 33 6 . 19 4 7 11 11 10 5 5 . . . . 4 . . 16 . . 7 6 . . . . 3 63 16 . 2 p 269 3 9 . 1 1 . 3 . 2 6 . 1 . . 29 15 24 1 18 1 . . 8 31 5 3 6 7 41 8 46 . . . . . C 234 2 . 2 41 3 35 2 2 6 7 15 4 22 6 . 1 2 . 6 6 3 2 26 4 . 3 5 10 16 . . . 1 . 2 . x 217 27 . 1 14 35 3 . 8 2 6 4 19 4 2 2 1 . . . 4 . . 16 . . 7 8 . . . . . 40 9 . 5 P 216 7 1 5 3 . . . . 8 21 . . . . 12 2 1 . 5 5 . . 38 7 . 17 70 1 1 5 4 3 . . . . S 212 9 . 1 4 5 6 1 1 . 1 6 1 1 . 28 1 1 1 10 4 39 19 25 9 . . 2 . . . . 36 1 . . . a 199 1 2 1 1 . . . . . 1 . . . . 125 . 1 . . 1 . . 1 4 1 . 1 . . 30 20 9 . . . . R 181 43 . 4 2 2 . 2 1 1 4 1 . . 1 8 16 9 3 8 9 . . 21 9 . 14 19 . . . . 2 2 . . . i 121 1 4 1 . . . . . . . . . 1 . 74 . . . 1 3 . . 1 2 1 . . . . 18 8 6 . . . . 4 62 4 13 . . . 3 . . . . . . 2 2 4 . . . 1 15 1 5 . 2 2 1 . 1 2 1 1 . . 1 1 . A 62 10 . 5 10 6 3 . 1 1 . 2 . 7 2 4 . . . . . 1 2 1 1 . . . . . . . 5 1 . . . W 54 1 3 1 25 1 1 . . . 1 1 2 6 . . . . . 3 1 . . 6 2 . . . . . . . . . . . . k 44 3 . 3 8 . . . 1 . . . . 12 1 3 . . . . . . . 1 . . 2 2 . . . . . 5 1 . 2 F 36 1 . . 1 . . . . 2 4 . . . . . 1 . . . . . . 3 1 . . 19 1 . 2 . 1 . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 18582 2046 234 839 695 646 919 62 271 212 400 583 181 372 216 1243 416 483 44 431 303 199 121 1153 554 54 866 1053 217 377 271 558 1122 1074 269 36 62 Next-symbol probability (× 99): TT TT TT C O 8 E D A Q S T H R 2 P G m n k r s a i U J W X Y x y u v B q p F 4 ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- G 4.060 1243 99 7 . . 9 9 6 . 5 1 2 6 3 6 2 2 . . . . 1 . . 5 . . 4 5 . . . . 2 18 5 . 2 C 3.969 234 99 1 . 1 17 1 15 1 1 3 3 6 2 9 3 . . 1 . 3 3 1 1 11 2 . 1 2 4 7 . . . . . 1 . H 3.960 583 99 1 4 . . . . . . 1 4 . . . . 10 4 7 . 8 2 . . 6 9 1 3 4 5 6 4 17 . . . . . s 3.936 303 99 8 . 2 3 1 1 . . 1 3 1 . . 2 7 6 4 . 4 4 . . 16 4 . 16 10 1 . . 1 . 3 1 . . D 3.916 919 99 2 4 . . 1 . 1 . 1 2 . . . . 11 8 13 1 6 1 . . 3 6 2 2 2 7 12 3 12 . . . . . r 3.900 431 99 12 . 2 2 1 . 1 1 3 4 . . 2 1 7 1 1 . 3 4 . . 17 4 . 16 10 . . . . 1 5 2 . . v 3.854 558 99 12 . . 6 9 1 . 5 2 3 2 3 3 1 2 . . . . 1 . . 6 . . 6 5 . . . . 1 22 6 . 1 u 3.808 271 99 8 . 1 7 12 2 . 7 1 3 4 4 4 2 2 . . . . 1 . . 6 . . 3 2 . . . . 1 23 6 . 1 B 3.785 1122 99 8 . . 7 6 2 . 8 2 1 4 2 4 2 2 . . . . 1 . . 5 . . 3 5 . . . . 1 28 7 . 1 p 3.733 269 99 1 3 . . . . 1 . 1 2 . . . . 11 6 9 . 7 . . . 3 11 2 1 2 3 15 3 17 . . . . . x 3.721 217 99 12 . . 6 16 1 . 4 1 3 2 9 2 1 1 . . . . 2 . . 7 . . 3 4 . . . . . 18 4 . 2 R 3.699 181 99 24 . 2 1 1 . 1 1 1 2 1 . . 1 4 9 5 2 4 5 . . 11 5 . 8 10 . . . . 1 1 . . . 8 3.643 695 99 9 . . . 2 1 1 1 1 2 . . . . . 14 8 2 18 2 . . 8 18 . 5 4 1 1 . . . 3 . . . A 3.638 62 99 16 . 8 16 10 5 . 2 2 . 3 . 11 3 6 . . . . . 2 3 2 2 . . . . . . . 8 2 . . . E 3.637 646 99 19 . 2 2 . 12 . 1 2 4 2 1 1 1 3 1 . . 1 3 . . 6 1 . 11 21 . . . . 2 2 . . . q 3.636 1074 99 . 3 1 . 1 . 1 . . 2 . . . . 6 8 14 . 5 . . . 2 11 1 1 1 8 14 4 15 . . . . . T 3.627 400 99 1 . 1 4 3 4 . . . . 2 1 1 3 15 . . 1 2 2 16 8 8 3 . . . . . . . 20 . . 1 . y 3.608 377 99 10 . 1 4 9 1 . 5 1 2 1 3 3 1 1 . . . . 1 . . 5 1 . 4 6 . . . . 1 29 8 . 1 S 3.603 212 99 4 . . 2 2 3 . . . . 3 . . . 13 . . . 5 2 18 9 12 4 . . 1 . . . . 17 . . . . n 3.573 483 99 15 . 2 6 1 . 1 1 3 8 . . 2 1 2 . . . 1 1 . 1 16 1 . 18 16 . . . . 1 3 1 . . m 3.560 416 99 14 . 1 5 1 . . . 5 7 . . 4 1 3 . . . . 1 . . 13 . . 16 18 . . . . 1 4 1 . . 4 3.550 62 99 6 21 . . . 5 . . . . . . 3 3 6 . . . 2 24 2 8 . 3 3 2 . 2 3 2 2 . . 2 2 . 2 3.508 372 99 20 . 2 . . 1 1 . 1 1 . . . . 3 11 8 . 7 5 . . 21 8 . 3 3 . . . . 1 1 . . . 3.455 2046 99 10 . 35 5 3 2 . . 2 3 2 1 4 1 2 1 . . . 2 . . 7 1 . 8 9 . . . . 1 . . . . P 3.299 216 99 3 . 2 1 . . . . 4 10 . . . . 6 1 . . 2 2 . . 17 3 . 8 32 . . 2 2 1 . . . . k 3.212 44 99 7 . 7 18 . . . 2 . . . . 27 2 7 . . . . . . . 2 . . 5 5 . . . . . 11 2 . 5 U 3.136 1153 99 42 . 1 1 . 16 . 1 1 2 2 . . 1 4 1 1 . . 2 . . 2 . . 5 7 . . . . 3 3 1 . . X 2.975 866 99 1 5 . 4 . 3 . . . . 1 . . 1 17 . . . 1 1 4 2 5 1 . . . . . 6 7 41 . . . . Y 2.881 1053 99 1 3 . 5 . 2 . . . . 1 . 1 . 19 . . . 1 1 3 2 5 1 . . . . . 5 3 43 . . . . W 2.780 54 99 2 6 2 46 2 2 . . . 2 2 4 11 . . . . . 6 2 . . 11 4 . . . . . . . . . . . . F 2.463 36 99 3 . . 3 . . . . 6 11 . . . . . 3 . . . . . . 8 3 . . 52 3 . 6 . 3 . . . . J 2.410 554 99 62 . 1 1 . 1 . 2 2 2 1 . 1 . 7 . . . . 2 . . 2 . . 2 3 . . . . 3 6 1 . . O 2.362 839 99 6 . . 2 . 41 . . . . 35 . 1 5 2 . . . . . 1 1 . . . 1 . . . . . 1 1 . 1 . i 2.053 121 99 1 3 1 . . . . . . . . . 1 . 61 . . . 1 2 . . 1 2 1 . . . . 15 7 5 . . . . Q 1.941 271 99 3 1 . 2 70 . . . . . . . . 8 . . . . . . 3 1 1 . . 1 1 . 2 . . 1 1 . 2 . a 1.893 199 99 . 1 . . . . . . . . . . . . 62 . . . . . . . . 2 . . . . . 15 10 4 . . . . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 3.436 18582 99 11 1 4 4 3 5 0 1 1 2 3 1 2 1 7 2 3 0 2 2 1 1 6 3 0 5 6 1 2 1 3 6 6 1 0 0 Previous-symbol probability (× 99): TT C O 8 E D A Q S T H R 2 P G m n k r s a i U J W X Y x y u v B q p F 4 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 11 10 2 85 16 8 5 2 . 15 13 7 11 20 9 3 5 2 5 1 10 1 2 13 3 7 19 17 . 1 . . 1 . . 17 10 C 1 . . . 6 . 4 3 1 3 2 3 2 6 3 . . . . 1 2 1 2 2 1 . . . 5 4 . . . . . 6 . O 4 2 1 . 2 . 37 . 1 . . 50 . 2 21 1 . . . . . 3 4 . . . 1 . 1 1 . . 1 1 . 22 2 8 4 3 . . . 2 1 14 3 2 3 . 1 . . . 23 11 25 29 5 . . 5 22 . 4 2 2 1 1 1 . 2 1 . . E 3 6 . 2 1 . 8 . 2 5 7 2 4 2 2 2 1 1 5 2 6 . . 3 1 . 8 13 . . . . 1 1 . 6 . D 5 1 17 . . 1 . 18 . 2 4 . 1 . . 8 17 24 18 12 3 . . 3 9 35 2 2 31 28 11 20 . . . . . A 0 . . 1 1 1 . . . . . . . 2 1 . . . . . . . 2 . . . . . . . . . . . . . . Q 1 . 1 . 1 29 . . . . . . . . 11 . . . . . . 3 2 . . 2 . . . 2 . . . . . 14 . S 1 . . . 1 1 1 2 . . . 1 1 . . 2 . . 2 2 1 19 16 2 2 . . . . . . . 3 . . . . T 2 . . 1 2 2 2 . . . . 1 2 2 6 5 . . 9 2 3 33 25 3 3 . . . . . . . 7 . . 8 . H 3 . 11 . . . . 3 . 2 6 . 1 . . 5 5 9 2 10 3 . . 3 10 15 2 2 14 10 9 18 . . . . . R 1 2 . . . . . 3 . . 1 . . . . 1 4 2 7 2 3 . . 2 2 . 2 2 . . . . . . . . . 2 2 4 . 1 . . . 5 . 1 1 . 1 . . 1 10 6 2 6 6 . 1 7 5 . 1 1 . . . . . . . . . P 1 . . 1 . . . . . 4 5 . . . . 1 . . . 1 2 . . 3 1 . 2 7 . . 2 1 . . . . . G 7 4 1 1 17 16 8 2 21 8 5 12 20 21 9 2 . . 2 . 5 1 2 5 . . 6 5 . . . . 2 21 21 6 32 m 2 3 . . 3 1 . . . 10 7 . 1 4 1 1 . . . . 2 1 . 5 . . 8 7 . . . . 1 2 1 3 . n 3 4 . 1 4 1 . 5 2 7 9 . 1 3 2 1 . . . 1 2 . 3 7 1 2 10 7 . . . . 1 1 1 . . k 0 . . . 1 . . . . . . . . 3 . . . . . . . . . . . . . . . . . . . . . . 3 r 2 2 . 1 1 . . 6 1 6 4 . 1 2 2 2 1 1 5 3 6 . 1 6 3 2 8 4 . . . . 1 2 3 3 . s 2 1 . 1 1 . . . . 1 2 1 . . 3 2 4 2 2 3 4 . . 4 2 . 6 3 1 . . . . 1 1 . 2 a 1 . 1 . . . . . . . . . . . . 10 . . . . . . . . 1 2 . . . . 11 4 1 . . . . i 1 . 2 . . . . . . . . . . . . 6 . . . . 1 . . . . 2 . . . . 7 1 1 . . . . U 6 24 1 1 1 1 20 3 4 7 7 4 2 1 3 4 1 1 . 1 9 . . 2 1 6 7 8 . . . . 3 3 6 11 . J 3 17 . 1 1 . 1 . 4 4 2 1 1 1 . 3 . . . . 4 . . 1 . . 1 2 . . . . 1 3 2 . . W 0 . 1 . 4 . . . . . . . 1 2 . . . . . 1 . . . 1 . . . . . . . . . . . . . X 5 . 18 . 5 . 3 . . . . 2 . 1 3 12 . . 2 1 4 17 13 4 1 . . . . . 19 10 32 . . 3 2 Y 6 . 15 . 7 . 3 2 . . . 2 1 4 2 16 . . 2 2 3 16 17 5 2 2 . . . . 20 6 41 . . . . x 1 1 . . 2 5 . . 3 1 1 1 10 1 1 . . . . . 1 . . 1 . . 1 1 . . . . . 4 3 . 8 y 2 2 . . 2 5 . . 7 2 2 1 7 3 1 . . . . . 1 . 1 2 1 . 2 2 . . . . . 10 12 . 3 u 1 1 . . 3 5 1 . 7 2 2 2 6 3 2 . . . . . 1 . . 1 . . 1 1 . . . . . 6 6 . 3 v 3 3 . . 5 8 1 2 10 4 4 2 10 5 3 1 . . . . 2 . 2 3 . . 4 3 . . . . 1 12 12 . 11 B 6 4 2 . 11 10 3 2 31 8 3 7 14 12 12 2 . . . 1 3 . 2 5 . . 4 5 . . . . 1 30 28 . 24 q 6 . 14 1 . 1 . 24 . . 4 . . . . 5 20 32 9 12 1 . . 2 22 13 1 1 40 40 15 29 . . . . . p 1 . 4 . . . . 5 . 1 1 . 1 . . 2 4 5 2 4 . . . 1 6 9 . 1 3 11 3 8 . . . . . F 0 . . . . . . . . 1 1 . . . . . . . . . . . . . . . . 2 . . 1 . . . . . . 4 0 . 6 . . . . . . . . . . 1 1 . . . . . 5 . 4 . . 4 . . . 1 . . . . . 3 . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 Symbol entropy: 4.703 Next-symbol entropy: TT TT C O 8 E D A Q S T H R 2 P G m n k r s a i U J W X Y x y u v B q p F 4 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- G 4.060 1243 0.270 0.015 0.037 0.322 0.305 0.247 0.008 0.206 0.088 0.092 0.236 0.148 0.251 0.092 0.117 0.008 . 0.008 0.015 0.077 0.015 0.021 0.216 . . 0.189 0.206 0.008 . . . 0.099 0.445 0.206 0.015 0.096 C 3.969 234 0.059 . 0.059 0.440 0.081 0.410 0.059 0.059 0.136 0.151 0.254 0.100 0.321 0.136 . 0.034 0.059 . 0.136 0.136 0.081 0.059 0.352 0.100 . 0.081 0.119 0.194 0.265 . . . 0.034 . 0.059 . H 3.960 583 0.085 0.195 0.016 0.016 0.028 0.016 0.028 . 0.049 0.184 . 0.016 0.016 . 0.334 0.184 0.277 0.016 0.285 0.101 . . 0.244 0.321 0.085 0.142 0.200 0.220 0.257 0.195 0.434 0.016 . . . . s 3.936 303 0.297 . 0.126 0.151 0.048 0.066 . . 0.066 0.138 0.066 . 0.027 0.126 0.275 0.242 0.184 0.027 0.184 0.174 0.027 . 0.429 0.174 . 0.425 0.336 0.048 0.027 . 0.048 . 0.151 0.048 . 0.027 D 3.916 919 0.092 0.200 0.034 0.011 0.041 . 0.076 . 0.041 0.106 . 0.019 . . 0.354 0.283 0.380 0.060 0.237 0.071 . . 0.161 0.234 0.116 0.097 0.129 0.275 0.361 0.161 0.375 . . . . . r 3.900 431 0.364 . 0.097 0.126 0.050 0.036 0.063 0.050 0.144 0.184 . 0.020 0.097 0.075 0.262 0.063 0.063 0.036 0.135 0.191 . 0.020 0.439 0.184 0.020 0.426 0.327 . . 0.020 . 0.086 0.206 0.097 0.020 . v 3.854 558 0.373 0.016 . 0.255 0.315 0.079 0.016 0.211 0.096 0.140 0.096 0.166 0.160 0.079 0.126 . 0.016 . 0.016 0.070 0.016 0.029 0.232 . . 0.237 0.222 . . . . 0.079 0.485 0.241 . 0.079 u 3.808 271 0.294 . 0.052 0.269 0.370 0.122 . 0.269 0.090 0.136 0.188 0.188 0.176 0.106 0.106 . . . . 0.090 . . 0.241 . . 0.136 0.122 . . . . 0.072 0.489 0.241 . 0.052 B 3.785 1122 0.296 0.029 0.016 0.259 0.238 0.119 0.009 0.282 0.096 0.075 0.177 0.126 0.186 0.126 0.100 0.016 . . 0.035 0.051 . 0.023 0.208 0.016 . 0.156 0.208 . . . 0.009 0.065 0.517 0.265 . 0.083 p 3.733 269 0.072 0.164 . 0.030 0.030 . 0.072 . 0.053 0.122 . 0.030 . . 0.346 0.232 0.311 0.030 0.261 0.030 . . 0.151 0.359 0.107 0.072 0.122 0.137 0.414 0.151 0.436 . . . . . x 3.721 217 0.374 . 0.036 0.255 0.425 0.085 . 0.176 0.062 0.143 0.106 0.308 0.106 0.062 0.062 0.036 . . . 0.106 . . 0.277 . . 0.160 0.176 . . . . . 0.450 0.190 . 0.125 R 3.699 181 0.493 . 0.122 0.072 0.072 . 0.072 0.041 0.041 0.122 0.041 . . 0.041 0.199 0.309 0.215 0.098 0.199 0.215 . . 0.361 0.215 . 0.286 0.341 . . . . 0.072 0.072 . . . 8 3.643 695 0.311 0.014 . . 0.095 0.074 0.081 0.067 0.051 0.101 0.014 0.024 0.014 . . 0.399 0.290 0.095 0.445 0.119 . . 0.286 0.444 . 0.209 0.173 0.043 0.043 0.034 0.034 0.024 0.137 0.024 . . A 3.638 62 0.425 . 0.293 0.425 0.326 0.211 . 0.096 0.096 . 0.160 . 0.355 0.160 0.255 . . . . . 0.096 0.160 0.096 0.096 . . . . . . . 0.293 0.096 . . . E 3.637 646 0.460 0.014 0.132 0.093 0.036 0.368 . 0.054 0.100 0.196 0.093 0.071 0.063 0.054 0.155 0.063 0.036 0.026 0.071 0.144 . . 0.236 0.071 . 0.355 0.477 . 0.014 . . 0.113 0.100 0.014 0.026 . q 3.636 1074 0.036 0.158 0.042 . 0.042 . 0.086 . 0.009 0.099 . . . . 0.250 0.290 0.406 0.030 0.212 0.030 . . 0.119 0.356 0.047 0.053 0.072 0.294 0.401 0.180 0.416 0.009 . . . . T 3.627 400 0.091 . 0.079 0.186 0.161 0.194 . . 0.022 0.022 0.113 0.066 0.091 0.152 0.417 . 0.022 0.066 0.113 0.123 0.429 0.286 0.286 0.169 . 0.022 . . . . . 0.467 . . 0.053 . y 3.608 377 0.334 . 0.055 0.202 0.313 0.070 . 0.225 0.083 0.107 0.083 0.168 0.149 0.055 0.083 . . . . 0.040 . 0.023 0.225 0.055 . 0.176 0.246 . . . . 0.055 0.520 0.302 . 0.040 S 3.603 212 0.193 . 0.036 0.108 0.127 0.146 0.036 0.036 . 0.036 0.146 0.036 0.036 . 0.386 0.036 0.036 0.036 0.208 0.108 0.449 0.312 0.364 0.193 . . 0.063 . . . . 0.434 0.036 . . . n 3.573 483 0.412 0.018 0.098 0.238 0.057 . 0.046 0.068 0.148 0.284 0.018 0.018 0.116 0.068 0.124 0.018 0.018 . 0.046 0.079 . 0.057 0.422 0.046 0.018 0.443 0.420 . 0.018 . . 0.079 0.148 0.046 . . m 3.560 416 0.403 0.021 0.051 0.217 0.064 0.037 . 0.021 0.224 0.274 0.037 0.021 0.173 0.051 0.148 . . . 0.037 0.077 0.037 . 0.386 0.037 . 0.424 0.450 . . . . 0.088 0.196 0.064 0.021 . 4 3.550 62 0.255 0.473 . . . 0.211 . . . . . . 0.160 0.160 0.255 . . . 0.096 0.495 0.096 0.293 . 0.160 0.160 0.096 . 0.096 0.160 0.096 0.096 . . 0.096 0.096 . 2 3.508 372 0.470 0.023 0.108 . 0.023 0.070 0.056 . 0.041 0.070 0.023 0.023 . 0.023 0.140 0.351 0.299 0.023 0.281 0.211 0.023 0.023 0.477 0.287 . 0.150 0.140 . . 0.023 . 0.056 0.070 0.023 . . 3.455 2046 0.338 0.021 0.530 0.228 0.135 0.123 0.005 . 0.094 0.138 0.117 0.068 0.173 0.063 0.096 0.068 0.031 0.010 0.021 0.092 0.010 0.014 0.275 0.055 0.018 0.296 0.311 0.005 0.014 . 0.005 0.052 . . 0.025 0.025 P 3.299 216 0.160 0.036 0.126 0.086 . . . . 0.176 0.327 . . . . 0.232 0.063 0.036 . 0.126 0.126 . . 0.441 0.160 . 0.289 0.527 0.036 0.036 0.126 0.107 0.086 . . . . k 3.212 44 0.264 . 0.264 0.447 . . . 0.124 . . . . 0.511 0.124 0.264 . . . . . . . 0.124 . . 0.203 0.203 . . . . . 0.357 0.124 . 0.203 U 3.136 1153 0.525 0.016 0.055 0.055 0.034 0.423 0.016 0.064 0.077 0.127 0.120 0.028 0.034 0.039 0.194 0.039 0.045 . 0.028 0.130 . . 0.094 0.022 0.022 0.227 0.281 0.009 . . 0.009 0.150 0.159 0.086 0.028 . X 2.975 866 0.043 0.212 0.020 0.176 0.011 0.152 . . . . 0.080 . 0.028 0.050 0.438 . . 0.011 0.043 0.091 0.187 0.106 0.215 0.062 . . . . . 0.241 0.258 0.527 . . 0.011 0.011 Y 2.881 1053 0.048 0.167 0.010 0.212 . 0.124 0.010 . . 0.017 0.083 0.017 0.083 0.037 0.461 . 0.010 0.010 0.053 0.064 0.153 0.113 0.222 0.069 0.010 . . 0.010 . 0.222 0.157 0.522 . . . . W 2.780 54 0.107 0.232 0.107 0.514 0.107 0.107 . . . 0.107 0.107 0.176 0.352 . . . . . 0.232 0.107 . . 0.352 0.176 . . . . . . . . . . . . F 2.463 36 0.144 . . 0.144 . . . . 0.232 0.352 . . . . . 0.144 . . . . . . 0.299 0.144 . . 0.487 0.144 . 0.232 . 0.144 . . . . J 2.410 554 0.426 . 0.061 0.051 . 0.088 . 0.120 0.097 0.097 0.041 0.029 0.061 . 0.261 0.029 0.029 . 0.029 0.120 . . 0.097 0.029 . 0.127 0.154 . . . . 0.141 0.252 0.071 . . O 2.362 839 0.246 0.029 . 0.093 . 0.527 . 0.037 0.012 . 0.530 . 0.058 0.226 0.099 . 0.012 . . 0.012 0.051 0.044 0.012 . . 0.051 0.037 0.021 0.029 . 0.012 0.082 0.070 . 0.064 0.012 i 2.053 121 0.057 0.163 0.057 . . . . . . . . . 0.057 . 0.434 . . . 0.057 0.132 . . 0.057 0.098 0.057 . . . . 0.409 0.259 0.215 . . . . Q 1.941 271 0.163 0.052 . 0.106 0.356 . . . . 0.030 . . . 0.302 0.030 0.030 . . 0.030 . 0.136 0.052 0.052 0.030 0.030 0.052 0.052 0.030 0.122 . . 0.090 0.090 . 0.106 . a 1.893 199 0.038 0.067 0.038 0.038 . . . . . 0.038 . . . . 0.421 . 0.038 . . 0.038 . . 0.038 0.113 0.038 . 0.038 . . 0.412 0.333 0.202 . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 3.436 18582 0.350 0.079 0.202 0.177 0.168 0.215 0.027 0.089 0.074 0.119 0.157 0.065 0.113 0.075 0.261 0.123 0.137 0.021 0.126 0.097 0.070 0.047 0.249 0.151 0.024 0.206 0.235 0.075 0.114 0.089 0.152 0.245 0.238 0.088 0.017 0.027 Big problems are "Q" = "4O" ("4OE") "O" ("OD", "OH) "a" = "DZ" ("DZG") "i" = "HZ" ("HZG") "J" = "AE" ("J "). We might also condense "XB" = "SC8G" and "YB" = "TC8G" We can supress spaces after "OE" and "AE", but must remember to insert them back when generating the Voynichese: 40% after "OE", 60% after "AE". OK, let's supress all spaces, then worry about them later: cat .voyn.fsg \ | /n/gnu/bin/tr '\012' ' ' \ | /n/gnu/bin/sed \ -e 's/CM/AN/g' \ -e 's/CI/A/g' \ -e 's/IL/N/g' \ -e 's/IN/M/g' \ -e 's/I*\([MNRK]\)/\1/g' \ -e 's/6/8/g' \ -e 's/A /G /g' \ \ -e 's/ //g' \ \ -e 's/4OD/q/g' \ -e 's/4OH/p/g' \ -e 's/AM/m/g' \ -e 's/AN/n/g' \ -e 's/AK/k/g' \ -e 's/AR/r/g' \ -e 's/OR/s/g' \ -e 's/OE/U/g' \ -e 's/AE/J/g' \ -e 's/4O/o/g' \ -e 's/4U/u/g' \ -e 's/SC8G/d/g' \ -e 's/TC8G/b/g' \ -e 's/SC/X/g' \ -e 's/TC/Y/g' \ -e 's/CCG/x/g' \ -e 's/CC8G/y/g' \ -e 's/CG/v/g' \ -e 's/C8G/w/g' \ -e 's/8G/z/g' \ -e 's/CC/W/g' \ -e 's/DZ/a/g' \ -e 's/HZ/i/g' \ -e 's/[ZMNKLI]//g' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' CO8EDASTHR2PGqpmnkrsUJouWXYdbxyvwzaiF4' Digraph counts: TT C O 8 E D A S T H R 2 P G q p m n k r s U J o u W X Y d b x y v w z a i F 4 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- G 1238 . 2 94 118 107 74 1 18 19 70 35 78 19 26 225 59 1 . 1 2 15 62 . 11 44 . 37 43 14 15 1 . . . 21 2 3 1 20 U 1155 . 4 67 44 25 218 2 25 50 48 10 25 15 58 39 16 14 8 1 5 42 78 5 3 6 5 74 85 55 78 1 2 . 1 35 2 1 5 3 q 1081 . 34 8 . 6 . 15 1 18 . . . . 68 . . 85 157 4 52 4 24 122 . . 8 2 5 7 7 87 154 45 167 1 . . . . D 919 . 41 7 2 5 . 11 5 19 . 3 . . 104 . . 71 119 8 53 10 31 52 . . 18 11 15 5 9 68 107 30 115 . . . . . O 836 . 3 8 15 1 350 . 1 1 296 . 14 45 18 9 . . 1 . . 1 7 . 3 1 . 9 9 2 4 2 3 . 1 11 6 6 8 1 8 691 . 1 14 5 17 8 9 8 14 4 2 5 . . 19 2 98 55 11 125 20 61 125 2 4 . 13 14 24 13 4 4 3 3 2 . . 1 1 Y 592 . 36 4 51 . 24 1 . 2 14 2 14 5 207 . . . 1 1 8 10 57 11 . . 1 1 . . . 1 . 55 33 . 32 21 . . H 583 . 25 4 1 2 1 2 4 23 . 1 1 . 59 . . 23 43 1 45 10 38 55 . . 8 7 12 10 15 30 38 25 99 1 . . . . w 558 . 1 68 36 51 8 1 9 15 9 19 18 7 13 126 33 . 1 . 1 6 31 . 8 19 . 16 16 16 13 . . . . 7 1 2 . 7 J 554 . 1 27 61 14 11 1 19 28 9 7 32 5 45 35 6 2 2 1 2 20 42 3 3 9 . 30 31 33 41 1 . . 1 27 . 1 2 2 X 507 . 42 5 31 1 27 . . . 11 . 3 6 150 . . . . 1 5 13 43 8 . . . . . . . . . 51 57 . 35 16 1 1 n 483 . 1 80 28 4 . 3 14 37 1 1 10 5 11 14 3 1 1 . 3 7 77 3 1 4 1 59 47 27 29 . 1 . . 6 . 4 . . b 461 1 3 35 24 36 11 . 6 5 14 16 16 9 3 130 35 2 . . 1 4 22 2 6 33 . 7 19 6 6 . . . . 3 . 1 . 5 E 452 . 1 22 15 6 50 . 10 25 8 7 10 4 14 8 1 3 2 2 5 18 41 5 . . 1 34 55 31 59 . 1 . . 12 . . 2 . r 431 . . 57 10 3 2 4 12 17 . 1 7 5 29 20 7 4 4 2 11 18 75 17 1 2 1 41 28 29 15 . . 1 . 6 . 1 1 . m 416 . 1 63 21 4 2 . 22 30 2 1 15 3 12 18 4 . . . 2 5 55 2 . 1 . 45 59 22 18 . . . . 6 2 . 1 . T 400 . . 10 16 13 17 . 2 1 8 4 6 12 62 . . . 1 4 8 9 31 14 . . . 1 . . . . . . . 81 66 31 3 . y 378 . . 41 17 34 5 . 5 7 5 13 11 3 5 112 32 . . . . 2 20 3 9 11 . 8 11 6 12 . . . . 3 . 1 . 2 2 372 . 1 26 2 2 4 3 3 5 6 1 5 2 11 4 1 49 33 1 30 19 91 35 . . . 12 8 6 6 . . 1 . 3 1 1 . . d 359 . . 30 18 8 3 . 6 4 9 1 10 8 5 130 31 . . . 1 2 19 . 10 24 . 9 6 6 7 . . . . 2 . 2 . 8 s 305 . . 33 9 2 3 . 3 8 3 . 1 7 22 9 2 18 12 1 13 11 50 11 . . . 29 26 20 5 2 1 . 2 . 1 . . 1 z 305 . 1 27 32 21 11 1 6 4 20 10 20 9 11 61 12 . . . 3 2 12 . 5 6 . 6 9 1 6 . . . 1 6 . . . 2 p 271 . 10 . 1 1 . 3 2 6 . 2 . . 29 . . 15 24 1 18 1 8 31 . . 4 2 3 2 4 7 42 9 46 . . . . . v 271 . . 24 19 33 6 . 4 7 11 11 10 5 5 64 16 . . . . 4 16 . 4 13 . 6 6 1 . . . . . 3 . . . 3 C 234 . . 2 41 3 35 2 6 7 15 5 22 6 . 2 . 1 2 . 6 6 27 4 . 1 . 3 2 . 3 10 16 . . . 3 2 2 . x 218 . . 28 14 35 3 . 2 6 4 19 4 2 2 40 9 1 . . . 4 16 . 1 7 . 3 5 4 3 . . . . . . . 1 5 P 216 . 2 9 3 . . . 8 22 . . . . 12 . . 2 1 . 5 5 39 7 . . . 7 23 10 47 1 1 5 4 3 . . . . S 212 . . 8 5 5 6 1 . 1 6 1 1 . 28 1 . 1 1 1 10 4 26 9 . 1 . . 2 . . . . . . 36 39 19 . . a 192 . 2 . 1 . . . . 1 . . . . 124 . . . 1 . . 1 1 4 . . 1 1 1 . . . . 26 19 9 . . . . u 192 . 1 12 1 3 31 . 4 5 4 4 3 3 9 3 . 4 2 . 3 1 11 2 . 5 . 22 25 11 21 . . . . 2 . . . . R 179 . . 7 2 3 . 2 3 4 2 1 2 3 9 2 . 19 12 3 8 10 25 15 . 1 . 10 19 7 8 . . . . 2 . . . . i 119 . 3 2 . . . . . . . . 1 . 74 . . . . . 1 3 1 2 . . 1 . . . . . . 17 8 6 . . . . o 69 . 2 2 6 . . . . 2 . . . 23 1 4 . 1 . . 1 1 4 1 . . 1 1 1 1 1 1 6 . . 4 . . 5 . 4 63 . 13 . . . 5 . . . 1 . 2 2 4 . 1 . . . 1 16 . 2 . . 2 . . 1 . 1 2 1 1 . 1 5 2 . A 62 . . 5 9 6 3 . 2 1 2 . 8 2 5 1 . . . . . . 4 1 1 . . . 2 1 . . . . . 6 1 2 . . W 52 . 3 1 24 1 1 . . 1 1 2 6 . . . . . . . 3 1 6 2 . . . . . . . . . . . . . . . . k 44 . . 6 8 . . . . . . . 12 1 3 5 1 . . . . . 1 . 1 . . 1 1 1 1 . . . . . . . . 2 F 36 . . . 1 . . . 2 5 . . . . . . . 1 . . . . 3 1 . . . . 4 . 15 1 . 2 . 1 . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 15507 1 234 836 691 452 919 62 212 400 583 179 372 216 1238 1081 271 416 483 44 431 305 1155 554 69 192 52 507 592 359 461 218 378 271 558 305 192 119 36 63 Next-symbol probability (× 99): TT TT TT C O 8 E D A S T H R 2 P G q p m n k r s U J o u W X Y d b x y v w z a i F 4 ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- J 4.357 554 99 . . 5 11 3 2 . 3 5 2 1 6 1 8 6 1 . . . . 4 8 1 1 2 . 5 6 6 7 . . . . 5 . . . . U 4.276 1155 99 . . 6 4 2 19 . 2 4 4 1 2 1 5 3 1 1 1 . . 4 7 . . 1 . 6 7 5 7 . . . . 3 . . . . G 4.131 1238 99 . . 8 9 9 6 . 1 2 6 3 6 2 2 18 5 . . . . 1 5 . 1 4 . 3 3 1 1 . . . . 2 . . . 2 R 4.129 179 99 . . 4 1 2 . 1 2 2 1 1 1 2 5 1 . 11 7 2 4 6 14 8 . 1 . 6 11 4 4 . . . . 1 . . . . E 4.110 452 99 . . 5 3 1 11 . 2 5 2 2 2 1 3 2 . 1 . . 1 4 9 1 . . . 7 12 7 13 . . . . 3 . . . . r 4.087 431 99 . . 13 2 1 . 1 3 4 . . 2 1 7 5 2 1 1 . 3 4 17 4 . . . 9 6 7 3 . . . . 1 . . . . s 4.078 305 99 . . 11 3 1 1 . 1 3 1 . . 2 7 3 1 6 4 . 4 4 16 4 . . . 9 8 6 2 1 . . 1 . . . . . z 4.077 305 99 . . 9 10 7 4 . 2 1 6 3 6 3 4 20 4 . . . 1 1 4 . 2 2 . 2 3 . 2 . . . . 2 . . . 1 w 4.011 558 99 . . 12 6 9 1 . 2 3 2 3 3 1 2 22 6 . . . . 1 6 . 1 3 . 3 3 3 2 . . . . 1 . . . 1 H 4.007 583 99 . 4 1 . . . . 1 4 . . . . 10 . . 4 7 . 8 2 6 9 . . 1 1 2 2 3 5 6 4 17 . . . . . u 3.977 192 99 . 1 6 1 2 16 . 2 3 2 2 2 2 5 2 . 2 1 . 2 1 6 1 . 3 . 11 13 6 11 . . . . 1 . . . . C 3.957 234 99 . . 1 17 1 15 1 3 3 6 2 9 3 . 1 . . 1 . 3 3 11 2 . . . 1 1 . 1 4 7 . . . 1 1 1 . D 3.931 919 99 . 4 1 . 1 . 1 1 2 . . . . 11 . . 8 13 1 6 1 3 6 . . 2 1 2 1 1 7 12 3 12 . . . . . b 3.876 461 99 . 1 8 5 8 2 . 1 1 3 3 3 2 1 28 8 . . . . 1 5 . 1 7 . 2 4 1 1 . . . . 1 . . . 1 A 3.865 62 99 . . 8 14 10 5 . 3 2 3 . 13 3 8 2 . . . . . . 6 2 2 . . . 3 2 . . . . . 10 2 3 . . 8 3.847 691 99 . . 2 1 2 1 1 1 2 1 . 1 . . 3 . 14 8 2 18 3 9 18 . 1 . 2 2 3 2 1 1 . . . . . . . v 3.840 271 99 . . 9 7 12 2 . 1 3 4 4 4 2 2 23 6 . . . . 1 6 . 1 5 . 2 2 . . . . . . 1 . . . 1 n 3.821 483 99 . . 16 6 1 . 1 3 8 . . 2 1 2 3 1 . . . 1 1 16 1 . 1 . 12 10 6 6 . . . . 1 . 1 . . m 3.811 416 99 . . 15 5 1 . . 5 7 . . 4 1 3 4 1 . . . . 1 13 . . . . 11 14 5 4 . . . . 1 . . . . x 3.804 218 99 . . 13 6 16 1 . 1 3 2 9 2 1 1 18 4 . . . . 2 7 . . 3 . 1 2 2 1 . . . . . . . . 2 2 3.769 372 99 . . 7 1 1 1 1 1 1 2 . 1 1 3 1 . 13 9 . 8 5 24 9 . . . 3 2 2 2 . . . . 1 . . . . p 3.753 271 99 . 4 . . . . 1 1 2 . 1 . . 11 . . 5 9 . 7 . 3 11 . . 1 1 1 1 1 3 15 3 17 . . . . . y 3.725 378 99 . . 11 4 9 1 . 1 2 1 3 3 1 1 29 8 . . . . 1 5 1 2 3 . 2 3 2 3 . . . . 1 . . . 1 q 3.644 1081 99 . 3 1 . 1 . 1 . 2 . . . . 6 . . 8 14 . 5 . 2 11 . . 1 . . 1 1 8 14 4 15 . . . . . P 3.617 216 99 . 1 4 1 . . . 4 10 . . . . 6 . . 1 . . 2 2 18 3 . . . 3 11 5 22 . . 2 2 1 . . . . T 3.607 400 99 . . 2 4 3 4 . . . 2 1 1 3 15 . . . . 1 2 2 8 3 . . . . . . . . . . . 20 16 8 1 . S 3.578 212 99 . . 4 2 2 3 . . . 3 . . . 13 . . . . . 5 2 12 4 . . . . 1 . . . . . . 17 18 9 . . d 3.553 359 99 . . 8 5 2 1 . 2 1 2 . 3 2 1 36 9 . . . . 1 5 . 3 7 . 2 2 2 2 . . . . 1 . 1 . 2 o 3.548 69 99 . 3 3 9 . . . . 3 . . . 33 1 6 . 1 . . 1 1 6 1 . . 1 1 1 1 1 1 9 . . 6 . . 7 . 4 3.512 63 99 . 20 . . . 8 . . . 2 . 3 3 6 . 2 . . . 2 25 . 3 . . 3 . . 2 . 2 3 2 2 . 2 8 3 . X 3.374 507 99 . 8 1 6 . 5 . . . 2 . 1 1 29 . . . . . 1 3 8 2 . . . . . . . . . 10 11 . 7 3 . . Y 3.344 592 99 . 6 1 9 . 4 . . . 2 . 2 1 35 . . . . . 1 2 10 2 . . . . . . . . . 9 6 . 5 4 . . k 3.166 44 99 . . 13 18 . . . . . . . 27 2 7 11 2 . . . . . 2 . 2 . . 2 2 2 2 . . . . . . . . 5 F 2.754 36 99 . . . 3 . . . 6 14 . . . . . . . 3 . . . . 8 3 . . . . 11 . 41 3 . 6 . 3 . . . . W 2.728 52 99 . 6 2 46 2 2 . . 2 2 4 11 . . . . . . . 6 2 11 4 . . . . . . . . . . . . . . . . O 2.446 836 99 . . 1 2 . 41 . . . 35 . 2 5 2 1 . . . . . . 1 . . . . 1 1 . . . . . . 1 1 1 1 . i 2.004 119 99 . 2 2 . . . . . . . . 1 . 62 . . . . . 1 2 1 2 . . 1 . . . . . . 14 7 5 . . . . a 1.836 192 99 . 1 . 1 . . . . 1 . . . . 64 . . . 1 . . 1 1 2 . . 1 1 1 . . . . 13 10 5 . . . . 0.000 1 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 3.764 15507 99 0 1 5 4 3 6 0 1 3 4 1 2 1 8 7 2 3 3 0 3 2 7 4 0 1 0 3 4 2 3 1 2 2 4 2 1 1 0 0 Previous-symbol probability (× 99): TT C O 8 E D A S T H R 2 P G q p m n k r s U J o u W X Y d b x y v w z a i F 4 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . C 1 . . . 6 1 4 3 3 2 3 3 6 3 . . . . . . 1 2 2 1 . 1 . 1 . . 1 5 4 . . . 2 2 6 . O 5 . 1 1 2 . 38 . . . 50 . 4 21 1 1 . . . . . . 1 . 4 1 . 2 2 1 1 1 1 . . 4 3 5 22 2 8 4 . . 2 1 4 1 14 4 3 1 1 1 . . 2 1 23 11 25 29 6 5 22 3 2 . 3 2 7 3 2 1 1 1 1 . . 3 2 E 3 . . 3 2 1 5 . 5 6 1 4 3 2 1 1 . 1 . 5 1 6 4 1 . . 2 7 9 9 13 . . . . 4 . . 6 . D 6 . 17 1 . 1 . 18 2 5 . 2 . . 8 . . 17 24 18 12 3 3 9 . . 34 2 3 1 2 31 28 11 20 . . . . . A 0 . . 1 1 1 . . 1 . . . 2 1 . . . . . . . . . . 1 . . . . . . . . . . 2 1 2 . . S 1 . . 1 1 1 1 2 . . 1 1 . . 2 . . . . 2 2 1 2 2 . 1 . . . . . . . . . 12 20 16 . . T 3 . . 1 2 3 2 . 1 . 1 2 2 6 5 . . . . 9 2 3 3 3 . . . . . . . . . . . 26 34 26 8 . H 4 . 11 . . . . 3 2 6 . 1 . . 5 . . 5 9 2 10 3 3 10 . . 15 1 2 3 3 14 10 9 18 . . . . . R 1 . . 1 . 1 . 3 1 1 . 1 1 1 1 . . 5 2 7 2 3 2 3 . 1 . 2 3 2 2 . . . . 1 . . . . 2 2 . . 3 . . . 5 1 1 1 1 1 1 1 . . 12 7 2 7 6 8 6 . . . 2 1 2 1 . . . . 1 1 1 . . P 1 . 1 1 . . . . 4 5 . . . . 1 . . . . . 1 2 3 1 . . . 1 4 3 10 . . 2 1 1 . . . . G 8 . 1 11 17 23 8 2 8 5 12 19 21 9 2 21 22 . . 2 . 5 5 . 16 23 . 7 7 4 3 . . . . 7 1 2 3 31 q 7 . 14 1 . 1 . 24 . 4 . . . . 5 . . 20 32 9 12 1 2 22 . . 15 . 1 2 2 40 40 16 30 . . . . . p 2 . 4 . . . . 5 1 1 . 1 . . 2 . . 4 5 2 4 . 1 6 . . 8 . 1 1 1 3 11 3 8 . . . . . m 3 . . 7 3 1 . . 10 7 . 1 4 1 1 2 1 . . . . 2 5 . . 1 . 9 10 6 4 . . . . 2 1 . 3 . n 3 . . 9 4 1 . 5 7 9 . 1 3 2 1 1 1 . . . 1 2 7 1 1 2 2 12 8 7 6 . . . . 2 . 3 . . k 0 . . 1 1 . . . . . . . 3 . . . . . . . . . . . 1 . . . . . . . . . . . . . . 3 r 3 . . 7 1 1 . 6 6 4 . 1 2 2 2 2 3 1 1 5 3 6 6 3 1 1 2 8 5 8 3 . . . . 2 . 1 3 . s 2 . . 4 1 . . . 1 2 1 . . 3 2 1 1 4 2 2 3 4 4 2 . . . 6 4 6 1 1 . . . . 1 . . 2 U 7 . 2 8 6 5 23 3 12 12 8 6 7 7 5 4 6 3 2 2 1 14 7 1 4 3 10 14 14 15 17 . 1 . . 11 1 1 14 5 J 4 . . 3 9 3 1 2 9 7 2 4 9 2 4 3 2 . . 2 . 6 4 1 4 5 . 6 5 9 9 . . . . 9 . 1 6 3 o 0 . 1 . 1 . . . . . . . . 11 . . . . . . . . . . . . 2 . . . . . 2 . . 1 . . 14 . u 1 . . 1 . 1 3 . 2 1 1 2 1 1 1 . . 1 . . 1 . 1 . . 3 . 4 4 3 5 . . . . 1 . . . . W 0 . 1 . 3 . . . . . . 1 2 . . . . . . . 1 . 1 . . . . . . . . . . . . . . . . . X 3 . 18 1 4 . 3 . . . 2 . 1 3 12 . . . . 2 1 4 4 1 . . . . . . . . . 19 10 . 18 13 3 2 Y 4 . 15 . 7 . 3 2 . . 2 1 4 2 17 . . . . 2 2 3 5 2 . . 2 . . . . . . 20 6 . 17 17 . . d 2 . . 4 3 2 . . 3 1 2 1 3 4 . 12 11 . . . . 1 2 . 14 12 . 2 1 2 2 . . . . 1 . 2 . 13 b 3 99 1 4 3 8 1 . 3 1 2 9 4 4 . 12 13 . . . . 1 2 . 9 17 . 1 3 2 1 . . . . 1 . 1 . 8 x 1 . . 3 2 8 . . 1 1 1 11 1 1 . 4 3 . . . . 1 1 . 1 4 . 1 1 1 1 . . . . . . . 3 8 y 2 . . 5 2 7 1 . 2 2 1 7 3 1 . 10 12 . . . . 1 2 1 13 6 . 2 2 2 3 . . . . 1 . 1 . 3 v 2 . . 3 3 7 1 . 2 2 2 6 3 2 . 6 6 . . . . 1 1 . 6 7 . 1 1 . . . . . . 1 . . . 5 w 4 . . 8 5 11 1 2 4 4 2 11 5 3 1 12 12 . . . . 2 3 . 11 10 . 3 3 4 3 . . . . 2 1 2 . 11 z 2 . . 3 5 5 1 2 3 1 3 6 5 4 1 6 4 . . . 1 1 1 . 7 3 . 1 2 . 1 . . . . 2 . . . 3 a 1 . 1 . . . . . . . . . . . 10 . . . . . . . . 1 . . 2 . . . . . . 9 3 3 . . . . i 1 . 1 . . . . . . . . . . . 6 . . . . . . 1 . . . . 2 . . . . . . 6 1 2 . . . . F 0 . . . . . . . 1 1 . . . . . . . . . . . . . . . . . . 1 . 3 . . 1 . . . . . . 4 0 . 6 . . . 1 . . . . . 1 1 . . . . . . . 5 . . . . 4 . . . . . 1 . . . 1 4 6 . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 Symbol entropy: 4.863 Next-symbol entropy: TT TT C O 8 E D A S T H R 2 P G q p m n k r s U J o u W X Y d b x y v w z a i F 4 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- J 4.357 554 . 0.016 0.212 0.350 0.134 0.112 0.016 0.167 0.218 0.097 0.080 0.238 0.061 0.294 0.252 0.071 0.029 0.029 0.016 0.029 0.173 0.282 0.041 0.041 0.097 . 0.228 0.233 0.242 0.278 0.016 . . 0.016 0.212 . 0.016 0.029 0.029 U 4.276 1155 . 0.028 0.238 0.180 0.120 0.454 0.016 0.120 0.196 0.191 0.059 0.120 0.081 0.217 0.165 0.086 0.077 0.050 0.009 0.034 0.174 0.263 0.034 0.022 0.039 0.034 0.254 0.277 0.209 0.263 0.009 0.016 . 0.009 0.153 0.016 0.009 0.034 0.022 G 4.131 1238 . 0.015 0.282 0.323 0.305 0.243 0.008 0.089 0.092 0.234 0.145 0.251 0.092 0.117 0.447 0.209 0.008 . 0.008 0.015 0.077 0.216 . 0.061 0.171 . 0.151 0.168 0.073 0.077 0.008 . . . 0.100 0.015 0.021 0.008 0.096 R 4.129 179 . . 0.183 0.072 0.099 . 0.072 0.099 0.123 0.072 0.042 0.072 0.099 0.217 0.072 . 0.343 0.261 0.099 0.200 0.233 0.397 0.300 . 0.042 . 0.233 0.343 0.183 0.200 . . . . 0.072 . . . . E 4.110 452 . 0.020 0.212 0.163 0.083 0.351 . 0.122 0.231 0.103 0.093 0.122 0.060 0.155 0.103 0.020 0.048 0.035 0.035 0.072 0.185 0.314 0.072 . . 0.020 0.281 0.370 0.265 0.383 . 0.020 . . 0.139 . . 0.035 . r 4.087 431 . . 0.386 0.126 0.050 0.036 0.063 0.144 0.184 . 0.020 0.097 0.075 0.262 0.206 0.097 0.063 0.063 0.036 0.135 0.191 0.439 0.184 0.020 0.036 0.020 0.323 0.256 0.262 0.169 . . 0.020 . 0.086 . 0.020 0.020 . s 4.078 305 . . 0.347 0.150 0.048 0.066 . 0.066 0.138 0.066 . 0.027 0.125 0.274 0.150 0.048 0.241 0.184 0.027 0.194 0.173 0.428 0.173 . . . 0.323 0.303 0.258 0.097 0.048 0.027 . 0.048 . 0.027 . . 0.027 z 4.077 305 . 0.027 0.310 0.341 0.266 0.173 0.027 0.111 0.082 0.258 0.162 0.258 0.150 0.173 0.464 0.184 . . . 0.066 0.048 0.184 . 0.097 0.111 . 0.111 0.150 0.027 0.111 . . . 0.027 0.111 . . . 0.048 w 4.011 558 . 0.016 0.370 0.255 0.315 0.088 0.016 0.096 0.140 0.096 0.166 0.160 0.079 0.126 0.485 0.241 . 0.016 . 0.016 0.070 0.232 . 0.088 0.166 . 0.147 0.147 0.147 0.126 . . . . 0.079 0.016 0.029 . 0.079 H 4.007 583 . 0.195 0.049 0.016 0.028 0.016 0.028 0.049 0.184 . 0.016 0.016 . 0.334 . . 0.184 0.277 0.016 0.285 0.101 0.257 0.321 . . 0.085 0.077 0.115 0.101 0.136 0.220 0.257 0.195 0.434 0.016 . . . . u 3.977 192 . 0.040 0.250 0.040 0.094 0.425 . 0.116 0.137 0.116 0.116 0.094 0.094 0.207 0.094 . 0.116 0.069 . 0.094 0.040 0.236 0.069 . 0.137 . 0.358 0.383 0.236 0.349 . . . . 0.069 . . . . C 3.957 234 . . 0.059 0.440 0.081 0.410 0.059 0.136 0.151 0.254 0.119 0.321 0.136 . 0.059 . 0.034 0.059 . 0.136 0.136 0.359 0.100 . 0.034 . 0.081 0.059 . 0.081 0.194 0.265 . . . 0.081 0.059 0.059 . D 3.931 919 . 0.200 0.054 0.019 0.041 . 0.076 0.041 0.116 . 0.027 . . 0.356 . . 0.285 0.382 0.060 0.237 0.071 0.165 0.234 . . 0.111 0.076 0.097 0.041 0.065 0.278 0.361 0.161 0.375 . . . . . b 3.876 461 0.019 0.047 0.282 0.222 0.287 0.129 . 0.082 0.071 0.153 0.168 0.168 0.111 0.047 0.515 0.282 0.034 . . 0.019 0.059 0.209 0.034 0.082 0.272 . 0.092 0.190 0.082 0.082 . . . . 0.047 . 0.019 . 0.071 A 3.865 62 . . 0.293 0.404 0.326 0.211 . 0.160 0.096 0.160 . 0.381 0.160 0.293 0.096 . . . . . . 0.255 0.096 0.096 . . . 0.160 0.096 . . . . . 0.326 0.096 0.160 . . 8 3.847 691 . 0.014 0.114 0.051 0.131 0.074 0.082 0.074 0.114 0.043 0.024 0.051 . . 0.143 0.024 0.400 0.291 0.095 0.446 0.148 0.309 0.446 0.024 0.043 . 0.108 0.114 0.168 0.108 0.043 0.043 0.034 0.034 0.024 . . 0.014 0.014 v 3.840 271 . . 0.310 0.269 0.370 0.122 . 0.090 0.136 0.188 0.188 0.176 0.106 0.106 0.492 0.241 . . . . 0.090 0.241 . 0.090 0.210 . 0.122 0.122 0.030 . . . . . 0.072 . . . 0.072 n 3.821 483 . 0.018 0.430 0.238 0.057 . 0.046 0.148 0.284 0.018 0.018 0.116 0.068 0.124 0.148 0.046 0.018 0.018 . 0.046 0.089 0.422 0.046 0.018 0.057 0.018 0.371 0.327 0.233 0.244 . 0.018 . . 0.079 . 0.057 . . m 3.811 416 . 0.021 0.412 0.217 0.064 0.037 . 0.224 0.274 0.037 0.021 0.173 0.051 0.148 0.196 0.064 . . . 0.037 0.077 0.386 0.037 . 0.021 . 0.347 0.400 0.224 0.196 . . . . 0.088 0.037 . 0.021 . x 3.804 218 . . 0.380 0.254 0.424 0.085 . 0.062 0.143 0.106 0.307 0.106 0.062 0.062 0.449 0.190 0.036 . . . 0.106 0.277 . 0.036 0.159 . 0.085 0.125 0.106 0.085 . . . . . . . 0.036 0.125 2 3.769 372 . 0.023 0.268 0.041 0.041 0.070 0.056 0.056 0.084 0.096 0.023 0.084 0.041 0.150 0.070 0.023 0.385 0.310 0.023 0.293 0.219 0.497 0.321 . . . 0.160 0.119 0.096 0.096 . . 0.023 . 0.056 0.023 0.023 . . p 3.753 271 . 0.176 . 0.030 0.030 . 0.072 0.052 0.122 . 0.052 . . 0.345 . . 0.231 0.310 0.030 0.260 0.030 0.150 0.358 . . 0.090 0.052 0.072 0.052 0.090 0.136 0.417 0.163 0.434 . . . . . y 3.725 378 . . 0.348 0.201 0.313 0.083 . 0.083 0.107 0.083 0.167 0.148 0.055 0.083 0.520 0.302 . . . . 0.040 0.224 0.055 0.128 0.148 . 0.118 0.148 0.095 0.158 . . . . 0.055 . 0.023 . 0.040 q 3.644 1081 . 0.157 0.052 . 0.042 . 0.086 0.009 0.098 . . . . 0.251 . . 0.288 0.404 0.030 0.211 0.030 0.122 0.355 . . 0.052 0.017 0.036 0.047 0.047 0.293 0.401 0.191 0.416 0.009 . . . . P 3.617 216 . 0.063 0.191 0.086 . . . 0.176 0.336 . . . . 0.232 . . 0.063 0.036 . 0.126 0.126 0.446 0.160 . . . 0.160 0.344 0.205 0.479 0.036 0.036 0.126 0.107 0.086 . . . . T 3.607 400 . . 0.133 0.186 0.161 0.194 . 0.038 0.022 0.113 0.066 0.091 0.152 0.417 . . . 0.022 0.066 0.113 0.123 0.286 0.169 . . . 0.022 . . . . . . . 0.467 0.429 0.286 0.053 . S 3.578 212 . . 0.178 0.127 0.127 0.146 0.036 . 0.036 0.146 0.036 0.036 . 0.386 0.036 . 0.036 0.036 0.036 0.208 0.108 0.371 0.193 . 0.036 . . 0.063 . . . . . . 0.434 0.449 0.312 . . d 3.553 359 . . 0.299 0.216 0.122 0.058 . 0.099 0.072 0.133 0.024 0.144 0.122 0.086 0.531 0.305 . . . 0.024 0.042 0.224 . 0.144 0.261 . 0.133 0.099 0.099 0.111 . . . . 0.042 . 0.042 . 0.122 o 3.548 69 . 0.148 0.148 0.306 . . . . 0.148 . . . 0.528 0.089 0.238 . 0.089 . . 0.089 0.089 0.238 0.089 . . 0.089 0.089 0.089 0.089 0.089 0.089 0.306 . . 0.238 . . 0.274 . 4 3.512 63 . 0.470 . . . 0.290 . . . 0.095 . 0.158 0.158 0.253 . 0.095 . . . 0.095 0.502 . 0.158 . . 0.158 . . 0.095 . 0.095 0.158 0.095 0.095 . 0.095 0.290 0.158 . X 3.374 507 . 0.298 0.066 0.247 0.018 0.225 . . . 0.120 . 0.044 0.076 0.520 . . . . 0.018 0.066 0.136 0.302 0.094 . . . . . . . . . 0.333 0.354 . 0.266 0.157 0.018 0.018 Y 3.344 592 . 0.246 0.049 0.305 . 0.187 0.016 . 0.028 0.128 0.028 0.128 0.058 0.530 . . . 0.016 0.016 0.084 0.099 0.325 0.107 . . 0.016 0.016 . . . 0.016 . 0.318 0.232 . 0.228 0.171 . . k 3.166 44 . . 0.392 0.447 . . . . . . . 0.511 0.124 0.264 0.357 0.124 . . . . . 0.124 . 0.124 . . 0.124 0.124 0.124 0.124 . . . . . . . . 0.203 F 2.754 36 . . . 0.144 . . . 0.232 0.396 . . . . . . . 0.144 . . . . 0.299 0.144 . . . . 0.352 . 0.526 0.144 . 0.232 . 0.144 . . . . W 2.728 52 . 0.237 0.110 0.515 0.110 0.110 . . 0.110 0.110 0.181 0.359 . . . . . . . 0.237 0.110 0.359 0.181 . . . . . . . . . . . . . . . . O 2.446 836 . 0.029 0.064 0.104 0.012 0.526 . 0.012 0.012 0.530 . 0.099 0.227 0.119 0.070 . . 0.012 . . 0.012 0.058 . 0.029 0.012 . 0.070 0.070 0.021 0.037 0.021 0.029 . 0.012 0.082 0.051 0.051 0.064 0.012 i 2.004 119 . 0.134 0.099 . . . . . . . . 0.058 . 0.426 . . . . . 0.058 0.134 0.058 0.099 . . 0.058 . . . . . . 0.401 0.262 0.217 . . . . a 1.836 192 . 0.069 . 0.040 . . . . 0.040 . . . . 0.407 . . . 0.040 . . 0.040 0.040 0.116 . . 0.040 0.040 0.040 . . . . 0.391 0.330 0.207 . . . . 0.000 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 3.764 15507 0.001 0.091 0.227 0.200 0.149 0.242 0.032 0.085 0.136 0.178 0.074 0.129 0.086 0.291 0.268 0.102 0.140 0.156 0.024 0.144 0.111 0.279 0.172 0.035 0.078 0.028 0.161 0.180 0.126 0.151 0.086 0.131 0.102 0.173 0.111 0.078 0.054 0.020 0.032 There is a problem with "O" ("OD" or "OH"). Let's try cat .voyn.fsg \ | /n/gnu/bin/tr '\012' ' ' \ | /n/gnu/bin/sed \ -e 's/CM/AN/g' \ -e 's/CI/A/g' \ -e 's/IL/N/g' \ -e 's/IN/M/g' \ -e 's/I*\([MNRK]\)/\1/g' \ -e 's/6/8/g' \ -e 's/A /G /g' \ \ -e 's/ //g' \ \ -e 's/4OD/q/g' \ -e 's/4OH/p/g' \ -e 's/OD/d/g' \ -e 's/OH/b/g' \ -e 's/AM/m/g' \ -e 's/AN/n/g' \ -e 's/AK/k/g' \ -e 's/AR/r/g' \ -e 's/OR/s/g' \ -e 's/OE/U/g' \ -e 's/AE/J/g' \ -e 's/4O/o/g' \ -e 's/4U/u/g' \ -e 's/SC8G/f/g' \ -e 's/TC8G/t/g' \ -e 's/SC/X/g' \ -e 's/TC/Y/g' \ -e 's/CCG/x/g' \ -e 's/CC8G/y/g' \ -e 's/CG/v/g' \ -e 's/C8G/w/g' \ -e 's/8G/z/g' \ -e 's/CC/W/g' \ -e 's/DZ/a/g' \ -e 's/HZ/i/g' \ -e 's/[ZMNKLI]//g' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' CO8EDASTHR2PGqpdbmnkrsUJouWXYftxyvwzaiF4' Digraph counts: TT C O 8 E D A S T H R 2 P G q p d b m n k r s U J o u W X Y f t x y v w z a i F 4 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- G 1238 . 2 12 118 107 74 1 18 19 70 35 78 19 26 225 59 42 40 1 . 1 2 15 62 . 11 44 . 37 43 14 15 1 . . . 21 2 3 1 20 U 1155 . 4 15 44 25 218 2 25 50 48 10 25 15 58 39 16 25 27 14 8 1 5 42 78 5 3 6 5 74 85 55 78 1 2 . 1 35 2 1 5 3 q 1081 . 34 7 . 6 . 15 1 18 . . . . 68 . . 1 . 85 157 4 52 4 24 122 . . 8 2 5 7 7 87 154 45 167 1 . . . . 8 691 . 1 1 5 17 8 9 8 14 4 2 5 . . 19 2 7 6 98 55 11 125 20 61 125 2 4 . 13 14 24 13 4 4 3 3 2 . . 1 1 Y 592 . 36 1 51 . 24 1 . 2 14 2 14 5 207 . . 3 . . 1 1 8 10 57 11 . . 1 1 . . . 1 . 55 33 . 32 21 . . D 570 . 23 3 1 4 . 4 4 13 . 3 . . 82 . . . 2 35 73 6 29 8 18 22 . . 9 7 8 2 7 52 68 19 68 . . . . . w 558 . 1 5 36 51 8 1 9 15 9 19 18 7 13 126 33 35 28 . 1 . 1 6 31 . 8 19 . 16 16 16 13 . . . . 7 1 2 . 7 J 554 . 1 7 61 14 11 1 19 28 9 7 32 5 45 35 6 10 10 2 2 1 2 20 42 3 3 9 . 30 31 33 41 1 . . 1 27 . 1 2 2 X 507 . 42 2 31 1 27 . . . 11 . 3 6 150 . . 3 . . . 1 5 13 43 8 . . . . . . . . . 51 57 . 35 16 1 1 n 483 . 1 11 28 4 . 3 14 37 1 1 10 5 11 14 3 34 35 1 1 . 3 7 77 3 1 4 1 59 47 27 29 . 1 . . 6 . 4 . . t 461 1 3 5 24 36 11 . 6 5 14 16 16 9 3 130 35 15 15 2 . . 1 4 22 2 6 33 . 7 19 6 6 . . . . 3 . 1 . 5 E 452 . 1 16 15 6 50 . 10 25 8 7 10 4 14 8 1 3 3 3 2 2 5 18 41 5 . . 1 34 55 31 59 . 1 . . 12 . . 2 . r 431 . . 12 10 3 2 4 12 17 . 1 7 5 29 20 7 25 20 4 4 2 11 18 75 17 1 2 1 41 28 29 15 . . 1 . 6 . 1 1 . m 416 . 1 5 21 4 2 . 22 30 2 1 15 3 12 18 4 35 23 . . . 2 5 55 2 . 1 . 45 59 22 18 . . . . 6 2 . 1 . T 400 . . 5 16 13 17 . 2 1 8 4 6 12 62 . . 3 2 . 1 4 8 9 31 14 . . . 1 . . . . . . . 81 66 31 3 . y 378 . . 4 17 34 5 . 5 7 5 13 11 3 5 112 32 20 17 . . . . 2 20 3 9 11 . 8 11 6 12 . . . . 3 . 1 . 2 2 372 . 1 10 2 2 4 3 3 5 6 1 5 2 11 4 1 11 5 49 33 1 30 19 91 35 . . . 12 8 6 6 . . 1 . 3 1 1 . . f 359 . . 2 18 8 3 . 6 4 9 1 10 8 5 130 31 11 17 . . . 1 2 19 . 10 24 . 9 6 6 7 . . . . 2 . 2 . 8 d 355 . 18 1 1 1 . 7 1 6 . . . . 26 . . . 1 36 46 2 24 2 13 30 . . 9 4 7 3 2 16 39 13 47 . . . . . s 305 . . 11 9 2 3 . 3 8 3 . 1 7 22 9 2 16 6 18 12 1 13 11 50 11 . . . 29 26 20 5 2 1 . 2 . 1 . . 1 z 305 . 1 9 32 21 11 1 6 4 20 10 20 9 11 61 12 8 10 . . . 3 2 12 . 5 6 . 6 9 1 6 . . . 1 6 . . . 2 b 301 . 16 1 1 1 . 2 3 7 . 1 . . 22 . . . . 13 28 . 29 3 15 31 . . 1 2 4 5 4 19 25 16 52 . . . . . H 287 . 10 . . 1 1 . 1 16 . . 1 . 38 . . 1 2 10 15 1 16 8 23 24 . . 7 5 8 5 11 11 13 11 47 1 . . . . p 271 . 10 . 1 1 . 3 2 6 . 2 . . 29 . . . . 15 24 1 18 1 8 31 . . 4 2 3 2 4 7 42 9 46 . . . . . v 271 . . 3 19 33 6 . 4 7 11 11 10 5 5 64 16 13 8 . . . . 4 16 . 4 13 . 6 6 1 . . . . . 3 . . . 3 C 234 . . 2 41 3 35 2 6 7 15 5 22 6 . 2 . . . 1 2 . 6 6 27 4 . 1 . 3 2 . 3 10 16 . . . 3 2 2 . x 218 . . 2 14 35 3 . 2 6 4 19 4 2 2 40 9 13 13 1 . . . 4 16 . 1 7 . 3 5 4 3 . . . . . . . 1 5 P 216 . 2 5 3 . . . 8 22 . . . . 12 . . 3 1 2 1 . 5 5 39 7 . . . 7 23 10 47 1 1 5 4 3 . . . . S 212 . . 2 5 5 6 1 . 1 6 1 1 . 28 1 . 6 . 1 1 1 10 4 26 9 . 1 . . 2 . . . . . . 36 39 19 . . u 192 . 1 3 1 3 31 . 4 5 4 4 3 3 9 3 . 3 6 4 2 . 3 1 11 2 . 5 . 22 25 11 21 . . . . 2 . . . . a 186 . 2 . 1 . . . . 1 . . . . 120 . . . . . 1 . . 1 1 4 . . 1 1 1 . . . . 24 19 9 . . . . O 180 . 3 4 15 1 1 . 1 1 . . 14 45 18 9 . 4 . . 1 . . 1 7 . 3 1 . 9 9 2 4 2 3 . 1 11 . 1 8 1 R 179 . . 4 2 3 . 2 3 4 2 1 2 3 9 2 . 1 2 19 12 3 8 10 25 15 . 1 . 10 19 7 8 . . . . 2 . . . . i 114 . 2 1 . . . . . . . . 1 . 73 . . 1 . . . . 1 2 1 2 . . 1 . . . . . . 15 8 6 . . . . o 69 . 2 1 6 . . . . 2 . . . 23 1 4 . 1 . 1 . . 1 1 4 1 . . 1 1 1 1 1 1 6 . . 4 . . 5 . 4 63 . 13 . . . 5 . . . 1 . 2 2 4 . 1 . . . . . 1 16 . 2 . . 2 . . 1 . 1 2 1 1 . 1 5 2 . A 62 . . 4 9 6 3 . 2 1 2 . 8 2 5 1 . 1 . . . . . . 4 1 1 . . . 2 1 . . . . . 6 1 2 . . W 52 . 3 1 24 1 1 . . 1 1 2 6 . . . . . . . . . 3 1 6 2 . . . . . . . . . . . . . . . . k 44 . . 3 8 . . . . . . . 12 1 3 5 1 1 2 . . . . . 1 . 1 . . 1 1 1 1 . . . . . . . . 2 F 36 . . . 1 . . . 2 5 . . . . . . . . . 1 . . . . 3 1 . . . . 4 . 15 1 . 2 . 1 . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 14851 1 234 180 691 452 570 62 212 400 287 179 372 216 1238 1081 271 355 301 416 483 44 431 305 1155 554 69 192 52 507 592 359 461 218 378 271 558 305 186 114 36 63 Next-symbol probability (× 99): TT TT TT C O 8 E D A S T H R 2 P G q p d b m n k r s U J o u W X Y f t x y v w z a i F 4 ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- J 4.434 554 99 . . 1 11 3 2 . 3 5 2 1 6 1 8 6 1 2 2 . . . . 4 8 1 1 2 . 5 6 6 7 . . . . 5 . . . . U 4.365 1155 99 . . 1 4 2 19 . 2 4 4 1 2 1 5 3 1 2 2 1 1 . . 4 7 . . 1 . 6 7 5 7 . . . . 3 . . . . r 4.289 431 99 . . 3 2 1 . 1 3 4 . . 2 1 7 5 2 6 5 1 1 . 3 4 17 4 . . . 9 6 7 3 . . . . 1 . . . . G 4.239 1238 99 . . 1 9 9 6 . 1 2 6 3 6 2 2 18 5 3 3 . . . . 1 5 . 1 4 . 3 3 1 1 . . . . 2 . . . 2 s 4.239 305 99 . . 4 3 1 1 . 1 3 1 . . 2 7 3 1 5 2 6 4 . 4 4 16 4 . . . 9 8 6 2 1 . . 1 . . . . . z 4.217 305 99 . . 3 10 7 4 . 2 1 6 3 6 3 4 20 4 3 3 . . . 1 1 4 . 2 2 . 2 3 . 2 . . . . 2 . . . 1 R 4.183 179 99 . . 2 1 2 . 1 2 2 1 1 1 2 5 1 . 1 1 11 7 2 4 6 14 8 . 1 . 6 11 4 4 . . . . 1 . . . . w 4.169 558 99 . . 1 6 9 1 . 2 3 2 3 3 1 2 22 6 6 5 . . . . 1 6 . 1 3 . 3 3 3 2 . . . . 1 . . . 1 E 4.164 452 99 . . 4 3 1 11 . 2 5 2 2 2 1 3 2 . 1 1 1 . . 1 4 9 1 . . . 7 12 7 13 . . . . 3 . . . . u 4.071 192 99 . 1 2 1 2 16 . 2 3 2 2 2 2 5 2 . 2 3 2 1 . 2 1 6 1 . 3 . 11 13 6 11 . . . . 1 . . . . n 4.060 483 99 . . 2 6 1 . 1 3 8 . . 2 1 2 3 1 7 7 . . . 1 1 16 1 . 1 . 12 10 6 6 . . . . 1 . 1 . . H 4.044 287 99 . 3 . . . . . . 6 . . . . 13 . . . 1 3 5 . 6 3 8 8 . . 2 2 3 2 4 4 4 4 16 . . . . . m 4.007 416 99 . . 1 5 1 . . 5 7 . . 4 1 3 4 1 8 5 . . . . 1 13 . . . . 11 14 5 4 . . . . 1 . . . . t 3.986 461 99 . 1 1 5 8 2 . 1 1 3 3 3 2 1 28 8 3 3 . . . . 1 5 . 1 7 . 2 4 1 1 . . . . 1 . . . 1 x 3.971 218 99 . . 1 6 16 1 . 1 3 2 9 2 1 1 18 4 6 6 . . . . 2 7 . . 3 . 1 2 2 1 . . . . . . . . 2 v 3.963 271 99 . . 1 7 12 2 . 1 3 4 4 4 2 2 23 6 5 3 . . . . 1 6 . 1 5 . 2 2 . . . . . . 1 . . . 1 C 3.957 234 99 . . 1 17 1 15 1 3 3 6 2 9 3 . 1 . . . . 1 . 3 3 11 2 . . . 1 1 . 1 4 7 . . . 1 1 1 . A 3.923 62 99 . . 6 14 10 5 . 3 2 3 . 13 3 8 2 . 2 . . . . . . 6 2 2 . . . 3 2 . . . . . 10 2 3 . . O 3.916 180 99 . 2 2 8 1 1 . 1 1 . . 8 25 10 5 . 2 . . 1 . . 1 4 . 2 1 . 5 5 1 2 1 2 . 1 6 . 1 4 1 D 3.904 570 99 . 4 1 . 1 . 1 1 2 . 1 . . 14 . . . . 6 13 1 5 1 3 4 . . 2 1 1 . 1 9 12 3 12 . . . . . d 3.896 355 99 . 5 . . . . 2 . 2 . . . . 7 . . . . 10 13 1 7 1 4 8 . . 3 1 2 1 1 4 11 4 13 . . . . . 2 3.875 372 99 . . 3 1 1 1 1 1 1 2 . 1 1 3 1 . 3 1 13 9 . 8 5 24 9 . . . 3 2 2 2 . . . . 1 . . . . 8 3.873 691 99 . . . 1 2 1 1 1 2 1 . 1 . . 3 . 1 1 14 8 2 18 3 9 18 . 1 . 2 2 3 2 1 1 . . . . . . . y 3.872 378 99 . . 1 4 9 1 . 1 2 1 3 3 1 1 29 8 5 4 . . . . 1 5 1 2 3 . 2 3 2 3 . . . . 1 . . . 1 b 3.862 301 99 . 5 . . . . 1 1 2 . . . . 7 . . . . 4 9 . 10 1 5 10 . . . 1 1 2 1 6 8 5 17 . . . . . p 3.753 271 99 . 4 . . . . 1 1 2 . 1 . . 11 . . . . 5 9 . 7 . 3 11 . . 1 1 1 1 1 3 15 3 17 . . . . . P 3.673 216 99 . 1 2 1 . . . 4 10 . . . . 6 . . 1 . 1 . . 2 2 18 3 . . . 3 11 5 22 . . 2 2 1 . . . . f 3.658 359 99 . . 1 5 2 1 . 2 1 2 . 3 2 1 36 9 3 5 . . . . 1 5 . 3 7 . 2 2 2 2 . . . . 1 . 1 . 2 q 3.648 1081 99 . 3 1 . 1 . 1 . 2 . . . . 6 . . . . 8 14 . 5 . 2 11 . . 1 . . 1 1 8 14 4 15 . . . . . T 3.644 400 99 . . 1 4 3 4 . . . 2 1 1 3 15 . . 1 . . . 1 2 2 8 3 . . . . . . . . . . . 20 16 8 1 . S 3.609 212 99 . . 1 2 2 3 . . . 3 . . . 13 . . 3 . . . . 5 2 12 4 . . . . 1 . . . . . . 17 18 9 . . o 3.577 69 99 . 3 1 9 . . . . 3 . . . 33 1 6 . 1 . 1 . . 1 1 6 1 . . 1 1 1 1 1 1 9 . . 6 . . 7 . 4 3.512 63 99 . 20 . . . 8 . . . 2 . 3 3 6 . 2 . . . . . 2 25 . 3 . . 3 . . 2 . 2 3 2 2 . 2 8 3 . X 3.384 507 99 . 8 . 6 . 5 . . . 2 . 1 1 29 . . 1 . . . . 1 3 8 2 . . . . . . . . . 10 11 . 7 3 . . k 3.365 44 99 . . 7 18 . . . . . . . 27 2 7 11 2 2 5 . . . . . 2 . 2 . . 2 2 2 2 . . . . . . . . 5 Y 3.349 592 99 . 6 . 9 . 4 . . . 2 . 2 1 35 . . 1 . . . . 1 2 10 2 . . . . . . . . . 9 6 . 5 4 . . F 2.754 36 99 . . . 3 . . . 6 14 . . . . . . . . . 3 . . . . 8 3 . . . . 11 . 41 3 . 6 . 3 . . . . W 2.728 52 99 . 6 2 46 2 2 . . 2 2 4 11 . . . . . . . . . 6 2 11 4 . . . . . . . . . . . . . . . . i 1.956 114 99 . 2 1 . . . . . . . . 1 . 63 . . 1 . . . . 1 2 1 2 . . 1 . . . . . . 13 7 5 . . . . a 1.850 186 99 . 1 . 1 . . . . 1 . . . . 64 . . . . . 1 . . 1 1 2 . . 1 1 1 . . . . 13 10 5 . . . . 0.000 1 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 3.913 14851 99 0 2 1 5 3 4 0 1 3 2 1 2 1 8 7 2 2 2 3 3 0 3 2 8 4 0 1 0 3 4 2 3 1 3 2 4 2 1 1 0 0 Previous-symbol probability (× 99): TT C O 8 E D A S T H R 2 P G q p d b m n k r s U J o u W X Y f t x y v w z a i F 4 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . C 2 . . 1 6 1 6 3 3 2 5 3 6 3 . . . . . . . . 1 2 2 1 . 1 . 1 . . 1 5 4 . . . 2 2 6 . O 1 . 1 2 2 . . . . . . . 4 21 1 1 . 1 . . . . . . 1 . 4 1 . 2 2 1 1 1 1 . . 4 . 1 22 2 8 5 . . 1 1 4 1 14 4 3 1 1 1 . . 2 1 2 2 23 11 25 29 6 5 22 3 2 . 3 2 7 3 2 1 1 1 1 . . 3 2 E 3 . . 9 2 1 9 . 5 6 3 4 3 2 1 1 . 1 1 1 . 5 1 6 4 1 . . 2 7 9 9 13 . . . . 4 . . 6 . D 4 . 10 2 . 1 . 6 2 3 . 2 . . 7 . . . 1 8 15 13 7 3 2 4 . . 17 1 1 1 2 24 18 7 12 . . . . . A 0 . . 2 1 1 1 . 1 . 1 . 2 1 . . . . . . . . . . . . 1 . . . . . . . . . . 2 1 2 . . S 1 . . 1 1 1 1 2 . . 2 1 . . 2 . . 2 . . . 2 2 1 2 2 . 1 . . . . . . . . . 12 21 17 . . T 3 . . 3 2 3 3 . 1 . 3 2 2 6 5 . . 1 1 . . 9 2 3 3 3 . . . . . . . . . . . 26 35 27 8 . H 2 . 4 . . . . . . 4 . . . . 3 . . . 1 2 3 2 4 3 2 4 . . 13 1 1 1 2 5 3 4 8 . . . . . R 1 . . 2 . 1 . 3 1 1 1 1 1 1 1 . . . 1 5 2 7 2 3 2 3 . 1 . 2 3 2 2 . . . . 1 . . . . 2 2 . . 6 . . 1 5 1 1 2 1 1 1 1 . . 3 2 12 7 2 7 6 8 6 . . . 2 1 2 1 . . . . 1 1 1 . . P 1 . 1 3 . . . . 4 5 . . . . 1 . . 1 . . . . 1 2 3 1 . . . 1 4 3 10 . . 2 1 1 . . . . G 8 . 1 7 17 23 13 2 8 5 24 19 21 9 2 21 22 12 13 . . 2 . 5 5 . 16 23 . 7 7 4 3 . . . . 7 1 3 3 31 q 7 . 14 4 . 1 . 24 . 4 . . . . 5 . . . . 20 32 9 12 1 2 22 . . 15 . 1 2 2 40 40 16 30 . . . . . p 2 . 4 . . . . 5 1 1 . 1 . . 2 . . . . 4 5 2 4 . 1 6 . . 8 . 1 1 1 3 11 3 8 . . . . . d 2 . 8 1 . . . 11 . 1 . . . . 2 . . . . 9 9 5 6 1 1 5 . . 17 1 1 1 . 7 10 5 8 . . . . . b 2 . 7 1 . . . 3 1 2 . 1 . . 2 . . . . 3 6 . 7 1 1 6 . . 2 . 1 1 1 9 7 6 9 . . . . . m 3 . . 3 3 1 . . 10 7 1 1 4 1 1 2 1 10 8 . . . . 2 5 . . 1 . 9 10 6 4 . . . . 2 1 . 3 . n 3 . . 6 4 1 . 5 7 9 . 1 3 2 1 1 1 9 12 . . . 1 2 7 1 1 2 2 12 8 7 6 . . . . 2 . 3 . . k 0 . . 2 1 . . . . . . . 3 . . . . . 1 . . . . . . . 1 . . . . . . . . . . . . . . 3 r 3 . . 7 1 1 . 6 6 4 . 1 2 2 2 2 3 7 7 1 1 5 3 6 6 3 1 1 2 8 5 8 3 . . . . 2 . 1 3 . s 2 . . 6 1 . 1 . 1 2 1 . . 3 2 1 1 4 2 4 2 2 3 4 4 2 . . . 6 4 6 1 1 . . . . 1 . . 2 U 8 . 2 8 6 5 38 3 12 12 17 6 7 7 5 4 6 7 9 3 2 2 1 14 7 1 4 3 10 14 14 15 17 . 1 . . 11 1 1 14 5 J 4 . . 4 9 3 2 2 9 7 3 4 9 2 4 3 2 3 3 . . 2 . 6 4 1 4 5 . 6 5 9 9 . . . . 9 . 1 6 3 o 0 . 1 1 1 . . . . . . . . 11 . . . . . . . . . . . . . . 2 . . . . . 2 . . 1 . . 14 . u 1 . . 2 . 1 5 . 2 1 1 2 1 1 1 . . 1 2 1 . . 1 . 1 . . 3 . 4 4 3 5 . . . . 1 . . . . W 0 . 1 1 3 . . . . . . 1 2 . . . . . . . . . 1 . 1 . . . . . . . . . . . . . . . . . X 3 . 18 1 4 . 5 . . . 4 . 1 3 12 . . 1 . . . 2 1 4 4 1 . . . . . . . . . 19 10 . 19 14 3 2 Y 4 . 15 1 7 . 4 2 . . 5 1 4 2 17 . . 1 . . . 2 2 3 5 2 . . 2 . . . . . . 20 6 . 17 18 . . f 2 . . 1 3 2 1 . 3 1 3 1 3 4 . 12 11 3 6 . . . . 1 2 . 14 12 . 2 1 2 2 . . . . 1 . 2 . 13 t 3 99 1 3 3 8 2 . 3 1 5 9 4 4 . 12 13 4 5 . . . . 1 2 . 9 17 . 1 3 2 1 . . . . 1 . 1 . 8 x 1 . . 1 2 8 1 . 1 1 1 11 1 1 . 4 3 4 4 . . . . 1 1 . 1 4 . 1 1 1 1 . . . . . . . 3 8 y 3 . . 2 2 7 1 . 2 2 2 7 3 1 . 10 12 6 6 . . . . 1 2 1 13 6 . 2 2 2 3 . . . . 1 . 1 . 3 v 2 . . 2 3 7 1 . 2 2 4 6 3 2 . 6 6 4 3 . . . . 1 1 . 6 7 . 1 1 . . . . . . 1 . . . 5 w 4 . . 3 5 11 1 2 4 4 3 11 5 3 1 12 12 10 9 . . . . 2 3 . 11 10 . 3 3 4 3 . . . . 2 1 2 . 11 z 2 . . 5 5 5 2 2 3 1 7 6 5 4 1 6 4 2 3 . . . 1 1 1 . 7 3 . 1 2 . 1 . . . . 2 . . . 3 a 1 . 1 . . . . . . . . . . . 10 . . . . . . . . . . 1 . . 2 . . . . . . 9 3 3 . . . . i 1 . 1 1 . . . . . . . . . . 6 . . . . . . . . 1 . . . . 2 . . . . . . 5 1 2 . . . . F 0 . . . . . . . 1 1 . . . . . . . . . . . . . . . . . . . . 1 . 3 . . 1 . . . . . . 4 0 . 6 . . . 1 . . . . . 1 1 . . . . . . . . . 5 . . . . 4 . . . . . 1 . . . 1 4 6 . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 Symbol entropy: 4.954 Next-symbol entropy: TT TT C O 8 E D A S T H R 2 P G q p d b m n k r s U J o u W X Y f t x y v w z a i F 4 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- J 4.434 554 . 0.016 0.080 0.350 0.134 0.112 0.016 0.167 0.218 0.097 0.080 0.238 0.061 0.294 0.252 0.071 0.105 0.105 0.029 0.029 0.016 0.029 0.173 0.282 0.041 0.041 0.097 . 0.228 0.233 0.242 0.278 0.016 . . 0.016 0.212 . 0.016 0.029 0.029 U 4.365 1155 . 0.028 0.081 0.180 0.120 0.454 0.016 0.120 0.196 0.191 0.059 0.120 0.081 0.217 0.165 0.086 0.120 0.127 0.077 0.050 0.009 0.034 0.174 0.263 0.034 0.022 0.039 0.034 0.254 0.277 0.209 0.263 0.009 0.016 . 0.009 0.153 0.016 0.009 0.034 0.022 r 4.289 431 . . 0.144 0.126 0.050 0.036 0.063 0.144 0.184 . 0.020 0.097 0.075 0.262 0.206 0.097 0.238 0.206 0.063 0.063 0.036 0.135 0.191 0.439 0.184 0.020 0.036 0.020 0.323 0.256 0.262 0.169 . . 0.020 . 0.086 . 0.020 0.020 . G 4.239 1238 . 0.015 0.065 0.323 0.305 0.243 0.008 0.089 0.092 0.234 0.145 0.251 0.092 0.117 0.447 0.209 0.166 0.160 0.008 . 0.008 0.015 0.077 0.216 . 0.061 0.171 . 0.151 0.168 0.073 0.077 0.008 . . . 0.100 0.015 0.021 0.008 0.096 s 4.239 305 . . 0.173 0.150 0.048 0.066 . 0.066 0.138 0.066 . 0.027 0.125 0.274 0.150 0.048 0.223 0.111 0.241 0.184 0.027 0.194 0.173 0.428 0.173 . . . 0.323 0.303 0.258 0.097 0.048 0.027 . 0.048 . 0.027 . . 0.027 z 4.217 305 . 0.027 0.150 0.341 0.266 0.173 0.027 0.111 0.082 0.258 0.162 0.258 0.150 0.173 0.464 0.184 0.138 0.162 . . . 0.066 0.048 0.184 . 0.097 0.111 . 0.111 0.150 0.027 0.111 . . . 0.027 0.111 . . . 0.048 R 4.183 179 . . 0.123 0.072 0.099 . 0.072 0.099 0.123 0.072 0.042 0.072 0.099 0.217 0.072 . 0.042 0.072 0.343 0.261 0.099 0.200 0.233 0.397 0.300 . 0.042 . 0.233 0.343 0.183 0.200 . . . . 0.072 . . . . w 4.169 558 . 0.016 0.061 0.255 0.315 0.088 0.016 0.096 0.140 0.096 0.166 0.160 0.079 0.126 0.485 0.241 0.251 0.217 . 0.016 . 0.016 0.070 0.232 . 0.088 0.166 . 0.147 0.147 0.147 0.126 . . . . 0.079 0.016 0.029 . 0.079 E 4.164 452 . 0.020 0.171 0.163 0.083 0.351 . 0.122 0.231 0.103 0.093 0.122 0.060 0.155 0.103 0.020 0.048 0.048 0.048 0.035 0.035 0.072 0.185 0.314 0.072 . . 0.020 0.281 0.370 0.265 0.383 . 0.020 . . 0.139 . . 0.035 . u 4.071 192 . 0.040 0.094 0.040 0.094 0.425 . 0.116 0.137 0.116 0.116 0.094 0.094 0.207 0.094 . 0.094 0.156 0.116 0.069 . 0.094 0.040 0.236 0.069 . 0.137 . 0.358 0.383 0.236 0.349 . . . . 0.069 . . . . n 4.060 483 . 0.018 0.124 0.238 0.057 . 0.046 0.148 0.284 0.018 0.018 0.116 0.068 0.124 0.148 0.046 0.269 0.274 0.018 0.018 . 0.046 0.089 0.422 0.046 0.018 0.057 0.018 0.371 0.327 0.233 0.244 . 0.018 . . 0.079 . 0.057 . . H 4.044 287 . 0.169 . . 0.028 0.028 . 0.028 0.232 . . 0.028 . 0.386 . . 0.028 0.050 0.169 0.223 0.028 0.232 0.144 0.292 0.299 . . 0.131 0.102 0.144 0.102 0.180 0.180 0.202 0.180 0.427 0.028 . . . . m 4.007 416 . 0.021 0.077 0.217 0.064 0.037 . 0.224 0.274 0.037 0.021 0.173 0.051 0.148 0.196 0.064 0.300 0.231 . . . 0.037 0.077 0.386 0.037 . 0.021 . 0.347 0.400 0.224 0.196 . . . . 0.088 0.037 . 0.021 . t 3.986 461 0.019 0.047 0.071 0.222 0.287 0.129 . 0.082 0.071 0.153 0.168 0.168 0.111 0.047 0.515 0.282 0.161 0.161 0.034 . . 0.019 0.059 0.209 0.034 0.082 0.272 . 0.092 0.190 0.082 0.082 . . . . 0.047 . 0.019 . 0.071 x 3.971 218 . . 0.062 0.254 0.424 0.085 . 0.062 0.143 0.106 0.307 0.106 0.062 0.062 0.449 0.190 0.243 0.243 0.036 . . . 0.106 0.277 . 0.036 0.159 . 0.085 0.125 0.106 0.085 . . . . . . . 0.036 0.125 v 3.963 271 . . 0.072 0.269 0.370 0.122 . 0.090 0.136 0.188 0.188 0.176 0.106 0.106 0.492 0.241 0.210 0.150 . . . . 0.090 0.241 . 0.090 0.210 . 0.122 0.122 0.030 . . . . . 0.072 . . . 0.072 C 3.957 234 . . 0.059 0.440 0.081 0.410 0.059 0.136 0.151 0.254 0.119 0.321 0.136 . 0.059 . . . 0.034 0.059 . 0.136 0.136 0.359 0.100 . 0.034 . 0.081 0.059 . 0.081 0.194 0.265 . . . 0.081 0.059 0.059 . A 3.923 62 . . 0.255 0.404 0.326 0.211 . 0.160 0.096 0.160 . 0.381 0.160 0.293 0.096 . 0.096 . . . . . . 0.255 0.096 0.096 . . . 0.160 0.096 . . . . . 0.326 0.096 0.160 . . O 3.916 180 . 0.098 0.122 0.299 0.042 0.042 . 0.042 0.042 . . 0.287 0.500 0.332 0.216 . 0.122 . . 0.042 . . 0.042 0.182 . 0.098 0.042 . 0.216 0.216 0.072 0.122 0.072 0.098 . 0.042 0.246 . 0.042 0.200 0.042 D 3.904 570 . 0.187 0.040 0.016 0.050 . 0.050 0.050 0.124 . 0.040 . . 0.402 . . . 0.029 0.247 0.380 0.069 0.219 0.086 0.157 0.181 . . 0.094 0.078 0.086 0.029 0.078 0.315 0.366 0.164 0.366 . . . . . d 3.896 355 . 0.218 0.024 0.024 0.024 . 0.112 0.024 0.099 . . . . 0.276 . . . 0.024 0.335 0.382 0.042 0.263 0.042 0.175 0.301 . . 0.134 0.073 0.112 0.058 0.042 0.202 0.350 0.175 0.386 . . . . . 2 3.875 372 . 0.023 0.140 0.041 0.041 0.070 0.056 0.056 0.084 0.096 0.023 0.084 0.041 0.150 0.070 0.023 0.150 0.084 0.385 0.310 0.023 0.293 0.219 0.497 0.321 . . . 0.160 0.119 0.096 0.096 . . 0.023 . 0.056 0.023 0.023 . . 8 3.873 691 . 0.014 0.014 0.051 0.131 0.074 0.082 0.074 0.114 0.043 0.024 0.051 . . 0.143 0.024 0.067 0.059 0.400 0.291 0.095 0.446 0.148 0.309 0.446 0.024 0.043 . 0.108 0.114 0.168 0.108 0.043 0.043 0.034 0.034 0.024 . . 0.014 0.014 y 3.872 378 . . 0.069 0.201 0.313 0.083 . 0.083 0.107 0.083 0.167 0.148 0.055 0.083 0.520 0.302 0.224 0.201 . . . . 0.040 0.224 0.055 0.128 0.148 . 0.118 0.148 0.095 0.158 . . . . 0.055 . 0.023 . 0.040 b 3.862 301 . 0.225 0.027 0.027 0.027 . 0.048 0.066 0.126 . 0.027 . . 0.276 . . . . 0.196 0.319 . 0.325 0.066 0.216 0.338 . . 0.027 0.048 0.083 0.098 0.083 0.252 0.298 0.225 0.438 . . . . . p 3.753 271 . 0.176 . 0.030 0.030 . 0.072 0.052 0.122 . 0.052 . . 0.345 . . . . 0.231 0.310 0.030 0.260 0.030 0.150 0.358 . . 0.090 0.052 0.072 0.052 0.090 0.136 0.417 0.163 0.434 . . . . . P 3.673 216 . 0.063 0.126 0.086 . . . 0.176 0.336 . . . . 0.232 . . 0.086 0.036 0.063 0.036 . 0.126 0.126 0.446 0.160 . . . 0.160 0.344 0.205 0.479 0.036 0.036 0.126 0.107 0.086 . . . . f 3.658 359 . . 0.042 0.216 0.122 0.058 . 0.099 0.072 0.133 0.024 0.144 0.122 0.086 0.531 0.305 0.154 0.208 . . . 0.024 0.042 0.224 . 0.144 0.261 . 0.133 0.099 0.099 0.111 . . . . 0.042 . 0.042 . 0.122 q 3.648 1081 . 0.157 0.047 . 0.042 . 0.086 0.009 0.098 . . . . 0.251 . . 0.009 . 0.288 0.404 0.030 0.211 0.030 0.122 0.355 . . 0.052 0.017 0.036 0.047 0.047 0.293 0.401 0.191 0.416 0.009 . . . . T 3.644 400 . . 0.079 0.186 0.161 0.194 . 0.038 0.022 0.113 0.066 0.091 0.152 0.417 . . 0.053 0.038 . 0.022 0.066 0.113 0.123 0.286 0.169 . . . 0.022 . . . . . . . 0.467 0.429 0.286 0.053 . S 3.609 212 . . 0.063 0.127 0.127 0.146 0.036 . 0.036 0.146 0.036 0.036 . 0.386 0.036 . 0.146 . 0.036 0.036 0.036 0.208 0.108 0.371 0.193 . 0.036 . . 0.063 . . . . . . 0.434 0.449 0.312 . . o 3.577 69 . 0.148 0.089 0.306 . . . . 0.148 . . . 0.528 0.089 0.238 . 0.089 . 0.089 . . 0.089 0.089 0.238 0.089 . . 0.089 0.089 0.089 0.089 0.089 0.089 0.306 . . 0.238 . . 0.274 . 4 3.512 63 . 0.470 . . . 0.290 . . . 0.095 . 0.158 0.158 0.253 . 0.095 . . . . . 0.095 0.502 . 0.158 . . 0.158 . . 0.095 . 0.095 0.158 0.095 0.095 . 0.095 0.290 0.158 . X 3.384 507 . 0.298 0.032 0.247 0.018 0.225 . . . 0.120 . 0.044 0.076 0.520 . . 0.044 . . . 0.018 0.066 0.136 0.302 0.094 . . . . . . . . . 0.333 0.354 . 0.266 0.157 0.018 0.018 k 3.365 44 . . 0.264 0.447 . . . . . . . 0.511 0.124 0.264 0.357 0.124 0.124 0.203 . . . . . 0.124 . 0.124 . . 0.124 0.124 0.124 0.124 . . . . . . . . 0.203 Y 3.349 592 . 0.246 0.016 0.305 . 0.187 0.016 . 0.028 0.128 0.028 0.128 0.058 0.530 . . 0.039 . . 0.016 0.016 0.084 0.099 0.325 0.107 . . 0.016 0.016 . . . 0.016 . 0.318 0.232 . 0.228 0.171 . . F 2.754 36 . . . 0.144 . . . 0.232 0.396 . . . . . . . . . 0.144 . . . . 0.299 0.144 . . . . 0.352 . 0.526 0.144 . 0.232 . 0.144 . . . . W 2.728 52 . 0.237 0.110 0.515 0.110 0.110 . . 0.110 0.110 0.181 0.359 . . . . . . . . . 0.237 0.110 0.359 0.181 . . . . . . . . . . . . . . . . i 1.956 114 . 0.102 0.060 . . . . . . . . 0.060 . 0.412 . . 0.060 . . . . 0.060 0.102 0.060 0.102 . . 0.060 . . . . . . 0.385 0.269 0.224 . . . . a 1.850 186 . 0.070 . 0.041 . . . . 0.041 . . . . 0.408 . . . . . 0.041 . . 0.041 0.041 0.119 . . 0.041 0.041 0.041 . . . . 0.381 0.336 0.211 . . . . 0.000 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 3.913 14851 0.001 0.094 0.077 0.206 0.153 0.181 0.033 0.088 0.140 0.110 0.077 0.133 0.089 0.299 0.275 0.105 0.129 0.114 0.144 0.161 0.025 0.148 0.115 0.287 0.177 0.036 0.081 0.029 0.166 0.185 0.130 0.156 0.089 0.135 0.105 0.178 0.115 0.079 0.054 0.021 0.033 Wow! I guess we are done. So here is the proposed mapping: 1. Map Latin to CondensedLatin: " et " --> " + " " non " --> " - " "que " --> "G" "vit " --> "J" "unt " --> "W" "ex " --> "X" "it " --> "I" "am " --> "H" "em " --> "M" "um " --> "U" "is " --> "Z" "us " --> "C" "e " --> "E" "d " --> "D" "t " --> "T" "s " --> "S" "n " --> "N" "ver" --> "V" "er" --> "R" "in" --> "Y" "qu" --> "Q" "on" --> "O" "i" --> "i" "a" --> "a" "u" --> "u" "e" --> "e" "o" --> "o" "n" --> "n" "r" --> "r" "p" --> "p" "c" --> "c" "l" --> "l" "g" --> "g" "b" --> "b" "s" --> "s" "h" --> "h" "d" --> "d" "t" --> "t" "m" --> "m" "f" --> "f" "v" --> "v" "x" --> "x" "z" --> "z" 2. Discard all spaces. 3. Map CondensedLatin to CondensedVoynichese, matching frequancies as well as possible: CLat CVoy ------- ------- i 608 G 1238 a 524 U 1155 e 400 q 1081 o 349 8 691 s 296 Y 592 t 291 D 570 r 242 w 558 u 236 J 554 d 229 X 507 c 212 n 483 m 190 t 461 n 187 E 452 l 174 r 431 + 124 m 416 R 121 T 400 E 118 y 378 p 118 2 372 b 108 f 359 g 103 d 355 S 96 s 305 v 92 z 305 U 85 b 301 Y 85 H 287 h 82 p 271 C 77 v 271 T 71 C 234 f 70 x 218 N 69 P 216 Q 64 S 212 O 61 u 192 M 53 a 186 I 52 O 180 H 46 R 179 Z 46 i 114 D 38 o 69 G 34 4 63 x 28 A 62 J 24 W 52 X 21 k 44 V 17 F 36 W 17 - 12 z 2 K 13 (I have ignored the " non " and "unt " abbreviations, and assigned "z" to "K" which I had discarded in the analysis.) 4. Map CondensedVoynichese to Voynichese "q" --> "4OD" "p" --> "4OH" "d" --> "OD" "b" --> "OH" "m" --> "AM" "n" --> "AN" "k" --> "AK" "r" --> "AR" "s" --> "OR" "U" --> "OE" "J" --> "AE" "o" --> "4O" "u" --> "4OE "f" --> "SC8G" "t" --> "TC8G" "X" --> "SC" "Y" --> "TC" "x" --> "CCG" "y" --> "CC8G" "v" --> "CG" "w" --> "C8G" "z" --> "8G" "W" --> "CC" "a" --> "DZ" "i" --> "HZ" "C" --> "C" "O" --> "O" "8" --> "8" "E" --> "E" "D" --> "D" "A" --> "A" "S" --> "S" "T" --> "T" "H" --> "H" "R" --> "R" "2" --> "2" "P" --> "P" "G" --> "G" 5. Insert spaces according to these frequencies: After "M" "N" "K" "G": always After "R": 67% After "AE": 40% After "OE": 60% Before "4": always Before "O" if not preceded by "4" "C" "T" "S" "D" "H" Z": 50% Or, in one step: " et " --> "AM" "que " --> "4" "vit " --> "CC" "ex " --> "AK" "it " --> "O" "am " --> "R" "em " --> "DZ" "um " --> "OH" "is " --> "HZ" "us " --> "CG" "e " --> "CC8G" "d " --> "4O" "t " --> "C" "s " --> "OR" "n " --> "P" "ver" --> "F" "er" --> "T" "in" --> "H" "qu" --> "S" "on" --> "4OE" "i" --> "G" "a" --> "OE" "u" --> "AE" "e" --> "4OD" "o" --> "8" "n" --> "E" "r" --> "C8G" "p" --> "2" "c" --> "AN" "l" --> "AR" "g" --> "OD" "b" --> "SC8G" "s" --> "TC" "h" --> "4OH" "d" --> "SC" "t" --> "D" "m" --> "TC8G" "f" --> "CCG" "v" --> "8G" "x" --> "A" "z" --> "K" [ Oops. While coding the above, found a bug in my old lat2voy. Fixed and redid the old lat2voy runs. See above... ] Wrote the rules above as a "lat2psv" script. Had to doctor a bit the result: --- lat2psv ------------------------ #! /n/gnu/bin/sed -f # Maps Latin (King James) to pseudo-Voynich (FSG) # Initially we write FSG "8" as "B", "2" as J", and "4" as "X" # to avoid confusion with dice throws: # Map abbreviations: s/ et /AM/g s/que /X/g s/vit /CC/g s/ex /AK/g s/it /O/g s/am /R/g s/em /DZG/g s/um /OHA/g s/is /HZG/g s/us /CG/g s/e /CCBG/g s/d /XO/g s/t /C/g s/s /OR/g s/n /P/g s/ver/F/g s/er/T/g s/in/HC/g s/qu/S/g s/on/XOE/g # Map single letters: s/i/G/g s/a/OE/g s/u/AE/g s/e/XODC/g s/o/B/g s/n/E/g s/r/CBG/g s/p/J/g s/c/AN/g s/l/AR/g s/g/OD/g s/b/SCBG/g s/s/TC/g s/h/XOHA/g s/d/SC/g s/t/D/g s/m/TCBG/g s/f/CCG/g s/v/BG/g s/x/A/g s/z/K/g # Discard remaining spaces: s/ //g # Insert dice throws after each character: s/^/\#\#/g s/$/\#\#\#\#\#\#\#\#/g s/\(.\)\(.\)\(.\)\(.\)\(.\)\(.\)\(.\)\(.\)/\10\24\32\46\51\65\73\87/g # Insert spaces with right probabilities: s/\([MNGK]\)\([0-7]\)/\1\2 \2/g s/R\([0-4]\)/R\1 \1/g s/A\([0-7]\)E\([0-2]\)/A\1E\2 \1/g s/O\([0-7]\)E\([0-4]\)/O\1E\2 \1/g s/X\([0-7]\)/ \1X\1/g s/\([^XCTSDHZ][0-7]\)O\([0-3]\)/ \2\1O\2/g # Hack to fix the " "-"C" digraph count: s/ \([0-7]\)C\([0-3]\)/ \1S\2C\2/g s/ \([0-7]\)C\([4-7]\)/ \1T\2C\2/g # Hack to fix the " "-"A" digraph count: s/ \([0-7]\)A\([0-2]\)/ \1B\2A\2/g s/ \([0-7]\)A\([3-6]\)/ \1O\2D\1A\2/g s/ \([0-7]\)A\([7-7]\)/ \1O\2H\1A\2/g # Remove dice throws and padding: s/\#//g s/[0-9]//g # Remove extra spaces: s/ */ /g # Translate "JXB" to "248" s/J/2/g s/X/4/g s/B/8/g ------------------------------------ Ok, let's try it: cat latn.txt \ | tr '\012' ' ' \ | lat2psv \ | fold -w 80 -s \ | sed -e 's/^ //g' -e 's/ $//g' \ > pseudo-voynich-3.fsg cat pseudo-voynich-3.fsg \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' COG8EDA4TSHRNM2ZPIKLF6' Digraph counts: TT C O G 8 E D A 4 T S H R N M 2 Z P K F ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 2997 . . 604 283 306 107 126 . 644 418 291 67 39 . . 54 . 42 1 15 C 2186 101 297 238 262 763 61 79 185 . 104 64 8 2 . . 17 . 4 . 1 O 1723 16 6 5 5 5 591 757 10 . 17 15 211 81 . . 4 . . . . G 1598 1598 . . . . . . . . . . . . . . . . . . . 8 1219 15 45 28 768 7 4 11 161 . 117 26 2 . . . 14 . 21 . . E 1083 536 75 79 52 41 40 62 85 . 40 50 4 1 . . 11 . 7 . . D 1093 83 492 41 55 20 12 25 279 . 16 . 25 . . . . 45 . . . A 984 44 13 39 28 8 263 10 7 . 31 12 3 168 212 123 3 . . 20 . 4 644 2 1 614 3 2 2 2 7 . 6 3 1 . . . 1 . . . . T 809 7 701 26 8 10 3 3 21 . 10 17 2 . . . . . . 1 . S 494 7 428 20 23 12 . . . . . . 1 3 . . . . . . . H 332 20 86 . . . . . 189 . . . . . . . . 37 . . . R 295 188 15 11 20 18 . 7 16 . 6 9 1 1 . . 3 . . . . N 212 212 . . . . . . . . . . . . . . . . . . . M 123 123 . . . . . . . . . . . . . . . . . . . 2 118 20 21 7 8 15 . 4 13 . 26 . 4 . . . . . . . . Z 82 . . . 82 . . . . . . . . . . . . . . . . P 74 3 6 9 . 10 . 6 8 . 12 6 2 . . . 11 . . . 1 K 22 22 . . . . . . . . . . . . . . . . . . . F 17 . . 2 1 2 . 1 3 . 6 1 1 . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 16105 2997 2186 1723 1598 1219 1083 1093 984 644 809 494 332 295 212 123 118 82 74 22 17 Next-symbol probability (× 99): ntrpy count C O G 8 E D A 4 T S H R N M 2 Z P K F ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 3.124 2997 . . 20 9 10 4 4 . 21 14 10 2 1 . . 2 . 1 . . C 2.933 2186 5 13 11 12 35 3 4 8 . 5 3 . . . . 1 . . . . O 1.982 1723 1 . . . . 34 43 1 . 1 1 12 5 . . . . . . . G 0.000 1598 99 . . . . . . . . . . . . . . . . . . . 8 1.949 1219 1 4 2 62 1 . 1 13 . 10 2 . . . . 1 . 2 . . E 2.668 1083 49 7 7 5 4 4 6 8 . 4 5 . . . . 1 . 1 . . D 2.403 1093 8 45 4 5 2 1 2 25 . 1 . 2 . . . . 4 . . . A 2.984 984 4 1 4 3 1 26 1 1 . 3 1 . 17 21 12 . . . 2 . 4 0.418 644 . . 94 . . . . 1 . 1 . . . . . . . . . . T 0.967 809 1 86 3 1 1 . . 3 . 1 2 . . . . . . . . . S 0.853 494 1 86 4 5 2 . . . . . . . 1 . . . . . . . H 1.564 332 6 26 . . . . . 56 . . . . . . . . 11 . . . R 2.066 295 63 5 4 7 6 . 2 5 . 2 3 . . . . 1 . . . . N 0.000 212 99 . . . . . . . . . . . . . . . . . . . M 0.000 123 99 . . . . . . . . . . . . . . . . . . . 2 2.923 118 17 18 6 7 13 . 3 11 . 22 . 3 . . . . . . . . Z 0.000 82 . . . 99 . . . . . . . . . . . . . . . . P 3.235 74 4 8 12 . 13 . 8 11 . 16 8 3 . . . 15 . . . 1 K 0.000 22 99 . . . . . . . . . . . . . . . . . . . F 2.660 17 . . 12 6 12 . 6 17 . 35 6 6 . . . . . . . . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 2.065 16105 18 13 11 10 7 7 7 6 4 5 3 2 2 1 1 1 1 0 0 0 Previous-symbol probability (× 99): TT C O G 8 E D A 4 T S H R N M 2 Z P K F -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 18 . . 35 18 25 10 11 . 99 51 58 20 13 . . 45 . 56 5 87 C 13 3 13 14 16 62 6 7 19 . 13 13 2 1 . . 14 . 5 . 6 O 11 1 . . . . 54 69 1 . 2 3 63 27 . . 3 . . . . G 10 53 . . . . . . . . . . . . . . . . . . . 8 7 . 2 2 48 1 . 1 16 . 14 5 1 . . . 12 . 28 . . E 7 18 3 5 3 3 4 6 9 . 5 10 1 . . . 9 . 9 . . D 7 3 22 2 3 2 1 2 28 . 2 . 7 . . . . 54 . . . A 6 1 1 2 2 1 24 1 1 . 4 2 1 56 99 99 3 . . 90 . 4 4 . . 35 . . . . 1 . 1 1 . . . . 1 . . . . T 5 . 32 1 . 1 . . 2 . 1 3 1 . . . . . . 5 . S 3 . 19 1 1 1 . . . . . . . 1 . . . . . . . H 2 1 4 . . . . . 19 . . . . . . . . 45 . . . R 2 6 1 1 1 1 . 1 2 . 1 2 . . . . 3 . . . . N 1 7 . . . . . . . . . . . . . . . . . . . M 1 4 . . . . . . . . . . . . . . . . . . . 2 1 1 1 . . 1 . . 1 . 3 . 1 . . . . . . . . Z 1 . . . 5 . . . . . . . . . . . . . . . . P 0 . . 1 . 1 . 1 1 . 1 1 1 . . . 9 . . . 6 K 0 1 . . . . . . . . . . . . . . . . . . . F 0 . . . . . . . . . 1 . . . . . . . . . . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 Symbol entropy: 3.635 Next-symbol entropy: ntrpy count C O G 8 E D A 4 T S H R N M 2 Z P K F ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 3.124 2997 . . 0.466 0.321 0.336 0.172 0.192 . 0.477 0.396 0.327 0.123 0.082 . . 0.104 . 0.086 0.004 0.038 C 2.933 2186 0.205 0.391 0.348 0.367 0.530 0.144 0.173 0.302 . 0.209 0.149 0.030 0.009 . . 0.054 . 0.017 . 0.005 O 1.982 1723 0.063 0.028 0.024 0.024 0.024 0.529 0.521 0.043 . 0.066 0.060 0.371 0.207 . . 0.020 . . . . G 0.000 1598 . . . . . . . . . . . . . . . . . . . . 8 1.949 1219 0.078 0.176 0.125 0.420 0.043 0.027 0.061 0.386 . 0.325 0.118 0.015 . . . 0.074 . 0.101 . . E 2.668 1083 0.502 0.267 0.276 0.210 0.179 0.176 0.236 0.288 . 0.176 0.205 0.030 0.009 . . 0.067 . 0.047 . . D 2.403 1093 0.282 0.518 0.178 0.217 0.106 0.071 0.125 0.503 . 0.089 . 0.125 . . . . 0.189 . . . A 2.984 984 0.200 0.082 0.185 0.146 0.056 0.509 0.067 0.051 . 0.157 0.078 0.025 0.435 0.477 0.375 0.025 . . 0.114 . 4 0.418 644 0.026 0.014 0.066 0.036 0.026 0.026 0.026 0.071 . 0.063 0.036 0.014 . . . 0.014 . . . . T 0.967 809 0.059 0.179 0.159 0.066 0.078 0.030 0.030 0.137 . 0.078 0.117 0.021 . . . . . . 0.012 . S 0.853 494 0.087 0.179 0.187 0.206 0.130 . . . . . . 0.018 0.045 . . . . . . . H 1.564 332 0.244 0.505 . . . . . 0.463 . . . . . . . . 0.353 . . . R 2.066 295 0.414 0.219 0.177 0.263 0.246 . 0.128 0.228 . 0.114 0.154 0.028 0.028 . . 0.067 . . . . N 0.000 212 . . . . . . . . . . . . . . . . . . . . M 0.000 123 . . . . . . . . . . . . . . . . . . . . 2 2.923 118 0.434 0.443 0.242 0.263 0.378 . 0.166 0.351 . 0.481 . 0.166 . . . . . . . . Z 0.000 82 . . . . . . . . . . . . . . . . . . . . P 3.235 74 0.187 0.294 0.370 . 0.390 . 0.294 0.347 . 0.426 0.294 0.141 . . . 0.409 . . . 0.084 K 0.000 22 . . . . . . . . . . . . . . . . . . . . F 2.660 17 . . 0.363 0.240 0.363 . 0.240 0.442 . 0.530 0.240 0.240 . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 2.065 16105 0.451 0.391 0.345 0.331 0.282 0.262 0.263 0.246 0.186 0.217 0.154 0.115 0.106 0.082 0.054 0.052 0.039 0.036 0.013 0.010 Close, but not quite it. I give up. As someone said, "the lazy guy has to work for two". I should write a program to find the right mapping... Let's go back to the un-hacked transformation, but omitting the blanks: --- lat2psv ------------------------ #! /n/gnu/bin/sed -f # Maps Latin (King James) to pseudo-Voynich (FSG) # Map abbreviations: s/ et /AM/g s/que /4/g s/vit /CC/g s/ex /AK/g s/it /O/g s/am /R/g s/em /DZ/g s/um /OH/g s/is /HZ/g s/us /CG/g s/e /CC8G/g s/d /4O/g s/t /C/g s/s /OR/g s/n /P/g s/ver/F/g s/er/T/g s/in/H/g s/qu/S/g s/on/4OE/g # Map single letters: s/i/G/g s/a/OE/g s/u/AE/g s/e/4OD/g s/o/8/g s/n/E/g s/r/C8G/g s/p/2/g s/c/AN/g s/l/AR/g s/g/OD/g s/b/SC8G/g s/s/TC/g s/h/4OH/g s/d/SC/g s/t/D/g s/m/TC8G/g s/f/CCG/g s/v/8G/g s/x/A/g s/z/K/g # Discard remaining spaces: s/ //g ------------------------------------ cat latn.txt \ | tr '\012' ' ' \ | lat2psv \ | fold -w 90 -s \ | sed -e 's/^ //g' -e 's/ $//g' \ > pseudo-voynich-3.fsg cat pseudo-voynich-3.fsg \ | tr -d '\012' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' COG8EDA4TSHRNM2ZPIKLF6' Digraph counts: TT C O G 8 E D A 4 T S H R N M 2 Z P K F ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 1 . . . . . . . . 1 . . . . . . . . . . . C 1669 . 250 120 226 744 6 35 110 91 50 19 6 1 . . 10 . . . 1 O 1452 . 6 5 5 5 600 538 10 6 17 15 159 82 . . 4 . . . . G 1516 1 120 199 170 117 24 67 208 245 145 82 47 24 . . 25 . 35 . 7 8 1112 . 45 28 768 7 4 11 54 14 117 26 2 . . . 14 . 22 . . E 1083 . 151 122 69 64 83 100 169 59 90 124 8 3 . . 23 . 13 . 5 D 874 . 87 141 81 34 74 61 129 79 66 39 27 3 . . 4 45 4 . . A 827 . . 9 6 . 269 2 1 . 10 1 . 174 212 123 . . . 20 . 4 644 . 1 614 3 2 2 2 7 2 6 3 1 . . . 1 . . . . T 661 . 553 26 8 11 4 3 21 5 10 17 2 . . . . . . 1 . S 408 . 342 20 23 14 . . . 5 . . 1 3 . . . . . . . H 280 . 34 48 32 16 5 16 12 27 25 17 3 . . . 8 37 . . . R 295 . 30 38 55 48 1 15 31 29 16 20 4 5 . . 3 . . . . N 212 . 8 40 37 12 . 5 34 47 23 . 4 . . . . . . . 2 M 123 . 10 16 14 7 9 1 12 6 18 15 9 . . . 6 . . . . 2 118 . 21 7 8 15 . 4 13 20 26 . 4 . . . . . . . . Z 82 . 5 6 6 3 2 6 4 4 20 17 . . . . 8 . . 1 . P 74 . 6 9 . 10 . 6 8 3 12 6 2 . . . 11 . . . 1 K 22 . . 2 4 1 . 1 1 1 4 6 . . . . 1 . . . 1 F 17 . . 2 1 2 . 1 3 . 6 1 1 . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 11470 1 1669 1452 1516 1112 1083 874 827 644 661 408 280 295 212 123 118 82 74 22 17 Next-symbol probability (× 99): TT TT TT C O G 8 E D A 4 T S H R N M 2 Z P K F ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- D 3.503 874 99 . 10 16 9 4 8 7 15 9 7 4 3 . . . . 5 . . . G 3.493 1516 99 . 8 13 11 8 2 4 14 16 9 5 3 2 . . 2 . 2 . . E 3.456 1083 99 . 14 11 6 6 8 9 15 5 8 11 1 . . . 2 . 1 . . H 3.418 280 99 . 12 17 11 6 2 6 4 10 9 6 1 . . . 3 13 . . . M 3.406 123 99 . 8 13 11 6 7 1 10 5 14 12 7 . . . 5 . . . . R 3.254 295 99 . 10 13 18 16 . 5 10 10 5 7 1 2 . . 1 . . . . P 3.235 74 99 . 8 12 . 13 . 8 11 4 16 8 3 . . . 15 . . . 1 Z 3.177 82 99 . 6 7 7 4 2 7 5 5 24 21 . . . . 10 . . 1 . K 2.936 22 99 . . 9 18 5 . 5 5 5 18 27 . . . . 5 . . . 5 2 2.923 118 99 . 18 6 7 13 . 3 11 17 22 . 3 . . . . . . . . N 2.858 212 99 . 4 19 17 6 . 2 16 22 11 . 2 . . . . . . . 1 F 2.660 17 99 . . 12 6 12 . 6 17 . 35 6 6 . . . . . . . . C 2.538 1669 99 . 15 7 13 44 . 2 7 5 3 1 . . . . 1 . . . . A 2.286 827 99 . . 1 1 . 32 . . . 1 . . 21 25 15 . . . 2 . O 2.007 1452 99 . . . . . 41 37 1 . 1 1 11 6 . . . . . . . 8 1.799 1112 99 . 4 2 68 1 . 1 5 1 10 2 . . . . 1 . 2 . . T 1.132 661 99 . 83 4 1 2 1 . 3 1 1 3 . . . . . . . . . S 0.979 408 99 . 83 5 6 3 . . . 1 . . . 1 . . . . . . . 4 0.418 644 99 . . 94 . . . . 1 . 1 . . . . . . . . . . 0.000 1 99 . . . . . . . . 99 . . . . . . . . . . . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 2.481 11470 99 0 14 13 13 10 9 8 7 6 6 4 2 3 2 1 1 1 1 0 0 Previous-symbol probability (× 99): TT C O G 8 E D A 4 T S H R N M 2 Z P K F -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 0 . . . . . . . . . . . . . . . . . . . . C 14 . 15 8 15 66 1 4 13 14 7 5 2 . . . 8 . . . 6 O 13 . . . . . 55 61 1 1 3 4 56 28 . . 3 . . . . G 13 99 7 14 11 10 2 8 25 38 22 20 17 8 . . 21 . 47 . 41 8 10 . 3 2 50 1 . 1 6 2 18 6 1 . . . 12 . 29 . . E 9 . 9 8 5 6 8 11 20 9 13 30 3 1 . . 19 . 17 . 29 D 8 . 5 10 5 3 7 7 15 12 10 9 10 1 . . 3 54 5 . . A 7 . . 1 . . 25 . . . 1 . . 58 99 99 . . . 90 . 4 6 . . 42 . . . . 1 . 1 1 . . . . 1 . . . . T 6 . 33 2 1 1 . . 3 1 1 4 1 . . . . . . 5 . S 4 . 20 1 2 1 . . . 1 . . . 1 . . . . . . . H 2 . 2 3 2 1 . 2 1 4 4 4 1 . . . 7 45 . . . R 3 . 2 3 4 4 . 2 4 4 2 5 1 2 . . 3 . . . . N 2 . . 3 2 1 . 1 4 7 3 . 1 . . . . . . . 12 M 1 . 1 1 1 1 1 . 1 1 3 4 3 . . . 5 . . . . 2 1 . 1 . 1 1 . . 2 3 4 . 1 . . . . . . . . Z 1 . . . . . . 1 . 1 3 4 . . . . 7 . . 5 . P 1 . . 1 . 1 . 1 1 . 2 1 1 . . . 9 . . . 6 K 0 . . . . . . . . . 1 1 . . . . 1 . . . 6 F 0 . . . . . . . . . 1 . . . . . . . . . . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 Symbol entropy: 3.656 Next-symbol entropy: TT TT C O G 8 E D A 4 T S H R N M 2 Z P K F ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- D 3.503 874 . 0.331 0.425 0.318 0.182 0.302 0.268 0.407 0.313 0.281 0.200 0.155 0.028 . . 0.036 0.220 0.036 . . G 3.493 1516 0.007 0.290 0.385 0.354 0.285 0.095 0.199 0.393 0.425 0.324 0.228 0.155 0.095 . . 0.098 . 0.126 . 0.036 E 3.456 1083 . 0.396 0.355 0.253 0.241 0.284 0.317 0.418 0.229 0.298 0.358 0.052 0.024 . . 0.118 . 0.077 . 0.036 H 3.418 280 . 0.369 0.436 0.358 0.236 0.104 0.236 0.195 0.325 0.311 0.245 0.070 . . . 0.147 0.386 . . . M 3.406 123 . 0.294 0.383 0.357 0.235 0.276 0.056 0.328 0.213 0.406 0.370 0.276 . . . 0.213 . . . . R 3.254 295 . 0.335 0.381 0.452 0.426 0.028 0.219 0.342 0.329 0.228 0.263 0.084 0.100 . . 0.067 . . . . P 3.235 74 . 0.294 0.370 . 0.390 . 0.294 0.347 0.187 0.426 0.294 0.141 . . . 0.409 . . . 0.084 Z 3.177 82 . 0.246 0.276 0.276 0.175 0.131 0.276 0.213 0.213 0.496 0.471 . . . . 0.328 . . 0.078 . K 2.936 22 . . 0.314 0.447 0.203 . 0.203 0.203 0.203 0.447 0.511 . . . . 0.203 . . . 0.203 2 2.923 118 . 0.443 0.242 0.263 0.378 . 0.166 0.351 0.434 0.481 . 0.166 . . . . . . . . N 2.858 212 . 0.178 0.454 0.440 0.235 . 0.127 0.423 0.482 0.348 . 0.108 . . . . . . . 0.063 F 2.660 17 . . 0.363 0.240 0.363 . 0.240 0.442 . 0.530 0.240 0.240 . . . . . . . . C 2.538 1669 . 0.410 0.273 0.391 0.520 0.029 0.117 0.259 0.229 0.152 0.074 0.029 0.006 . . 0.044 . . . 0.006 A 2.286 827 . . 0.071 0.052 . 0.527 0.021 0.012 . 0.077 0.012 . 0.473 0.503 0.409 . . . 0.130 . O 2.007 1452 . 0.033 0.028 0.028 0.028 0.527 0.531 0.049 0.033 0.075 0.068 0.349 0.234 . . 0.023 . . . . 8 1.799 1112 . 0.187 0.134 0.369 0.046 0.029 0.066 0.212 0.079 0.342 0.127 0.016 . . . 0.079 . 0.112 . . T 1.132 661 . 0.215 0.184 0.077 0.098 0.045 0.035 0.158 0.053 0.091 0.136 0.025 . . . . . . 0.014 . S 0.979 408 . 0.213 0.213 0.234 0.167 . . . 0.078 . . 0.021 0.052 . . . . . . . 4 0.418 644 . 0.014 0.066 0.036 0.026 0.026 0.026 0.071 0.026 0.063 0.036 0.014 . . . 0.014 . . . . 0.000 1 . . . . . . . . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 2.481 11470 0.001 0.405 0.377 0.386 0.326 0.321 0.283 0.274 0.233 0.237 0.171 0.131 0.136 0.106 0.070 0.068 0.051 0.047 0.017 0.014 Comparison with spaceless Voynichese: cat .tmp-c-fsg.txt \ | sed \ -e 's/\/\///g' \ -e 's/\*//g' \ -e's/=//g' \ | /n/gnu/bin/tr '\012' ' ' \ | /n/gnu/bin/sed \ -e 's/CM/AN/g' \ -e 's/CI/A/g' \ -e 's/IL/N/g' \ -e 's/IN/M/g' \ -e 's/6/8/g' \ -e 's/I*\([MNRK]\)/\1/g' \ -e 's/A /G /g' \ | fold -w 90 -s \ | /n/gnu/bin/sed \ -e 's/^ *//g' -e 's/ *$//g' -e 's/ */ /g' \ > .voyn.fsg cat .voyn.fsg \ | tr -d ' \012' \ | fold -w 90 \ > .voyn.fss cat .voyn.fss \ | tr -d ' \012' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' COG8EDA4TSHRNM2ZPIKLF6' Digraph counts: TT C O G 8 E D A 4 T S H R N M 2 Z P I K L F ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 1 . . . . . . . . . . . . . . . . . . . . . 1 C 4278 . 953 175 845 1903 4 157 56 4 15 9 80 9 1 . 45 . 17 . . 2 3 O 3909 . 19 12 17 35 1347 1436 4 15 10 10 572 303 7 14 10 . 68 9 7 1 13 G 3788 1 9 583 70 323 323 124 22 1378 244 202 151 124 . . 166 . 62 1 1 2 2 8 2752 . 15 94 2061 7 16 8 423 28 41 45 4 2 . . 5 . . 1 . 1 1 E 2353 . 20 381 126 197 47 312 74 139 503 348 71 28 . . 69 . 27 . 2 . 9 D 2192 . 869 82 171 3 11 . 749 . 72 31 . 1 . 1 . 199 . 3 . . . A 1990 . . 6 4 15 554 4 1 . . 1 4 399 483 401 7 . 2 54 43 12 . 4 1676 . 20 1629 4 . . 6 3 1 . 1 6 . . . 2 . 2 . . . 2 T 1453 . 1053 50 62 97 13 83 27 . 1 3 39 4 . . 6 . 12 . . . 3 S 1078 . 866 38 28 41 5 45 23 2 3 . 25 1 . . 1 . . . . . . H 973 . 341 60 88 3 3 1 261 . 62 27 . 1 . . 1 121 . 4 . . . R 915 . 7 286 60 29 7 6 156 45 129 154 6 2 . . 10 . 15 2 . . 1 N 491 . 3 167 11 34 4 . 11 22 115 103 5 1 . . 10 . 5 . . . . M 440 . 1 132 14 27 3 5 4 25 115 91 2 1 . . 15 . 3 1 . . 1 2 372 . 2 136 11 5 2 5 151 5 19 21 7 . . . 5 . 2 1 . . . Z 345 . 95 11 204 21 . . 10 . 2 1 . . . . 1 . . . . . . P 216 . 4 51 7 3 . . 13 . 92 25 . . . . . 21 . . . . . I 92 . . . . . 9 . . . . . . 39 . 24 . . . 16 4 . . K 57 . . 9 3 9 2 . . 10 2 2 1 . . . 18 . 1 . . . . L 18 . . 4 2 . 3 . . 2 4 2 . . . . 1 . . . . . . F 36 . 1 3 . . . . 2 . 24 2 . . . . . 4 . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 29425 1 4278 3909 3788 2752 2353 2192 1990 1676 1453 1078 973 915 491 440 372 345 216 92 57 18 36 Next-symbol probability (× 99): TT C Z O G 8 E D A 4 T S H R N M 2 P I K L F -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 99 . . . . . . . . . . . . . . . . . . . . . 99 D 99 . 39 9 4 8 . . . 34 . 3 1 . . . . . . . . . . H 99 . 35 12 6 9 . . . 27 . 6 3 . . . . . . . . . . P 99 . 2 10 23 3 1 . . 6 . 42 11 . . . . . . . . . . F 99 . 3 11 8 . . . . 6 . 66 6 . . . . . . . . . . T 99 . 72 . 3 4 7 1 6 2 . . . 3 . . . . 1 . . . . S 99 . 80 . 3 3 4 . 4 2 . . . 2 . . . . . . . . . Z 99 . 27 . 3 59 6 . . 3 . 1 . . . . . . . . . . . C 99 . 22 . 4 20 44 . 4 1 . . . 2 . . . 1 . . . . . 2 99 . 1 . 36 3 1 1 1 40 1 5 6 2 . . . 1 1 . . . . R 99 . 1 . 31 6 3 1 1 17 5 14 17 1 . . . 1 2 . . . . N 99 . 1 . 34 2 7 1 . 2 4 23 21 1 . . . 2 1 . . . . M 99 . . . 30 3 6 1 1 1 6 26 20 . . . . 3 1 . . . . K 99 . . . 16 5 16 3 . . 17 3 3 2 . . . 31 2 . . . . L 99 . . . 22 11 . 17 . . 11 22 11 . . . . 6 . . . . . G 99 . . . 15 2 8 8 3 1 36 6 5 4 3 . . 4 2 . . . . O 99 . . . . . 1 34 36 . . . . 14 8 . . . 2 . . . . A 99 . . . . . 1 28 . . . . . . 20 24 20 . . 3 2 1 . 8 99 . 1 . 3 74 . 1 . 15 1 1 2 . . . . . . . . . . E 99 . 1 . 16 5 8 2 13 3 6 21 15 3 1 . . 3 1 . . . . 4 99 . 1 . 96 . . . . . . . . . . . . . . . . . . I 99 . . . . . . 10 . . . . . . 42 . 26 . . 17 4 . . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 0 14 1 13 13 9 8 7 7 6 5 4 3 3 2 1 1 1 0 0 0 0 Previous-symbol probability (× 99): TT C O G 8 E D A 4 T S H R N M 2 Z P I K L F -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 0 . . . . . . . . . . . . . . . . . . . . . 3 C 14 . 22 4 22 68 . 7 3 . 1 1 8 1 . . 12 . 8 . . 11 8 O 13 . . . . 1 57 65 . 1 1 1 58 33 1 3 3 . 31 10 12 6 36 G 13 99 . 15 2 12 14 6 1 81 17 19 15 13 . . 44 . 28 1 2 11 6 8 9 . . 2 54 . 1 . 21 2 3 4 . . . . 1 . . 1 . 6 3 E 8 . . 10 3 7 2 14 4 8 34 32 7 3 . . 18 . 12 . 3 . 25 D 7 . 20 2 4 . . . 37 . 5 3 . . . . . 57 . 3 . . . A 7 . . . . 1 23 . . . . . . 43 97 90 2 . 1 58 75 66 . 4 6 . . 41 . . . . . . . . 1 . . . 1 . 1 . . . 6 T 5 . 24 1 2 3 1 4 1 . . . 4 . . . 2 . 6 . . . 8 S 4 . 20 1 1 1 . 2 1 . . . 3 . . . . . . . . . . H 3 . 8 2 2 . . . 13 . 4 2 . . . . . 35 . 4 . . . R 3 . . 7 2 1 . . 8 3 9 14 1 . . . 3 . 7 2 . . 3 N 2 . . 4 . 1 . . 1 1 8 9 1 . . . 3 . 2 . . . . M 1 . . 3 . 1 . . . 1 8 8 . . . . 4 . 1 1 . . 3 2 1 . . 3 . . . . 8 . 1 2 1 . . . 1 . 1 1 . . . Z 1 . 2 . 5 1 . . . . . . . . . . . . . . . . . P 1 . . 1 . . . . 1 . 6 2 . . . . . 6 . . . . . I 0 . . . . . . . . . . . . 4 . 5 . . . 17 7 . . K 0 . . . . . . . . 1 . . . . . . 5 . . . . . . L 0 . . . . . . . . . . . . . . . . . . . . . . F 0 . . . . . . . . . 2 . . . . . . 1 . . . . . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 Symbol entropy: 3.727 Next-symbol entropy: TT C O G 8 E D A 4 T S H R N M 2 Z P I K L F ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- E 3.282 . 0.058 0.425 0.226 0.300 0.113 0.387 0.157 0.241 0.476 0.408 0.152 0.076 . . 0.149 . 0.074 . 0.009 . 0.031 G 3.027 0.003 0.021 0.416 0.106 0.303 0.303 0.161 0.043 0.531 0.255 0.226 0.185 0.161 . . 0.198 . 0.097 0.003 0.003 0.006 0.006 R 2.841 . 0.054 0.524 0.258 0.158 0.054 0.048 0.435 0.214 0.398 0.433 0.048 0.019 . . 0.071 . 0.097 0.019 . . 0.011 K 2.744 . . 0.420 0.224 0.420 0.170 . . 0.441 0.170 0.170 0.102 . . . 0.525 . 0.102 . . . . L 2.684 . . 0.482 0.352 . 0.431 . . 0.352 0.482 0.352 . . . . 0.232 . . . . . . M 2.652 . 0.020 0.521 0.158 0.247 0.049 0.073 0.062 0.235 0.506 0.470 0.035 0.020 . . 0.166 . 0.049 0.020 . . 0.020 N 2.574 . 0.045 0.529 0.123 0.267 0.057 . 0.123 0.201 0.490 0.473 0.067 0.018 . . 0.114 . 0.067 . . . . H 2.486 . 0.530 0.248 0.314 0.026 0.026 0.010 0.509 . 0.253 0.144 . 0.010 . . 0.010 0.374 . 0.033 . . . A 2.427 . . 0.025 0.018 0.053 0.514 0.018 0.006 . . 0.006 0.018 0.465 0.496 0.466 0.029 . 0.010 0.141 0.120 0.044 . P 2.300 . 0.107 0.492 0.160 0.086 . . 0.244 . 0.524 0.360 . . . . . 0.327 . . . . . 2 2.249 . 0.041 0.531 0.150 0.084 0.041 0.084 0.528 0.084 0.219 0.234 0.108 . . . 0.084 . 0.041 0.023 . . . O 2.231 . 0.037 0.026 0.034 0.061 0.530 0.531 0.010 0.031 0.022 0.022 0.406 0.286 0.016 0.029 0.022 . 0.102 0.020 0.016 0.003 0.027 C 2.218 . 0.483 0.189 0.462 0.520 0.009 0.175 0.082 0.009 0.029 0.019 0.107 0.019 0.003 . 0.069 . 0.032 . . 0.005 0.007 D 2.160 . 0.529 0.177 0.287 0.013 0.038 . 0.529 . 0.162 0.087 . 0.005 . 0.005 . 0.314 . 0.013 . . . I 1.994 . . . . . 0.328 . . . . . . 0.525 . 0.506 . . . 0.439 0.197 . . T 1.660 . 0.337 0.167 0.194 0.261 0.061 0.236 0.107 . 0.007 0.018 0.140 0.023 . . 0.033 . 0.057 . . . 0.018 F 1.648 . 0.144 0.299 . . . . 0.232 . 0.390 0.232 . . . . . 0.352 . . . . . Z 1.605 . 0.512 0.158 0.448 0.246 . . 0.148 . 0.043 0.024 . . . . 0.024 . . . . . . 8 1.330 . 0.041 0.166 0.312 0.022 0.043 0.024 0.415 0.067 0.090 0.097 0.014 0.008 . . 0.017 . . 0.004 . 0.004 0.004 S 1.271 . 0.254 0.170 0.137 0.179 0.036 0.191 0.118 0.017 0.024 . 0.126 0.009 . . 0.009 . . . . . . 4 0.259 . 0.076 0.040 0.021 . . 0.029 0.016 0.006 . 0.006 0.029 . . . 0.012 . 0.012 . . . 0.012 0.000 . . . . . . . . . . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 2.196 0.001 0.404 0.387 0.381 0.320 0.291 0.279 0.263 0.235 0.214 0.175 0.163 0.156 0.099 0.091 0.080 0.075 0.052 0.026 0.017 0.007 0.012 Summary: H1 H2 H1-H2 ----- ----- ----- Latin (lowercase, with blanks): 3.996 3.261 0.735 fake Voynichese (FSG, no blanks): 3.656 2.481 1.175 true Voynichese (FSG, no blanks): 3.727 2.196 1.531 Attempst to break at points of maximum H2 and join points of minimum H2: cat .voyn.fss \ | tr -d ' \012' \ | sed \ -e 's/\([EGKLMNR]\)/\1 /g' \ -e 's/4OE/u/g' \ -e 's/4OD/d/g' \ -e 's/4OH/h/g' \ -e 's/4O/Q/g' \ -e 's/4C/Q/g' \ -e 's/OD/U/g' \ -e 's/OH/V/g' \ -e 's/TC8G/f/g' \ -e 's/SC8G/g/g' \ -e 's/CC8G/p/g' \ -e 's/TCG/i/g' \ -e 's/SCG/j/g' \ -e 's/CCG/l/g' \ -e 's/ZCG/W/g' \ -e 's/TC/t/g' \ -e 's/SC/s/g' \ -e 's/CC8/y/g' \ -e 's/CC/c/g' \ -e 's/C8G/w/g' \ -e 's/8G/B/g' \ -e 's/ZG/J/g' \ -e 's/OE/o/g' \ -e 's/AE/e/g' \ -e 's/AM/m/g' \ -e 's/AN/n/g' \ -e 's/AR/r/g' \ -e 's/OR/x/g' \ -e 's/AK/k/g' \ -e 's/\([HDQUV28Phd]\)/\1 /g' \ -e 's/[IKML4N]//g' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' CTSfgpijldhtscEAuoemnrxykOQUVW8wBJGDHR2ZPF' Digraph counts: TT C T S f g p i j l d h t s c E A u o e m n r x y k O Q U V W 8 w B J G D H R 2 Z P F ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 12589 14 244 469 305 439 358 358 200 143 204 1066 271 293 246 26 422 58 189 952 495 413 477 386 240 20 36 158 101 338 298 53 497 436 154 204 569 474 256 181 301 84 140 21 C 334 . . 7 6 3 . 15 2 3 9 2 . . . . 3 2 1 27 4 1 1 6 6 1 . 2 . . . . 42 . . . 111 31 14 5 22 . 6 2 T 488 . . 1 2 . . 33 . . 55 . . . 1 . 13 . . 31 14 . 1 8 9 . 4 5 . 3 2 . 16 . 81 . 62 83 39 4 6 . 12 3 S 320 . . 1 . . . 57 1 . 51 1 . 1 . . 5 1 1 26 9 1 1 10 4 . 1 2 . 6 . . 5 . 36 . 28 45 25 1 1 . . . f 461 461 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . g 359 359 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p 466 466 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i 206 206 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . j 150 150 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . l 323 323 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . d 1081 1081 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . h 271 271 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . t 298 2 36 2 . . . . . . 1 . . . . 1 . 1 . 57 11 . 1 8 10 . 1 1 . 3 . . 51 . . . . 56 35 2 14 . 5 . s 249 1 42 . . . . . . . . . . . . . . . . 43 8 . . 5 13 . 1 2 . 3 . . 31 . . . . 62 27 . 3 . 6 2 c 27 . 2 1 . . . . . . . . . . . . 1 . . 6 2 . . 3 1 . . 1 . . . . . . . . . 1 1 2 6 . . . E 452 452 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A 62 12 . . 1 . . . . . . . . . . . 6 . . 2 1 . . . . . . 4 . . . . 9 . 6 . 4 4 4 . 7 . 2 . u 192 192 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 1155 1155 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 554 554 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . m 416 416 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . n 483 483 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . r 431 431 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x 289 289 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . y 23 . . . 2 1 . . . . . 5 . . . . 2 . . 2 2 . . 3 1 . 1 . 1 1 1 . . . . . . . . . 1 . . . k 44 44 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . O 180 35 3 1 2 3 1 3 . 4 2 7 . 2 1 . . . 1 2 . . 1 . 1 . . 3 3 . . . 14 1 11 . 16 . . . 10 . 45 8 Q 105 105 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . U 355 355 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . V 301 301 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . W 54 54 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 668 668 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . w 469 469 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B 306 306 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . J 204 204 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G 790 790 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . D 756 756 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H 401 401 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . R 195 195 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 372 372 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Z 87 . 6 1 . . . . 1 . 1 . . . 1 . . . . 4 7 . 1 2 4 2 . 2 . 1 . . 3 32 18 . . . . . 1 . . . P 216 216 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . F 36 . 1 5 2 15 . . 2 . . . . 2 . . . . . 3 1 1 . . . . . . . . . 1 . . . . . . . . . 3 . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 27218 12589 334 488 320 461 359 466 206 150 323 1081 271 298 249 27 452 62 192 1155 554 416 483 431 289 23 44 180 105 355 301 54 668 469 306 204 790 756 401 195 372 87 216 36 Next-symbol probability (× 99): TT TT C T S f g p i j l d h t s c E A u o e m n r x y k O Q U V W 8 w B J G D H R 2 Z P F ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 5.038 12589 . 2 4 2 3 3 3 2 1 2 8 2 2 2 . 3 . 1 7 4 3 4 3 2 . . 1 1 3 2 . 4 3 1 2 4 4 2 1 2 1 1 . T 3.657 488 . . . . . . 7 . . 11 . . . . . 3 . . 6 3 . . 2 2 . 1 1 . 1 . . 3 . 16 . 13 17 8 1 1 . 2 1 O 3.610 180 19 2 1 1 2 1 2 . 2 1 4 . 1 1 . . . 1 1 . . 1 . 1 . . 2 2 . . . 8 1 6 . 9 . . . 6 . 25 4 S 3.514 320 . . . . . . 18 . . 16 . . . . . 2 . . 8 3 . . 3 1 . . 1 . 2 . . 2 . 11 . 9 14 8 . . . . . C 3.513 334 . . 2 2 1 . 4 1 1 3 1 . . . . 1 1 . 8 1 . . 2 2 . . 1 . . . . 12 . . . 33 9 4 1 7 . 2 1 y 3.464 23 . . . 9 4 . . . . . 22 . . . . 9 . . 9 9 . . 13 4 . 4 . 4 4 4 . . . . . . . . . 4 . . . A 3.402 62 19 . . 2 . . . . . . . . . . . 10 . . 3 2 . . . . . . 6 . . . . 14 . 10 . 6 6 6 . 11 . 3 . t 3.241 298 1 12 1 . . . . . . . . . . . . . . . 19 4 . . 3 3 . . . . 1 . . 17 . . . . 19 12 1 5 . 2 . c 3.208 27 . 7 4 . . . . . . . . . . . . 4 . . 22 7 . . 11 4 . . 4 . . . . . . . . . 4 4 7 22 . . . s 3.046 249 . 17 . . . . . . . . . . . . . . . . 17 3 . . 2 5 . . 1 . 1 . . 12 . . . . 25 11 . 1 . 2 1 Z 3.029 87 . 7 1 . . . . 1 . 1 . . . 1 . . . . 5 8 . 1 2 5 2 . 2 . 1 . . 3 36 20 . . . . . 1 . . . F 2.789 36 . 3 14 6 41 . . 6 . . . . 6 . . . . . 8 3 3 . . . . . . . . . 3 . . . . . . . . . 8 . . 2 0.000 372 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 0.000 668 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B 0.000 306 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . D 0.000 756 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E 0.000 452 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G 0.000 790 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H 0.000 401 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . J 0.000 204 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . P 0.000 216 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Q 0.000 105 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . R 0.000 195 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . U 0.000 355 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . V 0.000 301 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . W 0.000 54 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . d 0.000 1081 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 0.000 554 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . f 0.000 461 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . g 0.000 359 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . h 0.000 271 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i 0.000 206 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . j 0.000 150 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . k 0.000 44 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . l 0.000 323 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . m 0.000 416 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . n 0.000 483 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 0.000 1155 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p 0.000 466 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . r 0.000 431 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . u 0.000 192 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . w 0.000 469 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x 0.000 289 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 2.595 27218 46 1 2 1 2 1 2 1 1 1 4 1 1 1 0 2 0 1 4 2 2 2 2 1 0 0 1 0 1 1 0 2 2 1 1 3 3 1 1 1 0 1 0 Symbol entropy: 3.699 Next-symbol entropy: TT TT C T S f g p i j l d h t s c E A u o e m n r x y k O Q U V W 8 w B J G D H R 2 Z P F ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 5.038 12589 0.011 0.110 0.177 0.130 0.169 0.146 0.146 0.095 0.073 0.096 0.302 0.119 0.126 0.111 0.018 0.164 0.036 0.091 0.282 0.184 0.162 0.179 0.154 0.109 0.015 0.024 0.079 0.056 0.140 0.128 0.033 0.184 0.168 0.078 0.096 0.202 0.178 0.114 0.088 0.129 0.048 0.072 0.015 T 3.657 488 . . 0.018 0.033 . . 0.263 . . 0.355 . . . 0.018 . 0.139 . . 0.253 0.147 . 0.018 0.097 0.106 . 0.057 0.068 . 0.045 0.033 . 0.162 . 0.430 . 0.378 0.435 0.291 0.057 0.078 . 0.131 0.045 O 3.610 180 0.459 0.098 0.042 0.072 0.098 0.042 0.098 . 0.122 0.072 0.182 . 0.072 0.042 . . . 0.042 0.072 . . 0.042 . 0.042 . . 0.098 0.098 . . . 0.287 0.042 0.246 . 0.310 . . . 0.232 . 0.500 0.200 S 3.514 320 . . 0.026 . . . 0.443 0.026 . 0.422 0.026 . 0.026 . . 0.094 0.026 0.026 0.294 0.145 0.026 0.026 0.156 0.079 . 0.026 0.046 . 0.108 . . 0.094 . 0.355 . 0.308 0.398 0.287 0.026 0.026 . . . C 3.513 334 . . 0.117 0.104 0.061 . 0.201 0.044 0.061 0.140 0.044 . . . . 0.061 0.044 0.025 0.293 0.076 0.025 0.025 0.104 0.104 0.025 . 0.044 . . . . 0.376 . . . 0.528 0.318 0.192 0.091 0.258 . 0.104 0.044 y 3.464 23 . . . 0.306 0.197 . . . . . 0.479 . . . . 0.306 . . 0.306 0.306 . . 0.383 0.197 . 0.197 . 0.197 0.197 0.197 . . . . . . . . . 0.197 . . . A 3.402 62 0.459 . . 0.096 . . . . . . . . . . . 0.326 . . 0.160 0.096 . . . . . . 0.255 . . . . 0.404 . 0.326 . 0.255 0.255 0.255 . 0.355 . 0.160 . t 3.241 298 0.048 0.368 0.048 . . . . . . 0.028 . . . . 0.028 . 0.028 . 0.456 0.176 . 0.028 0.140 0.164 . 0.028 0.028 . 0.067 . . 0.436 . . . . 0.453 0.363 0.048 0.207 . 0.099 . c 3.208 27 . 0.278 0.176 . . . . . . . . . . . . 0.176 . . 0.482 0.278 . . 0.352 0.176 . . 0.176 . . . . . . . . . 0.176 0.176 0.278 0.482 . . . s 3.046 249 0.032 0.433 . . . . . . . . . . . . . . . . 0.438 0.159 . . 0.113 0.222 . 0.032 0.056 . 0.077 . . 0.374 . . . . 0.499 0.348 . 0.077 . 0.130 0.056 Z 3.029 87 . 0.266 0.074 . . . . 0.074 . 0.074 . . . 0.074 . . . . 0.204 0.293 . 0.074 0.125 0.204 0.125 . 0.125 . 0.074 . . 0.168 0.531 0.470 . . . . . 0.074 . . . F 2.789 36 . 0.144 0.396 0.232 0.526 . . 0.232 . . . . 0.232 . . . . . 0.299 0.144 0.144 . . . . . . . . . 0.144 . . . . . . . . . 0.299 . . 2 0.000 372 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 0.000 668 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B 0.000 306 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . D 0.000 756 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E 0.000 452 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G 0.000 790 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H 0.000 401 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . J 0.000 204 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . P 0.000 216 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Q 0.000 105 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . R 0.000 195 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . U 0.000 355 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . V 0.000 301 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . W 0.000 54 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . d 0.000 1081 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 0.000 554 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . f 0.000 461 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . g 0.000 359 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . h 0.000 271 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i 0.000 206 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . j 0.000 150 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . k 0.000 44 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . l 0.000 323 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . m 0.000 416 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . n 0.000 483 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 0.000 1155 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p 0.000 466 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . r 0.000 431 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . u 0.000 192 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . w 0.000 469 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x 0.000 289 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 2.595 27218 0.515 0.078 0.104 0.075 0.100 0.082 0.100 0.053 0.041 0.076 0.185 0.066 0.071 0.062 0.010 0.098 0.020 0.050 0.193 0.114 0.092 0.103 0.095 0.070 0.009 0.015 0.048 0.031 0.082 0.072 0.018 0.131 0.101 0.073 0.053 0.148 0.144 0.090 0.051 0.085 0.026 0.055 0.013 Removing the blanks we get Next-symbol probability (× 99): TT TT e o r R G E x u n B w m H D O l Q f U 2 8 A V p P i J h W T g d S C j y k t c s Z F ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- e 4.488 554 1 8 . 1 8 3 4 2 . 5 . . 2 2 1 . 1 7 2 6 11 . 2 . 1 1 . 1 . 6 6 6 4 . 1 . . 4 . 4 . . . o 4.460 1155 . 7 . 1 5 2 4 1 1 3 . 1 4 19 1 . . 7 2 2 4 . 2 . 1 3 . 1 . 6 5 3 4 . 2 . . 2 . 2 . . . r 4.439 431 4 17 3 . 7 1 4 . 1 1 . 1 . . 3 . . 3 6 2 2 1 5 . 1 2 . 2 . 5 7 5 4 . 3 . . 4 . 5 . . . R 4.418 195 8 13 5 1 5 2 6 1 7 1 1 11 1 . 3 1 . 5 1 1 1 1 1 1 2 5 . . . 4 4 1 3 . 1 . 2 4 . 3 . . . G 4.359 790 . 5 . 3 3 8 1 3 . 2 . . 7 7 1 . 1 2 4 8 10 . 2 . 2 1 . 4 . 2 2 12 3 . 2 . . 2 . 2 . . . E 4.355 452 1 9 1 2 3 1 4 . . 3 . 1 2 11 4 . . 13 1 2 3 . 1 . 1 5 . . . 7 7 2 5 . 2 . . 5 . 3 . . . x 4.323 289 4 17 4 . 8 . 3 . 3 . . 5 1 1 3 . . 1 5 . 3 . 2 . 2 3 . 1 . 5 7 3 4 . 1 . . 4 . 5 . . . u 4.288 192 1 6 2 2 5 2 1 3 1 1 . 2 2 16 2 . . 11 2 2 1 . 3 . 2 8 . . . 6 6 2 8 1 2 . . 2 . 3 . . . n 4.256 483 1 16 1 . 2 1 1 1 . 1 . . 1 . 2 . . 6 7 2 6 1 7 . 1 3 . 1 . 9 6 3 5 . 4 . . 6 . 7 . . . B 4.247 306 . 4 1 3 4 7 1 2 . 2 . . 6 4 3 . 2 2 3 6 10 . 3 . 3 1 . 4 . 1 . 20 2 . 1 . . 2 . 1 . . . w 4.225 469 . 6 . 4 2 8 1 3 . 1 . . 2 2 1 . 2 3 7 3 7 . 5 . 1 1 . 6 . 3 3 20 2 . 1 . . 2 . 2 . . . m 4.207 416 . 13 . . 3 1 1 . . 1 . . . 1 1 . . 4 8 4 5 . 5 . 1 4 . 1 . 8 5 4 6 . 2 . . 9 . 7 . . . H 4.112 401 6 6 4 . 9 . 2 . 4 . 12 2 . . . 3 . 3 . . . . . 3 . 1 18 . 4 4 1 . . 5 1 1 . 1 1 . 6 . . D 4.031 756 3 2 4 . 11 1 1 . 10 . 9 5 . . . 7 . 1 . . . 1 . 9 . 1 16 . 3 2 . . 1 6 1 1 1 . 1 . 6 . . O 4.015 180 . 4 . . 10 1 1 1 1 6 1 . 1 1 2 1 2 2 2 8 8 . . 2 25 1 . . . 2 1 5 2 2 2 . . 2 . 1 . 4 . l 3.990 323 . 7 . 8 2 13 2 4 . . . . 2 2 1 . 3 1 5 1 7 . 5 . 1 . . 5 . 3 1 20 2 . . . . 2 . 1 . . . Q 3.986 105 1 4 1 15 2 . 1 . 1 5 2 1 3 7 1 2 . 1 1 . 6 . . 7 22 1 . . . 2 1 4 1 5 . . . . 1 . . 5 . f 3.981 461 . 5 . 3 1 8 1 7 . 1 . . 3 2 1 . 2 1 3 4 5 . 3 . 2 . . 8 . 1 1 28 1 1 . . . 3 . 2 . . . U 3.911 355 8 4 7 . 6 . 1 . 13 . 13 10 . . . 4 . 1 . . . 2 . 11 . 2 1 . 1 2 1 . . 8 1 1 1 . 1 . . . . 2 3.892 372 9 24 8 . 3 1 5 . 9 1 . 13 2 1 3 . . 2 3 1 1 1 1 . 1 . . . . 2 2 1 2 1 1 . . 1 . 2 . . . 8 3.856 668 18 9 18 . . 2 3 1 8 . . 15 1 1 . 1 . 2 1 1 1 1 1 1 . 1 . . . 2 4 2 1 1 . . 1 1 . 1 . . . A 3.839 62 2 6 . . 8 10 . . . 10 . . 6 6 6 . 2 . 2 13 14 . . . 3 2 . . . 2 2 2 3 . . . . 2 . . . . . V 3.834 301 10 5 10 . 7 . 1 . 9 . 17 4 . . . 6 . 1 . . . 1 . 8 . 1 . . 1 2 2 . 1 10 1 . . . . . 1 . . p 3.831 466 1 5 . 3 2 10 1 3 . 1 . . 1 1 1 . 3 3 5 3 4 . 5 . 1 . . 8 . 2 1 31 2 . . . . 2 . 1 . . . P 3.819 216 3 17 2 . 3 . 2 . . . . 1 . . 2 . . 22 1 . 1 . . . . 4 2 . 2 11 5 . 5 1 1 . . 6 . 1 5 . . i 3.792 206 . 5 . 5 1 12 . 6 . 1 . . 6 5 . . 2 . 4 5 8 . 3 . 3 . . 8 . 1 . 23 1 . . . . . . . . . . J 3.755 204 . 6 . 1 1 11 3 2 . . . . 1 . . . . . 4 5 9 . 8 . 1 1 . 5 . 2 . 27 1 . 1 . . 5 . . . . . h 3.754 271 11 3 7 1 11 . . . 9 . 17 5 . . . 3 . 1 . . . 1 . 15 . 1 . . . 2 1 . 1 6 . . . . 1 . . . . W 3.678 54 . 6 . 4 4 17 . 4 . . . . 4 . 4 . . . 4 4 7 . 4 . 2 . . 4 . 2 2 24 . . . . . 6 . 2 . . . T 3.657 488 3 6 2 1 13 3 2 . . 16 . . 8 17 1 11 . . 1 1 3 . . 7 2 . . . . . . . . . . . 1 . . . . 1 . g 3.646 359 . 5 . . 1 2 1 7 . 1 . . 3 1 1 . 4 2 3 3 5 . 5 . 2 1 . 9 . 1 2 36 2 . 1 . . 1 . 1 . . . d 3.627 1081 11 2 5 . 6 1 . . 14 . 15 8 . . 1 8 . 1 . . . 1 . 14 . . . . . 2 1 . . 7 . 1 . . . . . . . S 3.514 320 3 8 3 . 9 2 1 . . 11 . . 8 14 1 16 . . 2 . 2 . . 18 . . . . . . . . . . . . . . . . . . . C 3.513 334 1 8 2 1 33 1 2 . . . . . 4 9 1 3 . 1 . 7 12 1 . 4 2 1 . . . 2 . 1 2 . 1 . . . . . . 1 . j 3.471 150 . 6 . 2 1 6 . 6 . 2 . . 6 8 1 . 7 1 3 1 8 . 1 . 1 . . 4 . . 1 34 . . . . . 1 . 1 . . . y 3.464 23 9 9 13 . . 9 4 . . . . . . . . . 4 4 4 4 . . 4 . . . . . . . . 22 9 . . . 4 . . . . . . k 3.365 44 . 2 . . 7 . . . . . . . . 2 7 . 5 2 2 27 18 . 5 . 2 . . 2 . . 2 11 . . . . . 2 . 2 . . . t 3.247 298 4 19 3 1 . . 3 . . . . . 12 19 . . . . 1 5 17 . . . 2 . . . . 1 . . . 12 . . . . . . . . . c 3.208 27 7 22 11 7 . 4 4 . . . . . 4 4 4 . . . . 22 . . . . . . . . . 4 . . . 7 . . . . . . . . . s 3.046 249 3 17 2 . . . 5 . . . . . 11 25 1 . . . 1 1 12 . . . 2 . . . . . . . . 17 . . . . . . . 1 . Z 3.029 87 8 5 2 . . . 5 . 1 20 36 . . . 2 1 . . 1 1 3 . . . . 1 . . . 1 . . . 7 . 2 . . . 1 . . . F 2.789 36 3 8 . . . . . . . . . 3 . . . . . 41 . . . . . . . 6 . . 3 14 . . 6 3 . . . 6 . . 8 . . 0.000 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 3.989 14630 4 8 3 1 5 3 2 1 3 2 3 3 3 5 1 2 1 3 2 3 5 0 2 3 1 1 1 2 0 3 2 7 2 2 1 0 0 2 0 2 1 0 0 Also "c" "y" "k" are negligible. "D" seems to be the mark of a So, let's try this: cat .voyn.fss \ | tr -d ' \012' \ | sed \ -e 's/4OE/u/g' \ -e 's/4OD/d/g' \ -e 's/4OH/h/g' \ -e 's/4O/Q/g' \ -e 's/4C/Q/g' \ -e 's/OD/U/g' \ -e 's/OH/V/g' \ -e 's/TC8G/f/g' \ -e 's/SC8G/g/g' \ -e 's/CC8G/p/g' \ -e 's/TCG/i/g' \ -e 's/SCG/j/g' \ -e 's/CCG/l/g' \ -e 's/ZCG/W/g' \ -e 's/TC/t/g' \ -e 's/SC/s/g' \ -e 's/CC8/y/g' \ -e 's/CC/c/g' \ -e 's/C8G/w/g' \ -e 's/8G/B/g' \ -e 's/ZG/J/g' \ -e 's/OE/o/g' \ -e 's/AE/e/g' \ -e 's/AM/m/g' \ -e 's/AN/n/g' \ -e 's/AR/r/g' \ -e 's/OR/x/g' \ -e 's/AK/k/g' \ -e 's/\([eoRrGExunBwmHDO]\)/\1 /g' \ -e 's/[IKML4Ncyk]//g' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' CTSfgpijldhtsEAuoemnrxOQUVW8wBJGDHR2ZPF' Digraph counts: TT C T S f g p i j l d h t s E A u o e m n r x O Q U V W 8 w B J G D H R 2 Z P F ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 7070 . 82 343 242 327 273 89 158 123 70 411 114 219 205 196 19 71 583 111 111 133 108 167 116 41 227 189 39 355 121 138 193 394 404 174 86 226 68 123 21 C 334 . . 7 6 3 . 15 2 3 9 2 . . . 4 2 1 27 4 1 1 6 6 2 . . . . 42 . . . 111 31 14 5 22 . 6 2 T 488 . . 1 2 . . 33 . . 55 . . . 1 13 . . 31 14 . 1 8 9 5 . 4 2 . 18 . 81 . 62 83 39 4 7 . 12 3 S 320 . . 1 . . . 57 1 . 51 1 . 1 . 5 1 1 26 9 1 1 10 4 2 1 6 . . 5 . 36 . 28 45 25 1 1 . . . f 461 1 3 6 6 6 6 . 2 . . 130 35 16 7 36 . 33 22 2 2 . 1 4 5 8 15 15 . 24 . 3 . 3 11 16 16 17 . 9 1 g 359 . . 4 7 7 6 . 3 3 . 130 31 3 5 8 . 24 19 1 . . 1 2 2 15 11 17 . 18 . 2 . 5 3 12 1 10 . 9 . p 466 . 1 11 8 13 7 . 1 2 . 145 37 9 6 46 . 16 23 3 . . . 3 5 12 22 22 . 18 . 3 . 8 5 7 13 15 . 5 . i 206 . . 3 3 . . . 1 . . 47 16 1 . 24 . 12 10 . . . . . 1 5 8 6 . 16 . 2 . 2 10 12 10 10 . 7 . j 150 . . . . 1 1 . . . . 51 6 1 1 9 . 9 9 . . . . . 2 10 4 2 . 12 . 3 . 1 12 9 3 2 . 2 . l 323 . . 11 5 3 4 . . 1 . 65 17 6 3 44 . 14 23 . 1 . . 6 3 9 16 16 . 22 . 1 . 5 7 8 26 4 . 2 1 d 1081 . 75 18 1 9 7 154 4 1 87 3 . 1 1 7 15 . 23 123 85 157 53 5 7 . 2 1 4 . 166 1 1 67 . . . 1 2 . . h 271 . 17 6 2 4 2 42 2 1 7 . . 1 1 1 3 . 9 31 15 24 18 1 . . . 1 1 1 46 . . 29 . . 2 3 1 . . t 298 . 36 2 . . . . . . 1 . . . 1 . 1 . 57 11 . 1 8 10 1 . 3 . . 51 . . . 2 56 36 2 14 . 5 . s 249 . 42 . . . . . . . . . . . . 1 . . 44 8 . . 5 13 2 . 3 . . 31 . . . . 62 27 . 3 . 6 2 E 452 452 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A 62 . . 1 2 . 1 . 1 . . 1 . 1 . 6 . . 4 1 . . . . 4 1 1 . . 9 . 6 . 5 4 4 . 8 . 2 . u 192 192 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 1155 1155 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 554 554 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . m 416 416 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . n 483 483 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . r 431 431 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x 289 289 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . O 180 180 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Q 105 . 5 2 1 1 1 7 1 . 2 4 . . . . . . 4 1 1 1 1 1 1 . 1 . . 6 2 5 . 2 8 3 16 . . 23 5 U 355 . 29 7 1 2 3 39 6 4 16 3 . . . 1 7 . 15 32 36 46 24 3 1 . . 1 2 2 47 . 4 22 . . 1 1 . . . V 301 . 29 7 3 4 5 25 4 2 19 . . . . 1 2 . 15 31 13 28 29 2 2 . . . 2 1 52 . 1 21 . . 1 . 2 . . W 54 . . 1 . . 1 . . . . 13 2 3 1 9 . 2 3 . . . . . 2 . 2 2 . 4 . . . 2 . 2 2 2 . 1 . 8 668 . 4 16 10 12 25 4 5 3 4 14 2 7 6 15 9 4 59 123 98 55 122 19 1 2 6 5 . 8 3 2 . . 9 4 2 9 . . 1 w 469 469 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B 306 306 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . J 204 . . 4 2 1 1 . 2 2 . 57 10 10 1 23 . 5 13 . . . 1 6 . 1 9 16 . 18 . 1 . 3 1 2 3 10 . 2 . G 790 790 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . D 756 756 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H 401 401 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . R 195 195 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 372 . 2 7 6 6 6 . 1 3 . 4 1 5 6 2 3 . 91 35 49 33 30 19 10 . 11 5 . 2 . 3 . 11 5 7 1 6 . 2 . Z 87 . 6 1 1 . . . 1 . 1 . . . 1 1 . . 4 7 . 1 2 4 2 . 1 . . 3 32 18 . . . . . 1 . . . P 216 . 2 24 10 47 10 1 9 2 1 . . 12 3 . . . 38 6 2 1 4 5 4 . 3 1 5 2 . 1 5 7 . . . . 11 . . F 36 . 1 5 2 15 . . 2 . . . . 2 . . . . 3 1 1 . . . . . . . 1 . . . . . . . . . 3 . . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 21605 7070 334 488 320 461 359 466 206 150 323 1081 271 298 249 452 62 192 1155 554 416 483 431 289 180 105 355 301 54 668 469 306 204 790 756 401 195 372 87 216 36 Next-symbol probability (× 99): TT TT C T S f g p i j l d h t s E A u o e m n r x O Q U V W 8 w B J G D H R 2 Z P F ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 4.970 7070 . 1 5 3 5 4 1 2 2 1 6 2 3 3 3 . 1 8 2 2 2 2 2 2 1 3 3 1 5 2 2 3 6 6 2 1 3 1 2 . l 3.990 323 . . 3 2 1 1 . . . . 20 5 2 1 13 . 4 7 . . . . 2 1 3 5 5 . 7 . . . 2 2 2 8 1 . 1 . f 3.981 461 . 1 1 1 1 1 . . . . 28 8 3 2 8 . 7 5 . . . . 1 1 2 3 3 . 5 . 1 . 1 2 3 3 4 . 2 . Q 3.945 105 . 5 2 1 1 1 7 1 . 2 4 . . . . . . 4 1 1 1 1 1 1 . 1 . . 6 2 5 . 2 8 3 15 . . 22 5 2 3.882 372 . 1 2 2 2 2 . . 1 . 1 . 1 2 1 1 . 24 9 13 9 8 5 3 . 3 1 . 1 . 1 . 3 1 2 . 2 . 1 . U 3.880 355 . 8 2 . 1 1 11 2 1 4 1 . . . . 2 . 4 9 10 13 7 1 . . . . 1 1 13 . 1 6 . . . . . . . 8 3.841 668 . 1 2 1 2 4 1 1 . 1 2 . 1 1 2 1 1 9 18 15 8 18 3 . . 1 1 . 1 . . . . 1 1 . 1 . . . A 3.839 62 . . 2 3 . 2 . 2 . . 2 . 2 . 10 . . 6 2 . . . . 6 2 2 . . 14 . 10 . 8 6 6 . 13 . 3 . p 3.831 466 . . 2 2 3 1 . . . . 31 8 2 1 10 . 3 5 1 . . . 1 1 3 5 5 . 4 . 1 . 2 1 1 3 3 . 1 . V 3.828 301 . 10 2 1 1 2 8 1 1 6 . . . . . 1 . 5 10 4 9 10 1 1 . . . 1 . 17 . . 7 . . . . 1 . . P 3.819 216 . 1 11 5 22 5 . 4 1 . . . 6 1 . . . 17 3 1 . 2 2 2 . 1 . 2 1 . . 2 3 . . . . 5 . . i 3.792 206 . . 1 1 . . . . . . 23 8 . . 12 . 6 5 . . . . . . 2 4 3 . 8 . 1 . 1 5 6 5 5 . 3 . h 3.737 271 . 6 2 1 1 1 15 1 . 3 . . . . . 1 . 3 11 5 9 7 . . . . . . . 17 . . 11 . . 1 1 . . . J 3.719 204 . . 2 1 . . . 1 1 . 28 5 5 . 11 . 2 6 . . . . 3 . . 4 8 . 9 . . . 1 . 1 1 5 . 1 . W 3.678 54 . . 2 . . 2 . . . . 24 4 6 2 17 . 4 6 . . . . . 4 . 4 4 . 7 . . . 4 . 4 4 4 . 2 . g 3.646 359 . . 1 2 2 2 . 1 1 . 36 9 1 1 2 . 7 5 . . . . 1 1 4 3 5 . 5 . 1 . 1 1 3 . 3 . 2 . T 3.636 488 . . . . . . 7 . . 11 . . . . 3 . . 6 3 . . 2 2 1 . 1 . . 4 . 16 . 13 17 8 1 1 . 2 1 d 3.615 1081 . 7 2 . 1 1 14 . . 8 . . . . 1 1 . 2 11 8 14 5 . 1 . . . . . 15 . . 6 . . . . . . . S 3.514 320 . . . . . . 18 . . 16 . . . . 2 . . 8 3 . . 3 1 1 . 2 . . 2 . 11 . 9 14 8 . . . . . C 3.504 334 . . 2 2 1 . 4 1 1 3 1 . . . 1 1 . 8 1 . . 2 2 1 . . . . 12 . . . 33 9 4 1 7 . 2 1 j 3.471 150 . . . . 1 1 . . . . 34 4 1 1 6 . 6 6 . . . . . 1 7 3 1 . 8 . 2 . 1 8 6 2 1 . 1 . t 3.219 298 . 12 1 . . . . . . . . . . . . . . 19 4 . . 3 3 . . 1 . . 17 . . . 1 19 12 1 5 . 2 . Z 3.052 87 . 7 1 1 . . . 1 . 1 . . . 1 1 . . 5 8 . 1 2 5 2 . 1 . . 3 36 20 . . . . . 1 . . . s 3.018 249 . 17 . . . . . . . . . . . . . . . 17 3 . . 2 5 1 . 1 . . 12 . . . . 25 11 . 1 . 2 1 F 2.789 36 . 3 14 6 41 . . 6 . . . . 6 . . . . 8 3 3 . . . . . . . 3 . . . . . . . . . 8 . . B 0.000 306 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . D 0.000 756 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E 0.000 452 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G 0.000 790 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H 0.000 401 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . O 0.000 180 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . R 0.000 195 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 0.000 554 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . m 0.000 416 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . n 0.000 483 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 0.000 1155 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . r 0.000 431 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . u 0.000 192 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . w 0.000 469 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x 0.000 289 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 2.902 21605 32 2 2 1 2 2 2 1 1 1 5 1 1 1 2 0 1 5 3 2 2 2 1 1 0 2 1 0 3 2 1 1 4 3 2 1 2 0 1 0 Previous-symbol probability (× 99): TT C T S f g p i j l d h t s E A u o e m n r x O Q U V W 8 w B J G D H R 2 Z P F -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 32 . 24 70 75 70 75 19 76 81 21 38 42 73 82 43 30 37 50 20 26 27 25 57 64 39 63 62 72 53 26 45 94 49 53 43 44 60 77 56 58 C 2 . . 1 2 1 . 3 1 2 3 . . . . 1 3 1 2 1 . . 1 2 1 . . . . 6 . . . 14 4 3 3 6 . 3 6 T 2 . . . 1 . . 7 . . 17 . . . . 3 . . 3 3 . . 2 3 3 . 1 1 . 3 . 26 . 8 11 10 2 2 . 6 8 S 1 . . . . . . 12 . . 16 . . . . 1 2 1 2 2 . . 2 1 1 1 2 . . 1 . 12 . 4 6 6 1 . . . . f 2 . 1 1 2 1 2 . 1 . . 12 13 5 3 8 . 17 2 . . . . 1 3 8 4 5 . 4 . 1 . . 1 4 8 5 . 4 3 g 2 . . 1 2 2 2 . 1 2 . 12 11 1 2 2 . 12 2 . . . . 1 1 14 3 6 . 3 . 1 . 1 . 3 1 3 . 4 . p 2 . . 2 2 3 2 . . 1 . 13 14 3 2 10 . 8 2 1 . . . 1 3 11 6 7 . 3 . 1 . 1 1 2 7 4 . 2 . i 1 . . 1 1 . . . . . . 4 6 . . 5 . 6 1 . . . . . 1 5 2 2 . 2 . 1 . . 1 3 5 3 . 3 . j 1 . . . . . . . . . . 5 2 . . 2 . 5 1 . . . . . 1 9 1 1 . 2 . 1 . . 2 2 2 1 . 1 . l 1 . . 2 2 1 1 . . 1 . 6 6 2 1 10 . 7 2 . . . . 2 2 8 4 5 . 3 . . . 1 1 2 13 1 . 1 3 d 5 . 22 4 . 2 2 33 2 1 27 . . . . 2 24 . 2 22 20 32 12 2 4 . 1 . 7 . 35 . . 8 . . . . 2 . . h 1 . 5 1 1 1 1 9 1 1 2 . . . . . 5 . 1 6 4 5 4 . . . . . 2 . 10 . . 4 . . 1 1 1 . . t 1 . 11 . . . . . . . . . . . . . 2 . 5 2 . . 2 3 1 . 1 . . 8 . . . . 7 9 1 4 . 2 . s 1 . 12 . . . . . . . . . . . . . . . 4 1 . . 1 4 1 . 1 . . 5 . . . . 8 7 . 1 . 3 6 E 2 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A 0 . . . 1 . . . . . . . . . . 1 . . . . . . . . 2 1 . . . 1 . 2 . 1 1 1 . 2 . 1 . u 1 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 5 16 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 3 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . m 2 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . n 2 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . r 2 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x 1 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . O 1 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Q 0 . 1 . . . . 1 . . 1 . . . . . . . . . . . . . 1 . . . . 1 . 2 . . 1 1 8 . . 11 14 U 2 . 9 1 . . 1 8 3 3 5 . . . . . 11 . 1 6 9 9 6 1 1 . . . 4 . 10 . 2 3 . . 1 . . . . V 1 . 9 1 1 1 1 5 2 1 6 . . . . . 3 . 1 6 3 6 7 1 1 . . . 4 . 11 . . 3 . . 1 . 2 . . W 0 . . . . . . . . . . 1 1 1 . 2 . 1 . . . . . . 1 . 1 1 . 1 . . . . . . 1 1 . . . 8 3 . 1 3 3 3 7 1 2 2 1 1 1 2 2 3 14 2 5 22 23 11 28 7 1 2 2 2 . 1 1 1 . . 1 1 1 2 . . 3 w 2 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B 1 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . J 1 . . 1 1 . . . 1 1 . 5 4 3 . 5 . 3 1 . . . . 2 . 1 3 5 . 3 . . . . . . 2 3 . 1 . G 4 11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . D 3 11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H 2 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . R 1 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 . 1 1 2 1 2 . . 2 . . . 2 2 . 5 . 8 6 12 7 7 7 6 . 3 2 . . . 1 . 1 1 2 1 2 . 1 . Z 0 . 2 . . . . . . . . . . . . . . . . 1 . . . 1 1 . . . . . 7 6 . . . . . . . . . P 1 . 1 5 3 10 3 . 4 1 . . . 4 1 . . . 3 1 . . 1 2 2 . 1 . 9 . . . 2 1 . . . . 13 . . F 0 . . 1 1 3 . . 1 . . . . 1 . . . . . . . . . . . . . . 2 . . . . . . . . . 3 . . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 Symbol entropy: 4.272 This is getting too big. Let's try to simplify things by this preprocessing: Remove all spaces Correct: "CI" to "A" "IL" to "N" "IN" to "M" delete "I"s before "MNRK" "OM" to "AM" "ON" to "AN" "HM" to "HAN" "DM" to "DAN" "CM" to "AN" final "A" to "G" Identify these pairs with similar next-letter statistics: "D" to "H" "F" to "P" "S" to "T" "N" to "M" "DZ", "HZ", "PZ", "FZ" as "X" "4O" as "Q" Discard words still left with with "*" "6" "L" "K" "I" "4" (rare letters). cat .tmp-c-fsg.txt \ | /n/gnu/bin/sed \ -e 's/$/ /g' \ -e 's/CI/A/g' \ -e 's/IL/N/g' \ -e 's/IN/M/g' \ -e 's/I*\([MNRK]\)/\1/g' \ -e 's/CM/AN/g' \ -e 's/OM/AM/g' \ -e 's/ON/AN/g' \ -e 's/DM/DAN/g' \ -e 's/HM/HAN/g' \ -e 's/D/H/g' \ -e 's/F/P/g' \ -e 's/S/T/g' \ -e 's/N/M/g' \ -e 's/PZ/X/g' \ -e 's/HZ/X/g' \ -e 's/4O/Q/g' \ -e 's/A /G /g' \ | /n/gnu/bin/tr ' ' '\012' \ | egrep -v '[*6LKI4/=]' \ | /n/gnu/bin/tr '\012' ' ' \ | fold -w 90 -s \ | /n/gnu/bin/sed \ -e 's/^ *//g' -e 's/ *$//g' -e 's/ */ /g' \ > .voyn.fsg cat .voyn.fsg \ | tr -d ' \012' \ | fold -w 90 \ > .voyn.fss cat .voyn.fss \ | tr -d ' \012' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' HPXRMG8AOQE2TC' Digraph counts: TT H P X R M G 8 A O Q E 2 T C ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 1 . . 1 . . . . . . . . . . . . H 2776 . 1 . . 5 . 256 6 974 135 . 14 1 187 1197 P 218 . . . . . . 7 3 16 49 . . . 138 5 X 338 . . . . . . 202 20 10 11 . . . 3 92 R 896 . 10 15 4 2 . 58 28 154 274 47 7 12 280 5 M 917 . 6 6 9 2 . 25 63 16 294 49 6 26 412 3 G 3732 1 260 59 15 119 . 73 317 20 587 1324 314 176 459 8 8 2690 . 11 1 . 2 . 2036 5 402 93 24 16 4 82 14 A 1920 . 5 1 4 422 917 4 8 1 5 . 545 7 1 . O 2209 . 635 50 12 286 . 14 23 1 5 10 1140 10 14 9 Q 1604 . 1319 28 9 16 . 1 10 3 6 4 192 . 6 10 E 2303 . 369 34 6 27 . 128 190 74 363 137 45 72 840 18 2 363 . 10 2 2 1 . 9 5 153 128 5 2 4 40 2 T 2493 . 36 5 165 5 . 88 134 44 87 2 18 6 7 1896 C 4193 . 114 16 112 9 . 831 1878 52 172 2 4 45 24 934 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 26653 1 2776 218 338 896 917 3732 2690 1920 2209 1604 2303 363 2493 4193 Next-symbol probability (× 99): TT TT H P X R M G 8 A O Q E 2 T C ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 0.000 99 . . 99 . . . . . . . . . . . . H 1.927 99 . . . . . . 9 . 35 5 . . . 7 43 P 1.547 99 . . . . . . 3 1 7 22 . . . 63 2 X 1.568 99 . . . . . . 59 6 3 3 . . . 1 27 R 2.524 99 . 1 2 . . . 6 3 17 30 5 1 1 31 1 M 2.180 99 . 1 1 1 . . 3 7 2 32 5 1 3 44 . G 2.859 99 . 7 2 . 3 . 2 8 1 16 35 8 5 12 . 8 1.255 99 . . . . . . 75 . 15 3 1 1 . 3 1 A 1.667 99 . . . . 22 47 . . . . . 28 . . . O 1.845 99 . 28 2 1 13 . 1 1 . . . 51 . 1 . Q 1.006 99 . 81 2 1 1 . . 1 . . . 12 . . 1 E 2.814 99 . 16 1 . 1 . 6 8 3 16 6 2 3 36 1 2 2.112 99 . 3 1 1 . . 2 1 42 35 1 1 1 11 1 T 1.457 99 . 1 . 7 . . 3 5 2 3 . 1 . . 75 C 2.190 99 . 3 . 3 . . 20 44 1 4 . . 1 1 22 ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 2.006 99 0 10 1 1 3 3 14 10 7 8 6 9 1 9 16 Previous-symbol probability (× 99): TT H P X R M G 8 A O Q E 2 T C -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 0 . . . . . . . . . . . . . . . H 10 . . . . 1 . 7 . 50 6 . 1 . 7 28 P 1 . . . . . . . . 1 2 . . . 5 . X 1 . . . . . . 5 1 1 . . . . . 2 R 3 . . 7 1 . . 2 1 8 12 3 . 3 11 . M 3 . . 3 3 . . 1 2 1 13 3 . 7 16 . G 14 99 9 27 4 13 . 2 12 1 26 82 13 48 18 . 8 10 . . . . . . 54 . 21 4 1 1 1 3 . A 7 . . . 1 47 99 . . . . . 23 2 . . O 8 . 23 23 4 32 . . 1 . . 1 49 3 1 . Q 6 . 47 13 3 2 . . . . . . 8 . . . E 9 . 13 15 2 3 . 3 7 4 16 8 2 20 33 . 2 1 . . 1 1 . . . . 8 6 . . 1 2 . T 9 . 1 2 48 1 . 2 5 2 4 . 1 2 . 45 C 16 . 4 7 33 1 . 22 69 3 8 . . 12 1 22 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 Symbol entropy: 3.484 Next-symbol entropy: TT H P X R M G 8 A O Q E 2 T C ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 0.000 . . . . . . . . . . . . . . . H 1.927 . 0.004 . . 0.016 . 0.317 0.019 0.530 0.212 . 0.038 0.004 0.262 0.523 P 1.547 . . . . . . 0.159 0.085 0.277 0.484 . . . 0.418 0.125 X 1.568 . . . . . . 0.444 0.241 0.150 0.161 . . . 0.060 0.511 R 2.524 . 0.072 0.099 0.035 0.020 . 0.256 0.156 0.437 0.523 0.223 0.055 0.083 0.524 0.042 M 2.180 . 0.047 0.047 0.065 0.019 . 0.142 0.265 0.102 0.526 0.226 0.047 0.146 0.519 0.027 G 2.859 0.003 0.268 0.095 0.032 0.159 . 0.111 0.302 0.040 0.420 0.530 0.300 0.208 0.372 0.019 8 1.255 . 0.032 0.004 . 0.008 . 0.304 0.017 0.410 0.168 0.061 0.044 0.014 0.154 0.039 A 1.667 . 0.022 0.006 0.019 0.480 0.509 0.019 0.033 0.006 0.022 . 0.516 0.030 0.006 . O 1.845 . 0.517 0.124 0.041 0.382 . 0.046 0.069 0.005 0.020 0.035 0.493 0.035 0.046 0.032 Q 1.006 . 0.232 0.102 0.042 0.066 . 0.007 0.046 0.017 0.030 0.022 0.367 . 0.030 0.046 E 2.814 . 0.423 0.090 0.022 0.075 . 0.232 0.297 0.159 0.420 0.242 0.111 0.156 0.531 0.055 2 2.112 . 0.143 0.041 0.041 0.023 . 0.132 0.085 0.525 0.530 0.085 0.041 0.072 0.351 0.041 T 1.457 . 0.088 0.018 0.259 0.018 . 0.170 0.227 0.103 0.169 0.008 0.051 0.021 0.024 0.300 C 2.190 . 0.141 0.031 0.140 0.019 . 0.463 0.519 0.079 0.189 0.005 0.010 0.070 0.043 0.483 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 2.006 0.001 0.340 0.057 0.080 0.165 0.167 0.397 0.334 0.273 0.298 0.244 0.305 0.084 0.320 0.420 OK, let's start merging: "AM" -> "m" "AR" -> "r" "OR" -> "x" "AE" -> "e" "GE" -> "i" "QE" -> "w" "OE" -> "u" It is tempting to merge "OH" -> "b", "QH" -> "h", "GH" -> "k" but that conflicts with the "8G" merging and is not supported by analysis of line breaks. Hopefully the leftover "R"s will be mergeable with the "2"s. cat .voyn.fss \ | tr -d ' \012' \ | /n/gnu/bin/sed \ -e 's/AM/m/g' \ -e 's/AR/r/g' \ -e 's/OR/x/g' \ -e 's/AE/e/g' \ -e 's/GE/i/g' \ -e 's/OE/u/g' \ -e 's/QE/w/g' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' HPXRMG8AOQE2TCmrxeiuw' Digraph counts: TT H P X R G 8 A O Q E 2 T C m r x e i u w ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 1 . . 1 . . . . . . . . . . . . . . . . . . H 2776 . 1 . . 5 228 6 15 15 . 14 1 187 1197 537 165 23 257 28 97 . P 218 . . . . . 7 3 . 6 . . . 138 5 5 4 5 7 . 38 . X 338 . . . . . 182 20 . 3 . . . 3 92 1 2 4 7 20 4 . R 188 . 2 3 . 1 8 3 1 3 2 4 2 52 3 41 9 11 15 1 26 1 G 3418 1 260 59 15 119 73 317 2 346 1167 . 176 459 8 7 7 39 4 . 202 157 8 2690 . 11 1 . 2 1892 5 5 14 20 16 4 82 14 152 121 18 124 144 61 4 A 36 . 5 1 4 . 4 8 . 3 . . 7 1 . . . . 1 . 2 . O 783 . 635 50 12 . 13 23 . 2 9 . 10 14 9 1 . 1 . 1 2 1 Q 1412 . 1319 28 9 16 1 10 . 2 4 . . 6 10 1 1 1 1 . 3 . E 112 . 11 1 1 2 6 4 . 4 5 1 6 46 1 2 1 8 1 . 12 . 2 363 . 10 2 2 1 9 5 2 19 5 2 4 40 2 86 30 19 35 . 90 . T 2493 . 36 5 165 5 79 134 . 17 1 18 6 7 1896 3 18 13 23 9 57 1 C 4193 . 114 16 112 9 731 1878 2 11 1 4 45 24 934 3 22 30 25 100 131 1 m 917 . 6 6 9 2 24 63 4 147 44 6 26 412 3 2 5 13 5 1 134 5 r 422 . 2 5 3 1 25 16 2 55 31 2 8 141 1 8 11 18 17 2 72 2 x 286 . 6 7 1 . 20 9 . 30 11 1 2 87 1 28 12 10 10 2 49 . e 545 . 19 7 1 7 44 85 1 23 45 14 33 180 3 4 2 20 3 3 42 9 i 314 . 45 4 . 4 8 21 . 11 1 3 4 163 2 4 4 10 3 . 27 . u 1140 . 259 19 4 10 55 77 2 62 63 24 26 363 11 25 5 42 5 3 79 6 w 192 . 35 3 . 4 9 3 . 10 3 3 3 88 1 7 3 1 2 . 12 5 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 22837 1 2776 218 338 188 3418 2690 36 783 1412 112 363 2493 4193 917 422 286 545 314 1140 192 Symbol entropy: 3.574 Next-symbol probability (× 99): TT TT H P X R G 8 A O Q E 2 T C m r x e i u w ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- m 2.635 917 . 1 1 1 . 3 7 . 16 5 1 3 44 . . 1 1 1 . 14 1 r 3.130 422 . . 1 1 . 6 4 . 13 7 . 2 33 . 2 3 4 4 . 17 . e 3.237 545 . 3 1 . 1 8 15 . 4 8 3 6 33 1 1 . 4 1 1 8 2 x 3.198 286 . 2 2 . . 7 3 . 10 4 . 1 30 . 10 4 3 3 1 17 . w 2.780 192 . 18 2 . 2 5 2 . 5 2 2 2 45 1 4 2 1 1 . 6 3 u 3.148 1140 . 22 2 . 1 5 7 . 5 5 2 2 32 1 2 . 4 . . 7 1 R 3.190 188 . 1 2 . 1 4 2 1 2 1 2 1 27 2 22 5 6 8 1 14 1 2 3.157 363 . 3 1 1 . 2 1 1 5 1 1 1 11 1 23 8 5 10 . 25 . G 3.094 3418 . 8 2 . 3 2 9 . 10 34 . 5 13 . . . 1 . . 6 5 E 3.041 112 . 10 1 1 2 5 4 . 4 4 1 5 41 1 2 1 7 1 . 11 . H 2.557 2776 . . . . . 8 . 1 1 . . . 7 43 19 6 1 9 1 3 . i 2.523 314 . 14 1 . 1 3 7 . 3 . 1 1 51 1 1 1 3 1 . 9 . C 2.355 4193 . 3 . 3 . 17 44 . . . . 1 1 22 . 1 1 1 2 3 . X 1.932 338 . . . . . 53 6 . 1 . . . 1 27 . 1 1 2 6 1 . P 1.884 218 . . . . . 3 1 . 3 . . . 63 2 2 2 2 3 . 17 . 8 1.831 2690 . . . . . 70 . . 1 1 1 . 3 1 6 4 1 5 5 2 . T 1.541 2493 . 1 . 7 . 3 5 . 1 . 1 . . 75 . 1 1 1 . 2 . O 1.264 783 . 80 6 2 . 2 3 . . 1 . 1 2 1 . . . . . . . Q 0.552 1412 . 92 2 1 1 . 1 . . . . . . 1 . . . . . . . A 3.003 36 . 14 3 11 . 11 22 . 8 . . 19 3 . . . . 3 . 6 . 0.000 1 . . 99 . . . . . . . . . . . . . . . . . . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 2.306 22837 0 12 1 1 1 15 12 0 3 6 0 2 11 18 4 2 1 2 1 5 1 Previous-symbol probability (× 99): TT H P X R G 8 A O Q E 2 T C m r x e i u w -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 0 . . . . . . . . . . . . . . . . . . . . . H 12 . . . . 3 7 . 41 2 . 12 . 7 28 58 39 8 47 9 8 . P 1 . . . . . . . . 1 . . . 5 . 1 1 2 1 . 3 . X 1 . . . . . 5 1 . . . . . . 2 . . 1 1 6 . . R 1 . . 1 . 1 . . 3 . . 4 1 2 . 4 2 4 3 . 2 1 G 15 99 9 27 4 63 2 12 6 44 82 . 48 18 . 1 2 13 1 . 18 81 8 12 . . . . 1 55 . 14 2 1 14 1 3 . 16 28 6 23 45 5 2 A 0 . . . 1 . . . . . . . 2 . . . . . . . . . O 3 . 23 23 4 . . 1 . . 1 . 3 1 . . . . . . . 1 Q 6 . 47 13 3 8 . . . . . . . . . . . . . . . . E 0 . . . . 1 . . . 1 . 1 2 2 . . . 3 . . 1 . 2 2 . . 1 1 1 . . 6 2 . 2 1 2 . 9 7 7 6 . 8 . T 11 . 1 2 48 3 2 5 . 2 . 16 2 . 45 . 4 5 4 3 5 1 C 18 . 4 7 33 5 21 69 6 1 . 4 12 1 22 . 5 10 5 32 11 1 m 4 . . 3 3 1 1 2 11 19 3 5 7 16 . . 1 5 1 . 12 3 r 2 . . 2 1 1 1 1 6 7 2 2 2 6 . 1 3 6 3 1 6 1 x 1 . . 3 . . 1 . . 4 1 1 1 3 . 3 3 3 2 1 4 . e 2 . 1 3 . 4 1 3 3 3 3 12 9 7 . . . 7 1 1 4 5 i 1 . 2 2 . 2 . 1 . 1 . 3 1 6 . . 1 3 1 . 2 . u 5 . 9 9 1 5 2 3 6 8 4 21 7 14 . 3 1 15 1 1 7 3 w 1 . 1 1 . 2 . . . 1 . 3 1 3 . 1 1 . . . 1 3 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 We can merge "TCC" -> "a" "XCC" -> "y" "TC" -> "t" "XC" -> "d" "CC" -> "c" "OH" -> "b" "QH" -> "h" "OP" -> "p" "QP" -> "q" "OEH" -> "f" "4OEH" -> "v" "EH" -> "j" From other evidence we know that "TCC" behaves like a letter. Beware of parsing order... We can also identify the leftover "R"s with "2"s, abd "A"s to "O"s. (Remeber to unsplit back them in the inverse mapping.) There is an ambiguity "8GE" = "8G" + "E" or "8" + "GE"? Probably the former... It looks like "GE" is not a good idea. There is an ambiguity: shoudl "8GH" be parsed as "8G" + "H" or "*" + "GH"? Probably the former... cat .voyn.fss \ | tr -d ' \012' \ | /n/gnu/bin/sed \ -e 's/AM/m/g' \ -e 's/AR/r/g' \ -e 's/AE/e/g' \ -e 's/A/O/g' \ -e 's/8G/g/g' \ -e 's/OR/x/g' \ -e 's/OEH/f/g' \ -e 's/QEH/v/g' \ -e 's/OE/u/g' \ -e 's/QE/w/g' \ -e 's/OH/b/g' \ -e 's/QH/h/g' \ -e 's/OP/p/g' \ -e 's/QP/q/g' \ -e 's/EH/j/g' \ -e 's/TCC/a/g' \ -e 's/XCC/y/g' \ -e 's/TC/t/g' \ -e 's/XC/d/g' \ -e 's/CC/c/g' \ -e 's/R/2/g' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' mrexuwPpqHhbfvjQE28gGOXdyTtaCc' Digraph counts: TT m r e x u w P p q H h b f v j Q E 2 8 g G O X d y T t a C c ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 1 . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . m 917 . 2 5 5 13 90 2 6 7 1 6 42 127 44 3 . 1 6 28 51 12 25 17 6 2 1 100 259 53 1 2 r 422 . 8 11 17 18 56 1 5 5 1 2 30 43 16 1 . . 2 9 10 6 27 9 2 1 . 28 97 16 . 1 e 545 . 4 2 3 20 28 9 7 2 2 19 42 20 14 . 2 1 12 40 61 24 47 2 1 . . 46 118 16 2 1 x 286 . 28 12 10 10 39 . 7 3 . 6 11 22 10 . . . 1 2 9 . 22 5 . 1 . 11 59 17 1 . u 881 . 25 5 5 42 61 6 19 3 1 . 54 52 18 . 7 8 17 36 42 35 58 9 3 1 . 74 236 53 3 8 w 157 . 7 3 2 1 10 4 3 . . . 3 9 2 1 1 . 2 7 1 2 9 1 . . . 9 60 19 . 1 P 139 . 5 2 2 3 28 . . . . . . 2 4 . . . . . 2 . 3 3 . . . 22 57 2 2 2 p 51 . . 2 5 1 4 . . . . . . . . . . . . . . . 3 . . . . 7 25 3 1 . q 28 . . . . 1 2 . . . . . . 1 . . . . . . . 1 1 . . . . 5 17 . . . H 467 . 53 24 31 13 28 . . . . . . 4 3 . . . 1 4 1 . 94 2 . . . 24 31 1 84 69 h 1319 . 282 70 152 4 29 . . 2 . . . . 2 . . . 7 1 1 1 95 12 . . . 26 31 . 296 308 b 640 . 126 51 61 5 23 . . . . . . 1 3 . . . 2 1 2 . 44 7 . . . 17 30 1 154 112 f 259 . 58 13 12 1 5 . . . . 1 . . 2 . . . 2 . . 1 15 . . . . 7 14 . 61 67 v 35 . 5 1 . . . . . . . . . . 1 . . . . . . . 4 . . . . . 2 . 6 16 j 56 . 13 6 1 . 1 . . . . . . . . . . . 2 . . . 4 2 . . . . 3 . 12 12 Q 65 . 1 1 1 1 2 . . . . . 4 1 1 . . . . 16 6 4 1 1 2 7 . 2 3 1 . 10 E 370 . 6 5 4 18 34 . 5 . . . 6 3 5 . 1 . 3 16 13 12 14 12 . 1 . 34 152 23 1 2 2 551 . 127 39 50 30 82 1 5 . . 12 7 19 34 . . . 6 8 3 5 18 6 1 1 . 14 61 17 3 2 8 654 . 152 121 124 18 54 3 1 1 1 11 17 14 7 1 . 2 16 6 3 2 . 4 . . . 21 52 9 6 8 g 2036 1 5 5 4 15 75 73 32 19 16 96 688 177 33 20 19 29 125 139 126 20 41 7 6 3 . 69 170 18 5 . G 1696 . 2 2 . 24 67 55 27 8 5 164 407 129 27 9 26 22 144 156 149 22 32 8 2 4 . 56 122 24 2 1 O 128 . 1 . 1 1 4 1 . 1 1 . 7 . . . . 1 . 17 15 16 18 4 9 7 . 3 10 2 3 6 X 246 . 1 2 7 4 4 . . . . . . 1 . . . . . . 3 17 202 2 . . . 2 1 . . . d 90 . . . . . 1 . . . . . . . . . . . 1 3 1 31 53 . . . . . . . . . y 2 . . . . . . . . . . . . . . . . . . . 1 . 1 . . . . . . . . . T 597 . 3 18 23 13 46 1 5 . . 36 1 9 11 . . . 18 11 20 114 88 8 123 41 1 4 3 . . . t 1621 . 1 13 19 23 77 . 9 . . 72 . 6 21 . . . . 19 79 817 353 3 89 18 . 2 . . . . a 275 . 1 1 3 2 6 1 3 . . 36 . . . . . . . 15 7 90 105 . 1 2 . . . . 2 . C 672 . 1 5 1 4 19 . 4 . . 5 . . 1 . . 1 2 9 30 447 117 3 1 1 . 13 8 . . . c 628 . . 3 2 1 6 . . . . 1 . . . . . . 1 8 18 357 202 1 . . . 1 . . 27 . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 15834 1 917 422 545 286 881 157 139 51 28 467 1319 640 259 35 56 65 370 551 654 2036 1696 128 246 90 2 597 1621 275 672 628 Symbol entropy: 4.263 Next-symbol probability (× 99): TT TT m r e x u G g 8 2 w P p q H h b f v j Q E O X d y T t a C c ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 0.000 1 . . . . . . . . . . . 99 . . . . . . . . . . . . . . . . . . . m 3.515 917 . . 1 1 1 10 3 1 6 3 . 1 1 . 1 5 14 5 . . . 1 2 1 . . 11 28 6 . . r 3.796 422 . 2 3 4 4 13 6 1 2 2 . 1 1 . . 7 10 4 . . . . 2 . . . 7 23 4 . . e 3.843 545 . 1 . 1 4 5 9 4 11 7 2 1 . . 3 8 4 3 . . . 2 . . . . 8 21 3 . . x 3.774 286 . 10 4 3 3 13 8 . 3 1 . 2 1 . 2 4 8 3 . . . . 2 . . . 4 20 6 . . u 3.834 881 . 3 1 1 5 7 7 4 5 4 1 2 . . . 6 6 2 . 1 1 2 1 . . . 8 27 6 . 1 w 3.323 157 . 4 2 1 1 6 6 1 1 4 3 2 . . . 2 6 1 1 1 . 1 1 . . . 6 38 12 . 1 P 2.708 139 . 4 1 1 2 20 2 . 1 . . . . . . . 1 3 . . . . 2 . . . 16 41 1 1 1 p 2.401 51 . . 4 10 2 8 6 . . . . . . . . . . . . . . . . . . . 14 49 6 2 . q 1.840 28 . . . . 4 7 4 4 . . . . . . . . 4 . . . . . . . . . 18 60 . . . H 3.277 467 . 11 5 7 3 6 20 . . 1 . . . . . . 1 1 . . . . . . . . 5 7 . 18 15 h 2.846 1319 . 21 5 11 . 2 7 . . . . . . . . . . . . . . 1 1 . . . 2 2 . 22 23 b 3.052 640 . 19 8 9 1 4 7 . . . . . . . . . . . . . . . 1 . . . 3 5 . 24 17 f 2.819 259 . 22 5 5 . 2 6 . . . . . . . . . . 1 . . . 1 . . . . 3 5 . 23 26 v 2.240 35 . 14 3 . . . 11 . . . . . . . . . . 3 . . . . . . . . . 6 . 17 45 j 2.836 56 . 23 11 2 . 2 7 . . . . . . . . . . . . . . 4 4 . . . . 5 . 21 21 Q 3.574 65 . 2 2 2 2 3 2 6 9 24 . . . . . 6 2 2 . . . . 2 3 11 . 3 5 2 . 15 E 3.225 370 . 2 1 1 5 9 4 3 3 4 . 1 . . . 2 1 1 . . . 1 3 . . . 9 41 6 . 1 2 3.643 551 . 23 7 9 5 15 3 1 1 1 . 1 . . 2 1 3 6 . . . 1 1 . . . 3 11 3 1 . 8 3.351 654 . 23 18 19 3 8 . . . 1 . . . . 2 3 2 1 . . . 2 1 . . . 3 8 1 1 1 g 3.585 2036 . . . . 1 4 2 1 6 7 4 2 1 1 5 33 9 2 1 1 1 6 . . . . 3 8 1 . . G 3.748 1696 . . . . 1 4 2 1 9 9 3 2 . . 10 24 8 2 1 2 1 8 . . . . 3 7 1 . . O 3.787 128 . 1 . 1 1 3 14 12 12 13 1 . 1 1 . 5 . . . . 1 . 3 7 5 . 2 8 2 2 5 X 1.183 246 . . 1 3 2 2 81 7 1 . . . . . . . . . . . . . 1 . . . 1 . . . . d 1.359 90 . . . . . 1 58 34 1 3 . . . . . . . . . . . 1 . . . . . . . . . y 1.000 2 . . . . . . 50 . 50 . . . . . . . . . . . . . . . . . . . . . . T 3.514 597 . . 3 4 2 8 15 19 3 2 . 1 . . 6 . 1 2 . . . 3 1 20 7 . 1 . . . . t 2.381 1621 . . 1 1 1 5 22 50 5 1 . 1 . . 4 . . 1 . . . . . 5 1 . . . . . . a 2.341 275 . . . 1 1 2 38 32 3 5 . 1 . . 13 . . . . . . . . . 1 . . . . 1 . C 1.782 672 . . 1 . 1 3 17 66 4 1 . 1 . . 1 . . . . . . . . . . . 2 1 . . . c 1.613 628 . . . . . 1 32 56 3 1 . . . . . . . . . . . . . . . . . . . 4 . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 3.135 15834 0 6 3 3 2 6 11 13 4 3 1 1 0 0 3 8 4 2 0 0 0 2 1 2 1 0 4 10 2 4 4 Previous-symbol probability (× 99): TT m r e x u P p q H h b f v j w Q E 2 8 g G O X d y T t a C c -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 0 . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . m 6 . . 1 1 5 10 4 14 4 1 3 20 17 8 . 1 2 2 5 8 1 1 13 2 2 50 17 16 19 . . r 3 . 1 3 3 6 6 4 10 4 . 2 7 6 3 . 1 . 1 2 2 . 2 7 1 1 . 5 6 6 . . e 3 . . . 1 7 3 5 4 7 4 3 3 5 . 4 6 2 3 7 9 1 3 2 . . . 8 7 6 . . x 2 . 3 3 2 3 4 5 6 . 1 1 3 4 . . . . . . 1 . 1 4 . 1 . 2 4 6 . . u 6 . 3 1 1 15 7 14 6 4 . 4 8 7 . 12 4 12 5 6 6 2 3 7 1 1 . 12 14 19 . 1 w 1 . 1 1 . . 1 2 . . . . 1 1 3 2 3 . 1 1 . . 1 1 . . . 1 4 7 . . P 1 . 1 . . 1 3 . . . . . . 2 . . . . . . . . . 2 . . . 4 3 1 . . p 0 . . . 1 . . . . . . . . . . . . . . . . . . . . . . 1 2 1 . . q 0 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 . . . H 3 . 6 6 6 5 3 . . . . . 1 1 . . . . . 1 . . 5 2 . . . 4 2 . 12 11 h 8 . 30 16 28 1 3 . 4 . . . . 1 . . . . 2 . . . 6 9 . . . 4 2 . 44 49 b 4 . 14 12 11 2 3 . . . . . . 1 . . . . 1 . . . 3 5 . . . 3 2 . 23 18 f 2 . 6 3 2 . 1 . . . . . . 1 . . . . 1 . . . 1 . . . . 1 1 . 9 11 v 0 . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 3 j 0 . 1 1 . . . . . . . . . . . . . . 1 . . . . 2 . . . . . . 2 2 Q 0 . . . . . . . . . . . . . . . . . . 3 1 . . 1 1 8 . . . . . 2 E 2 . 1 1 1 6 4 4 . . . . . 2 . 2 . . 1 3 2 1 1 9 . 1 . 6 9 8 . . 2 3 . 14 9 9 10 9 4 . . 3 1 3 13 . . 1 . 2 1 . . 1 5 . 1 . 2 4 6 . . 8 4 . 16 28 23 6 6 1 2 4 2 1 2 3 3 . 2 3 4 1 . . . 3 . . . 3 3 3 1 1 g 13 99 1 1 1 5 8 23 37 57 20 52 27 13 57 34 46 44 33 25 19 1 2 5 2 3 . 11 10 6 1 . G 11 . . . . 8 8 19 16 18 35 31 20 10 25 46 35 34 39 28 23 1 2 6 1 4 . 9 7 9 . . O 1 . . . . . . . 2 4 . 1 . . . . 1 2 . 3 2 1 1 3 4 8 . . 1 1 . 1 X 2 . . . 1 1 . . . . . . . . . . . . . . . 1 12 2 . . . . . . . . d 1 . . . . . . . . . . . . . . . . . . 1 . 2 3 . . . . . . . . . y 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T 4 . . 4 4 5 5 4 . . 8 . 1 4 . . 1 . 5 2 3 6 5 6 50 45 50 1 . . . . t 10 . . 3 3 8 9 6 . . 15 . 1 8 . . . . . 3 12 40 21 2 36 20 . . . . . . a 2 . . . 1 1 1 2 . . 8 . . . . . 1 . . 3 1 4 6 . . 2 . . . . . . C 4 . . 1 . 1 2 3 . . 1 . . . . . . 2 1 2 5 22 7 2 . 1 . 2 . . . . c 4 . . 1 . . 1 . . . . . . . . . . . . 1 3 17 12 1 . . . . . . 4 . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 We can combine the classes "m", "r", "e" = "AM", "AN", "AR", "AE" "g", "G" = "8G", "G" "P". "p", "q" = "P", "F", "OP", "OF", "4OP", "4OF", "C", "c" = "C", "CC" "u", "x" = "OE", "OR" "X", "d", "y" = "PZ", "FZ", "HZ", "DZ", "PZC", "FZC", "HZC", "DZC",D, "PZCC", "FZCC", "HZCC", "DZCC" "H", "h", "b", "f", "v", "j" = "D", "H", "4OH", "4OD", "OH", "OD", "OEH", "OED", "4OEH", "4OED", "EH", "ED" "T", "t", "a" = "T", "TC", "TCC", "S", "SC", "SCC" "2", "8" = "2" (sometimes "R"), "8" Also, "x" = "OR" is similar on the right ro "m", "r", "e", but different on the left, where it likes "u" = "OE" and "2". However, "x" is similar to "u" there. Also "w" = "4OE" is similar to "P", "O", "E", on the left but to "x" = "OR" and "u" = "OE" on the right. Let's try to collapse what we can collapse: cat .voyn.fss \ | tr -d ' \012' \ | /n/gnu/bin/sed \ -e 's/AM/m/g' \ -e 's/AR/r/g' \ -e 's/AE/e/g' \ -e 's/A/O/g' \ -e 's/8G/g/g' \ -e 's/OR/x/g' \ -e 's/OEH/f/g' \ -e 's/QEH/v/g' \ -e 's/OE/u/g' \ -e 's/QE/w/g' \ -e 's/OH/b/g' \ -e 's/QH/h/g' \ -e 's/OP/p/g' \ -e 's/QP/q/g' \ -e 's/EH/j/g' \ -e 's/TCC/a/g' \ -e 's/XCC/y/g' \ -e 's/TC/t/g' \ -e 's/XC/d/g' \ -e 's/CC/c/g' \ -e 's/R/2/g' \ \ -e 's/[mre]/m/g' \ -e 's/[Gg]/g/g' \ -e 's/[Ppq]/p/g' \ -e 's/[Xdy]/y/g' \ -e 's/[Cc]/c/g' \ -e 's/[xu]/u/g' \ -e 's/[28]/i/g' \ -e 's/[Tta]/t/g' \ -e 's/[Hhbfvj]/h/g' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' muwphQEigOytc' Digraph counts: TT m u w p h Q E i g O y t c ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 1 . . . . 1 . . . . . . . . . m 1884 . 57 225 12 36 411 2 20 199 141 28 13 733 7 u 1167 . 85 152 6 33 180 8 18 89 115 14 5 450 12 w 157 . 12 11 4 3 16 . 2 8 11 1 . 88 1 p 218 . 16 39 . . 7 . . 2 8 3 . 138 5 h 2776 . 959 109 . 2 17 . 14 10 258 23 . 187 1197 Q 65 . 3 3 . . 6 . . 22 5 1 9 6 10 E 370 . 15 52 . 5 15 . 3 29 26 12 1 209 3 i 1205 . 613 184 4 8 122 2 22 20 25 10 2 174 19 g 3732 1 18 181 128 107 1795 51 269 570 115 15 15 459 8 O 128 . 2 5 1 2 7 1 . 32 34 4 16 15 9 y 338 . 10 9 . . 1 . 1 8 304 2 . 3 . t 2493 . 82 167 2 17 192 . 18 151 1567 11 275 9 2 c 1300 . 12 30 . 4 7 1 3 65 1123 4 2 22 27 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 15834 1 1884 1167 157 218 2776 65 370 1205 3732 128 338 2493 1300 Symbol entropy: 3.059 Next-symbol probability (× 99): TT TT m u w p h Q E i g O y t c ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- O 2.880 128 . 2 4 1 2 5 1 . 25 26 3 12 12 7 Q 2.761 65 . 5 5 . . 9 . . 34 8 2 14 9 15 u 2.722 1167 . 7 13 1 3 15 1 2 8 10 1 . 38 1 m 2.556 1884 . 3 12 1 2 22 . 1 10 7 1 1 39 . g 2.455 3732 . . 5 3 3 48 1 7 15 3 . . 12 . w 2.261 157 . 8 7 3 2 10 . 1 5 7 1 . 55 1 i 2.225 1205 . 50 15 . 1 10 . 2 2 2 1 . 14 2 E 2.175 370 . 4 14 . 1 4 . 1 8 7 3 . 56 1 h 1.995 2776 . 34 4 . . 1 . . . 9 1 . 7 43 t 1.906 2493 . 3 7 . 1 8 . 1 6 62 . 11 . . p 1.745 218 . 7 18 . . 3 . . 1 4 1 . 63 2 c 0.937 1300 . 1 2 . . 1 . . 5 86 . . 2 2 y 0.709 338 . 3 3 . . . . . 2 89 1 . 1 . 0.000 1 . . . . 99 . . . . . . . . . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 2.126 15834 0 12 7 1 1 17 0 2 8 23 1 2 16 8 Previous-symbol probability (× 99): TT m u w p h Q E i g O y t c -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 0 . . . . . . . . . . . . . . m 12 . 3 19 8 16 15 3 5 16 4 22 4 29 1 u 7 . 4 13 4 15 6 12 5 7 3 11 1 18 1 w 1 . 1 1 3 1 1 . 1 1 . 1 . 3 . p 1 . 1 3 . . . . . . . 2 . 5 . h 17 . 50 9 . 1 1 . 4 1 7 18 . 7 91 Q 0 . . . . . . . . 2 . 1 3 . 1 E 2 . 1 4 . 2 1 . 1 2 1 9 . 8 . i 8 . 32 16 3 4 4 3 6 2 1 8 1 7 1 g 23 99 1 15 81 49 64 78 72 47 3 12 4 18 1 O 1 . . . 1 1 . 2 . 3 1 3 5 1 1 y 2 . 1 1 . . . . . 1 8 2 . . . t 16 . 4 14 1 8 7 . 5 12 42 9 81 . . c 8 . 1 3 . 2 . 2 1 5 30 3 1 1 2 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 These seem to be distinct classes. Now we could start condensing some more... "tg" --> "3" "cg" --> "5" "tyg" --> "%" "hcg" --> "@" "ptg" --> "#" "im" --> "7" "hm" --> "9" "hg" --> "1" "hu" --> "." cat .voyn.fss \ | tr -d ' \012' \ | /n/gnu/bin/sed \ -e 's/AM/m/g' \ -e 's/AR/r/g' \ -e 's/AE/e/g' \ -e 's/A/O/g' \ -e 's/8G/g/g' \ -e 's/OR/x/g' \ -e 's/OEH/f/g' \ -e 's/QEH/v/g' \ -e 's/OE/u/g' \ -e 's/QE/w/g' \ -e 's/OH/b/g' \ -e 's/QH/h/g' \ -e 's/OP/p/g' \ -e 's/QP/q/g' \ -e 's/EH/j/g' \ -e 's/TCC/a/g' \ -e 's/XCC/y/g' \ -e 's/TC/t/g' \ -e 's/XC/d/g' \ -e 's/CC/c/g' \ -e 's/R/2/g' \ \ -e 's/[mre]/m/g' \ -e 's/[Gg]/g/g' \ -e 's/[Ppq]/p/g' \ -e 's/[Xdy]/y/g' \ -e 's/[Cc]/c/g' \ -e 's/[xu]/u/g' \ -e 's/[28]/i/g' \ -e 's/[Tta]/t/g' \ -e 's/[Hhbfvj]/h/g' \ \ -e 's/hcg/@/g' \ -e 's/htg/\$/g' \ -e 's/tyg/%/g' \ -e 's/ptg/\#/g' \ -e 's/tg/3/g' \ -e 's/cg/5/g' \ -e 's/im/7/g' \ -e 's/hm/9/g' \ -e 's/hg/1/g' \ -e 's/hu/./g' \ | count-digraph-freqs \ -v showentropy=1 \ -v chars=' muwphQEigOytc@%#$13579.' Digraph counts: TT m u w p h Q E i g O y t c @ % # $ 1 3 5 7 9 . ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- 1 . . . . . . . . . . . . . . . . 1 . . . . . . . m 312 . 17 39 5 7 6 2 5 15 35 7 4 26 1 22 10 2 4 5 53 . 14 30 3 u 1058 . 83 141 6 16 17 8 18 43 103 11 5 85 8 52 26 12 13 14 286 4 41 57 9 w 157 . 12 11 4 1 1 . 2 3 11 1 . 11 1 5 3 2 1 . 74 . 5 9 . p 113 . 16 39 . . 2 . . 1 8 3 . 30 2 3 3 . . . . 3 1 2 . h 238 . . . . 2 3 . 14 6 . 23 . 29 141 5 2 . 1 1 . . 4 5 2 Q 65 . 3 3 . . . . . 13 5 1 9 1 3 2 . . . . 5 7 9 4 . E 370 . 15 52 . 3 2 . 3 17 26 12 1 38 2 3 12 2 3 1 159 1 12 5 1 i 592 . . 184 4 4 12 2 22 14 25 10 2 49 2 52 8 4 13 8 117 17 6 32 5 g 523 . 3 22 8 6 27 6 24 62 28 4 1 30 1 85 6 4 20 7 47 1 54 65 12 O 128 . 2 5 1 . . 1 . 21 34 4 16 4 3 3 . 2 . 1 11 6 11 3 . y 77 . 10 9 . . . . 1 7 43 2 . 1 . . . . . . 2 . 1 1 . t 665 . 82 167 2 7 12 . 18 83 . 11 14 4 1 36 1 10 9 84 4 1 68 47 4 c 177 . 12 30 . 2 . 1 3 42 . 4 2 3 3 4 1 2 . 2 18 24 23 1 . @ 1056 . 4 53 26 16 33 12 93 71 32 5 5 47 . 269 23 8 16 32 72 . 72 143 24 % 261 . 2 15 7 3 11 2 23 16 5 . . 14 1 41 8 4 3 11 7 . 24 59 5 # 105 . 1 4 5 4 4 . 3 10 3 1 1 5 1 18 1 10 8 3 1 . 4 18 . $ 156 . 3 6 4 1 8 1 10 9 4 . . 5 1 34 2 2 5 7 5 . 15 31 3 1 258 . . 15 10 . 7 . 23 26 15 1 . 13 . 29 5 4 4 11 19 . 35 36 5 3 1306 1 5 61 67 25 61 30 88 69 27 4 8 58 3 252 20 19 33 46 60 . 91 255 23 5 67 . . 5 1 1 3 . 5 5 1 . . 3 . 18 5 . 1 2 3 . 7 7 . 7 613 . 27 82 3 8 14 . 7 24 43 13 4 79 2 47 37 5 6 6 121 1 41 39 4 9 959 . 13 104 4 6 14 . 8 33 63 8 5 120 1 72 84 8 15 13 203 2 72 104 7 . 109 . 2 11 . 1 1 . . 2 12 3 . 10 . 4 4 4 1 4 39 . 3 6 2 ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- ----- TOT 9366 1 312 1058 157 113 238 65 370 592 523 128 77 665 177 1056 261 105 156 258 1306 67 613 959 109 Symbol entropy: 3.999 Next-symbol probability (× 99): TT TT m u w p h Q E i g O y t c @ % # $ 1 3 5 7 9 . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 0.000 1 . . . . . . . . . . . . . . . . 99 . . . . . . . m 3.844 312 . 5 12 2 2 2 1 2 5 11 2 1 8 . 7 3 1 1 2 17 . 4 10 1 g 3.799 523 . 1 4 2 1 5 1 5 12 5 1 . 6 . 16 1 1 4 1 9 . 10 12 2 3 3.776 1306 . . 5 5 2 5 2 7 5 2 . 1 4 . 19 2 1 3 3 5 . 7 19 2 # 3.761 105 . 1 4 5 4 4 . 3 9 3 1 1 5 1 17 1 9 8 3 1 . 4 17 . 1 3.713 258 . . 6 4 . 3 . 9 10 6 . . 5 . 11 2 2 2 4 7 . 13 14 2 7 3.683 613 . 4 13 . 1 2 . 1 4 7 2 1 13 . 8 6 1 1 1 20 . 7 6 1 @ 3.660 1056 . . 5 2 2 3 1 9 7 3 . . 4 . 25 2 1 2 3 7 . 7 13 2 % 3.657 261 . 1 6 3 1 4 1 9 6 2 . . 5 . 16 3 2 1 4 3 . 9 22 2 $ 3.629 156 . 2 4 3 1 5 1 6 6 3 . . 3 1 22 1 1 3 4 3 . 10 20 2 u 3.611 1058 . 8 13 1 1 2 1 2 4 10 1 . 8 1 5 2 1 1 1 27 . 4 5 1 9 3.561 959 . 1 11 . 1 1 . 1 3 7 1 1 12 . 7 9 1 2 1 21 . 7 11 1 5 3.423 67 . . 7 1 1 4 . 7 7 1 . . 4 . 27 7 . 1 3 4 . 10 10 . Q 3.372 65 . 5 5 . . . . . 20 8 2 14 2 5 3 . . . . 8 11 14 6 . t 3.365 665 . 12 25 . 1 2 . 3 12 . 2 2 1 . 5 . 1 1 13 1 . 10 7 1 O 3.354 128 . 2 4 1 . . 1 . 16 26 3 12 3 2 2 . 2 . 1 9 5 9 2 . i 3.321 592 . . 31 1 1 2 . 4 2 4 2 . 8 . 9 1 1 2 1 20 3 1 5 1 c 3.264 177 . 7 17 . 1 . 1 2 23 . 2 1 2 2 2 1 1 . 1 10 13 13 1 . . 3.250 109 . 2 10 . 1 1 . . 2 11 3 . 9 . 4 4 4 1 4 35 . 3 5 2 E 2.924 370 . 4 14 . 1 1 . 1 5 7 3 . 10 1 1 3 1 1 . 43 . 3 1 . w 2.900 157 . 8 7 3 1 1 . 1 2 7 1 . 7 1 3 2 1 1 . 47 . 3 6 . p 2.693 113 . 14 34 . . 2 . . 1 7 3 . 26 2 3 3 . . . . 3 1 2 . h 2.171 238 . . . . 1 1 . 6 2 . 10 . 12 59 2 1 . . . . . 2 2 1 y 2.127 77 . 13 12 . . . . 1 9 55 3 . 1 . . . . . . 3 . 1 1 . ----- ----- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 3.511 9366 0 3 11 2 1 3 1 4 6 6 1 1 7 2 11 3 1 2 3 14 1 6 10 1 Previous-symbol probability (× 99): TT m u w p h Q E i g O y t c @ % # $ 1 3 5 7 9 . -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 0 . . . . . . . . . . . . . . . . 1 . . . . . . . m 3 . 5 4 3 6 2 3 1 3 7 5 5 4 1 2 4 2 3 2 4 . 2 3 3 u 11 . 26 13 4 14 7 12 5 7 19 9 6 13 4 5 10 11 8 5 22 6 7 6 8 w 2 . 4 1 3 1 . . 1 1 2 1 . 2 1 . 1 2 1 . 6 . 1 1 . p 1 . 5 4 . . 1 . . . 2 2 . 4 1 . 1 . . . . 4 . . . h 3 . . . . 2 1 . 4 1 . 18 . 4 79 . 1 . 1 . . . 1 1 2 Q 1 . 1 . . . . . . 2 1 1 12 . 2 . . . . . . 10 1 . . E 4 . 5 5 . 3 1 . 1 3 5 9 1 6 1 . 5 2 2 . 12 1 2 1 1 i 6 . . 17 3 4 5 3 6 2 5 8 3 7 1 5 3 4 8 3 9 25 1 3 5 g 6 . 1 2 5 5 11 9 6 10 5 3 1 4 1 8 2 4 13 3 4 1 9 7 11 O 1 . 1 . 1 . . 2 . 4 6 3 21 1 2 . . 2 . . 1 9 2 . . y 1 . 3 1 . . . . . 1 8 2 . . . . . . . . . . . . . t 7 . 26 16 1 6 5 . 5 14 . 9 18 1 1 3 . 9 6 32 . 1 11 5 4 c 2 . 4 3 . 2 . 2 1 7 . 3 3 . 2 . . 2 . 1 1 35 4 . . @ 11 . 1 5 16 14 14 18 25 12 6 4 6 7 . 25 9 8 10 12 5 . 12 15 22 % 3 . 1 1 4 3 5 3 6 3 1 . . 2 1 4 3 4 2 4 1 . 4 6 5 # 1 . . . 3 4 2 . 1 2 1 1 1 1 1 2 . 9 5 1 . . 1 2 . $ 2 . 1 1 3 1 3 2 3 2 1 . . 1 1 3 1 2 3 3 . . 2 3 3 1 3 . . 1 6 . 3 . 6 4 3 1 . 2 . 3 2 4 3 4 1 . 6 4 5 3 14 99 2 6 42 22 25 46 24 12 5 3 10 9 2 24 8 18 21 18 5 . 15 26 21 5 1 . . . 1 1 1 . 1 1 . . . . . 2 2 . 1 1 . . 1 1 . 7 6 . 9 8 2 7 6 . 2 4 8 10 5 12 1 4 14 5 4 2 9 1 7 4 4 9 10 . 4 10 3 5 6 . 2 6 12 6 6 18 1 7 32 8 10 5 15 3 12 11 6 . 1 . 1 1 . 1 . . . . 2 2 . 1 . . 2 4 1 2 3 . . 1 2 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TOT 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 Here is a sample of the resulting text: #9g@93$9373Egituw339t@79$9t199uiOygg@E39g3$@393yg7uu3Qi51#hcm17@9%@1#$g9393Eu31739gi%9%E3@ $t@EO@t@hpu37itu9339@@E39ug@g993iui%9ug3iu33gE31#@@@@@9u37u9gu39t@99mg79hcug73iuu3$1i393Et t9$93pt7t#Et7g7tm3.3iu3w3w9cm7ug$w313yg9mig3QiE3EOg739O93ugtmuEuO793hi37#$@9i3Qi39@9g7%Euu 7tyE@3g@E37utu7uwg7Ogp7tut.139g79@gi$#@iuu7%wE3@Eu37t9gE9u@wu3@3Q7t1@9t19739u3i3@%933@7gpu 37397tig93Eg@E339%@i@971999@9t19773hciugi@@9977g@gt1@@hc5Eu@@@@@Egg3@@@@.g73937@i3i@@@1g@i gi3@@@@iug3t9ug9t99ugi37@@@.g9umc7gi3%@@iuu1@@@9@@tu@73.3uupt7#@#pg7t9%iiut1997u37%9%EiEt@ 9u397giiiE3@ygEugE$97ut1E3t3ti@@hihci31@E37gi37u3@hOi@i3w3u3hcii@g@97EgOtm397t11i3@@@9mw%@ @9giu31ut11g7uum@uti9g9391E3QOi3w3t$9Oi3w@73g99%EitmygE3.tu97hciu$9u39t1i5@Q@9w3hcu39u39um iE397wwu33iEu39uu7393u3u31w3tEutuOu3w399tmup9@utigiu3@@@39gwutiu%9u3w3@w3tmgg39u3Q7hci@@i@ 1gg39%@@E%97.u3997u3@@9u3ughcm3%iug37Ou39977pu393wtuu39pm@Euuh@@1E#$Eug@$@E57u@ghc3@7uu3wg @@w3@ugugEg@wg93Eg@977O17@ug93@@Eg73i@g@99t1@..Oyg3.%Eghc3@@w3@u3@uupht9%#wp%%###7Oigi3hig mymtpcm9hcu3wmtmi@g3@@hci@t1@@tu1u3mgi@@umut9u@@@3$9iuc5@#@.3@3hc7mt7giQmtihc7hci@33@@7mt9 ugt7tp57%m@9m@9377ghci3Q7@3u37t97%71iu3Qu3@7773hcu@@%%.9%@@7g937itu3hcihc79mmtyiE33wm3hci3 %@@9%@@93tytu93@93hci9uOOi3w3@@3933E3w3@Ei3Q3E3@w39%%Etm9m3htig@E3Qum$9g773ucciE3@339%u3Em 3um3@73w39gtpg7muuum3%hOuu3@E3%313wmhE3E33EEmgt73@w3wmm3993E3Euggh73tmumtO7939373799339397 3E%99g7g73tu3%tOgQ@7mt1917Oghtum973739tm33933@@93#w#$%3E.tm3Q93333uE3tEti%7ug73E39%hcuutu9 3w%%93tutum3tu39uumutuhcmmugi@E33utu9tmpum3##9ghtu@1Etit#g9w3%@E3#73hc7u3ih1gE37m@E3@%@931 73$E73Et73iu3@9tugtuugtmgEu3%1g9mu9u399pm.pgg3Qu939@Q3O73%7tm@@@E33939m7%um3Qygut73@um17%@ 19g9@@i397um1tu71939mEum#7iu3@99Oug33@7773#iuuuti@@@@E39397w3utiutmti@i393E7u3wmhc7u3tiuu3 tugmg73uumiu3@E7%hc7u9u3@u3pumm.#g@ptmgE3pt7hO7pg.uii3@thc5hc7.33@ug3Qg1i3@@t73@@7@97@iu%7 9t#c#1uu$7tEi99%@@@3@hci@@Qc5%tum93E3i@Q9@@tu3@@@hc7g@O373@@uu@$7tu37373yiut7#i33$Et9%7gtu 37Oc@@@@3@iutu3@@93%hci53i573w3hc5@3@uc5@EO@w3@yg@@%Qc@i5$E3t73%put7hc7pt7@3ptt7ht@Otpui7@ t9tuu@Qc5@@3E3QygQi5@@tuti37@um393@%u3%%1iut@@u%E3@3@tEyghcut7%tii$3E3E3@iu3@3g@@E3@3Em3E3 i3@$.333t@7@E37E3u3ptugpm3$@iu3#7itu9ti7%hcug@%Eumg7%@7t97OtEm7%tu3@7%@E373@@E3itit7ti9mmg $Et7ti$itit9t1t937t9th7t1@9@939393939%.179%i9@39yg#179ggt73@E3.3E317uu7t@Et1@Q5E3tiumt1t@@ Very strange!!! Note the long strings of similar characters!!!