[闲聊日语]86
(86)如何破译比较复杂的日文密码
我曾写过一个帖子,叫做《如何破译简单的日文密码》,发表后,先后收到三位对此感兴
趣的朋友的邮件,他们认为,我介绍的那个方法,是根据日文罗马字的字母,在正文中出
现的概率,来破译密码,这种方法,现在已经不常见了。他们问我,能否介绍一下日文单
词,在正文中出现的概率,因为用这种方法破译密码,更常见一些。
有些朋友可能对"单词概率"这个词,不太理解,我先简单解释一下。比如你手头有一份日
文加密电文,用我以前那个帖子的方法,破译不出来,但你发现,电文中,经常出现 qkr
vst 这个单词,虽然你不知道它的意思,但你可以猜到,它肯定是日语中一个很常用的单
词,比如"する"。假如我们事先知道,在日语文章中,哪个单词出现次数最多,哪个其次
,哪个再其次,等等等等,那我们就有办法,将电文中经常出现的那些单词破译出来。这
就是所谓的"单词概率"。
日本有一个语言学研究机构,曾经作过一个重要的实验,找 7 个不同地区、性别、年龄、
职业的日本人,把他们在 6 个小时之内所说的话,全部记录下来,然后用计算机统计,发
现总共有 5000 多个不同的单词,其中出现概率最高的 20 个单词,依次是:
(1)いう (2)うん (3)する (4)いる (5)ない (6)ええ (7)ある (8)これ (9)そう (10)よ
い (11)はい (12)あの (13)こと (14)なに (15)ああ (16)さん (17)で (18)お (19)その
(20)この
不过,这个统计结果,口语性太强,比如口语中常用的几个感叹词"うん、ええ、ああ"等
,都在里面,而在书面语中,这些感叹词,是很少出现的,所以该机构又用类似的方法,
找了几本不同的杂志,挑了几篇不同的文章,又进行了一次书面语的单词概率统计,结果
依次是:
(1)する (2)なる (3)いる (4)いう (5)ある (6)もの (7)くる (8)一 (9)その (10)こと
(11)この (12)よう (13)みる (14)それ (15)よい (16)十 (17)ない (18)三 (19)二 (2
0)これ
您稍微比较一下,就可以发现,书面语中经常出现的单词,与口语有很大的区别。考虑到
日语加密电文,一般应为书面语,所以用后面这个概率表进行破译,比较合理一些,也就
是说,前面那个奇怪的单词 qkrvst,如果没有特殊情况,应当是"する"。
- 相关热词搜索: 闲聊日语
- 上一篇:日本历史上的今天(01月16日)
- 下一篇:[闲聊日语]87