分类
视点 中文文章

数字:「兆」与万位分隔符

前段时间在某群里聊到了这个话题,感觉蛮有意思的,所以拿出来讲一下。即使中日韩范围里面,数字的写法其实并不尽相同。只有「一」到「一万」这一部分应该可以很安全的说是「没有异议」的。其他的地方都会或多或少的有一些歧义存在。

「兆」

这段故事还是起源于我在隔壁频道发起的一个投票:

隔壁频道的一个投票。

不知怎的那时候就想起来不同地区对于大数的处理方式的不同,于是发起了这个投票。首先需要说明一下的是,这个频道的听众主要是中国大陆的 Telegram 用户,所以各种选择也就比较偏向大陆的习惯。

从上面的结果可以看出,这里面大部分的人基本上是习惯使用大陆的各种用语用法的。

大陆称呼台灣稱呼日文称呼
国际单位制词头 M
(10^6)
(如兆赫)
或用字母 M
百萬(如百万赫)
或稱作 me
Mega(メガ)
国际单位制词头 T
(10^{12})

或用字母 T
Tera(テラ)
一个亿的一万倍
10^{12}
万亿(ちょう)
一个亿的一亿倍
10^{16}
亿亿京(けい)
各地方数字的念法,参考维基百科 [zh] 中文数字[ja] 命数法#漢数字

从上面的图表中可以看出,各地对于「兆」这个字的含义产生了分歧。基本上来说,汉字文化圈各地方对于万以内的数位称呼是没有疑虑的,都是很整齐划一的一→十→百→千→万。而到了高过万的单位,理论上讲就已经开始产生分歧了。早在古代,就有过这样的说法:

按黄帝为法,数有十等。及其用也,乃有三焉。十等者,谓「亿、兆、京、垓、秭、壤、沟、涧、正、载」也。三等者,谓「上、中、下」也。

下数者,十十变之。若言十万曰亿,十亿曰兆,十兆曰京也。
中数者,万万变之。若言万万曰亿,万万亿曰兆,万万兆曰京也。
上数者,数穷则变。若言万万曰亿,亿亿曰兆、兆兆曰京也。

《五经算术》:上数、中数、下数

自亿以上,有以十进者,如十万曰亿,十亿曰兆之类;有以万进者,如万万曰亿,万亿曰兆之类;有以自乘之数进者,如万万曰亿,亿亿曰兆之类。今立法从中数。

御制数理精蕴

也就是说,自古以来数字称呼其实分四种,分别叫做「小数」、「中数」、「大数」和「万进」。

  • 小数的规则是「十十变之」,即十万为亿,十亿为兆。
  • 万进的规则是「逢万变之」,即万万为亿,万亿为兆,万兆为京
  • 中数的规则是「万万变之」,即万万为亿,万万亿为兆,万万兆为京
  • 大数的规则是「数穷则变」,即万万为亿,亿亿为兆,兆兆为京。
系统亿
下数10^{5}10^{6}10^{7}10^{8}10^{9}10^{10}10^{11}10^{12}10^{13}10^{14}
万进10^{8}10^{12}10^{16}10^{20}10^{24}10^{28}10^{32}10^{36}10^{40}10^{44}
中数10^{8}10^{16}10^{24}10^{32}10^{40}10^{48}10^{56}10^{64}10^{72}10^{80}
上数10^{8}10^{16}10^{32}10^{64}10^{128}10^{256}10^{512}10^{1024}10^{2048}10^{4096}
各个系统中数字所代表的值,改编自维基百科

台湾和日本的规则里现在都是使用的万进法,也就是到千亿为止大家还都是一样的写法。再多一个零之后大陆的用法就开始不同了。

姑且猜测认为,可能是大陆的早期科学领域将「兆」这个字按照下数用法安插到了 10^6 上面,并且使得「兆就是百万」这个概念通过短波频率或者计算机等领域的普及而深入人心,使得其他日常应用中开始逐渐出现 10^{12} 数量级的数字之后,再去用「兆」这个字就会显得很尴尬。进而促使了「万亿」、「亿亿」这种「到『亿』封顶」的尴尬的计数系统的产生。不过具体那些「官媒」是否真的是按照这套到亿封顶的系统来计数的,由于这么大的数字在新闻媒体中实在是罕见,也就很难考证了。

另外一个有意思的地方是,虽然大陆经常有「兆字节」、「兆赫」、「兆瓦」这种称呼,摄像头的分辨率 MP(Megapixel)却是叫做「百万像素」,可能是因为「像素」并不是国际单位制衍生单位?(不过也没有单独把「百万像素」当作单位用就是了。)

至于我?我个人是比较偏向「亿、兆、京」这套万进系统的。毕竟这种单汉字带来的清爽与简洁比「万亿」、「亿亿」、「亿亿亿」什么听起来好得多。(至少不像是在唱戏)(虽然我自己也没有什么机会用到这些数字就是了)

不过回想起来,日常生活中能够用到 M/G/T 这种规模的 SI Prefix 的话,也就只有计算机的数据大小和调频收音机的频率了。有时候还有发电厂的功率(MW, megawatt),不过这个我听到的时候更少。

当时我在投票群里面提出这个问题的时候,还有人说过「遇到字节都是拼字母」云云。不知道他说话的时候是不是真的「一百二十八 em bee」这样读。

延伸阅读

这篇文章讲的和上面的内容大致相仿,但延伸出越南语较不常用的汉字词「兆(triệu)」表示「百万」的意思,以及有关于西文中「long scale」与「short scale」之间的区别。感谢 Proof of the Existence 的推荐

万位分隔符

细心的读者可能发现了,在最初的那个投票里面,所有的数字都是按照四位一组分割的。这也就是我想讲的第二个部分:「万位分隔符」。

众所周知,整个西文世界中的数字分组几乎都是三位一组的,尽管根据地区习惯或执行标准不同,使用的分隔符也不尽相同。西文中使用「千位分隔符」的一个原因是因为他们的语言是这样构成的:每一千倍都有一个名字。用英语举例:1000 是 thousand、1000^2 是 million、1000^3 是 billion 等等。

然而,并不是所有语言都是这样的。主要语言当中,只有印度、孟加拉一带,以及中日韩[1]的语言是非三位分割习惯的[2]。印度的习惯是用 …-2-2-2-3 这种分组,这也是主要语言中唯一一个变数分组的格式。而中日韩的用语习惯则是四位分组。

  • 【英语】123 123 123
    one hundred twenty-three million
    one hundred twenty-three thousand
    one hundred twenty-three
  • 【斯瓦希里语】123 123 123
    milioni mia moja na ishirini na tatu,
    elfu mia moja na ishirini na tatu,
    mia moja na ishirini na tatu
  • 【印地语】12 12 12 012
    बारह करोड़
    बारह लाख
    बारह हज़ार
    बारह
  • 【中文】1234 1234 1234
    一千二百三十四亿
    一千二百三十四
    一千二百三十四
  • 【韩文】1234 1234 1234
    천이백삼십사
    천이백삼십사
    천이백삼십사
Tarun Bansal on India's "Who Wants To Be A Millionaire?"
印度版《谁能成为百万富翁》电视节目截图,注意上面的数字是 2-2-3 分组的。YouTube

与中日韩不同的是,印度的这个分隔方法至少有被编入标准[3]并且被广泛使用。而遗憾的是中日韩并没有哪个国家把四位分隔符写入国家或是国际标准里面,相反的是,各国为了「与国际接轨」,在各自的国家标准中,尤其是在财务上,将千位分隔符定为了标准的数字格式。这里我们暂且不提这样做是否正确,以及四位分隔符是否会在金融和财务方面上产生障碍等等。单纯从数位分隔符的设计目的上来看,在中日韩语境中四位分隔符是完全说得通的。

正是因为各国都没有把万位分隔符这个概念写进标准,加之注意这种细节的人少之又少,想在各种计算机程序中加入万位分隔符支持变得比千位分隔符——甚至印度式分隔符——困难得多。以处理数字而闻名的 Microsoft Excel,想要实现四位分隔的功能也是用户根据处理位数硬编码进去[4]

中国大陆上面对于这种大数字通常是是完全不分隔,直接列出的。而台湾和日本有时会用汉字来做分隔符,来增强可读性。而这种写法中的汉字会比数字略小一些。例如:1 亿 2345  6789。

台湾选举期间的电视直播,YouTube
日本 2017 年众议院选举投票的电视转播,YouTube

个人感觉这种分隔方法比起只用符号分割的方法来说更容易理解,并且不容易和现存的千位分隔符混淆。只是这样写起来相对来说会有些麻烦。

与此同时,日本有时候也有着像 1,234 万 5,678 这种完全不能理解的写法的存在[5][6][7]。这些应该就是单纯的为了加逗号而加逗号的吧。

日本 NHK 电视台直播脱欧投票实况,下方的票数是逗号和汉字分隔混合式。来自知乎
这种神奇的计数方法的另一个例子。来自 Step-Try-Step

没想到就这么个话题我写了这么长。(其实是不知道怎么结尾了,那就这样好了。)最后提一下,不知怎的,万位分隔符好像还是没有想象中那么受欢迎的样子,不过我还是喜欢。

  1. 这里没有用「汉字文化圈」这个叫法是因为越南的数字也是三位分隔的。_(:3」∠)_[↩︎]
  2. Decimal searators — Wikipedia[↩︎]
  3. Emmons, John (2018-03-25). “UNICODE LOCALE DATA MARKUP LANGUAGE (LDML) PART 3: NUMBERS”Unicode.org.[↩︎]
  4. 引用自知乎专栏《Excel 偷懒的技术[↩︎]
  5. 『1,000万のコンマの違和感』,DonoChronicle[↩︎]
  6. 『普通預金の通帳にはいくらまで表示(記帳)できるのか?ZOZO前澤前社長の通帳残高がヤバい!』,Step-try-step[↩︎]
  7. 矢凪静桐,知乎[↩︎]

《数字:「兆」与万位分隔符》上的一条回复

发表评论

电子邮件地址不会被公开。 必填项已用*标注

*