Tag: 中文

  • 中西文混合排版中标点符号的渲染

    中西文混合排版中标点符号的渲染

    从内容提供者、渲染工具和字体三方面来看中英混排中标点符号的处理。

  • 一种简单粗暴无需 NLP 的区分中文和日文文本的方法

    和博客里其他大多数的文章一样,这篇文章也是来自我平时开发个人项目时候的发现。在处理我的音乐库、歌词和其他数据的标音时,我需要一种简单的方式来区分中文文本和日文文本。因为我的曲库里面基本上只有中文、日文和其他拉丁字母构成的语种。而那些拉丁语种不需要太多复杂的处理就能够直接自然的排序,而中文和日文就没有这么简单,尤其是两种语言在对汉字的处理上有着截然不同的方法的时候。