カテゴリー
森羅 日本語記事

『初音ミクの消失』に関するプチ考察

『初音ミクの消失』はボカロ曲と出会って8年間で一番多く聞いたり、歌ったりしてる曲です。この曲は僕の成長と伴っていくつかの月日を経った。今でも、あの「信じたものは、都合のいい妄想を繰り返し映し出す鏡」は僕のサブ座右の銘的な存在担ってるんだ。

日本語能力はまだまだなので、お見苦しいところは申し訳ありません。もし良ければコメント欄でご指摘いただければ幸いです。

カテゴリー
テク 日本語記事

NLP を使わず簡単に中国語と日本語を仕分ける方法

このブログの他の記事と同じ、この記事も自分のオープンソースプロジェクトを作るときに発見したものである。音楽ライブラリーのタイトル、歌詞などのデータに読みがなをつけたいときに、中国語と日本語のテキストを区別する方法が欲しかった。ボクの音楽ライブラリーに中国語、日本語とアルファベット系の言語しかなかった。アルファベット系の言語は大した処理をいらす、簡単にソートすることができるだが、中国語と日本語はそんなに簡単ではなかった、特に漢字に対する処理の仕方が違う。

カテゴリー
テク 日本語記事

macOS と Android での音楽ライブラリーのカスタムソート順

音楽ライブラリにおいてのカスタムソート順は、かなりまれなニーズだとされている。 ほとんどの主要言語は表音文字を使って、その自然な並べ替えが Unicode での順序とほぼ同じである(場合によっては正規化は必要)。一方、表意文字(主に漢字)を使う言語では、Unicode での並び方が自然な並び方(通常は読み順)と異なる。これにより、Unicode コードポイント順で並べ替えられたリストがおかしいな順番たと見られ、調べづらくなる。したがって、音楽ライブラリ中のタイトル、アーティスト、アルバム名などのカスタムソート順は、これら一つ、または複数の言語で構成している場合に役に立つ。