人名等でよく使われる文字で、通常の文字とちょっと違うけれどどこか見慣れた文字、そんな漢字がいくつかあると思います。例えば、俗に言う「はしご高」「立つ崎」などが有名ですね。 しかし、これらの文字はそれぞれどうやって入力・表示させるのかいまひとつわからない、そんな方、いるのではないでしょうか。
今回の外字・フォントがテーマのブログ、これらの文字について実際の文字コードや、関係のある文字の規格について説明してみました。
●文字コードは?
まずそれぞれの文字について、まずパソコンで使う際の文字コードを確認してみましょう。
「はしご高」 Shift-JISでは、「高」が0x8D82、「はしご高」が0xFBFCとなります。 Unicodeでは、「高」がU+9AD8、「はしご高」がU+9AD9となります。
「立つ崎」 Shift-JISでは、「崎」が0x8DE8、「立つ崎」が0xFAB1となります。 Unicodeでは、「崎」がU+5D0E、「立つ崎」がU+FA11となります。
パソコンの一般的な2つの文字符号化方式、Shift-JISとUnicodeでいずれも定義されていて、使用するのに問題なさそうです。それではどうして、これらの文字は、使える・使えないが話題になるのでしょうか?
●Windowsでは元々使えた?
少し時代をさかのぼってみましょう。Windowsで昔から使われていた文字コード方式は、Shift-JISと呼ばれます。この中で「高」はもちろん第一水準のエリアですが、「はしご高」は実は別のグループ、「IBM拡張文字」というまとまりの1つの文字に含まれていました。いわば拡張文字や準外字のような扱いと言ってもよいでしょう。
これら、「はしご高」「立つ崎」は、Windowsで使っている限り従来から表示できる文字だったと言えます。ただ、その頃の別の種類のコンピュータのシステム、例えばMacOSには含まれない文字だったので、もし2つのOS間でテキストを受け渡した際にこれらの文字が入っていた場合は、表示できなかったり文字化けしたりすることがありました。
●環境依存文字
こういった文字のことは、「環境依存文字」や「機種依存文字」と呼ばれています。使用する環境や機種によって表示できる場合とできない場合がある文字、ということなのです。 以前はこのように、コンピュータのシステム=OSによって、採用されている文字コードの規格がそれぞれ決まっており、使える文字に違いがあったため、異なるOS間のテキストデータの互換性には注意が必要だったというわけです。 そのせいか環境依存とされている文字は、IMEなどの文字変換で表示されないようになっていたことが多かったようです。現在はこれらの文字も候補として表示されるようになり、その際は変換候補の横に「環境依存文字」と表示され、わかりやすくなっています。
●文字セット・フォントによる違いも
今現在は、多くのOSでUnicodeが主流になり、文字セットの体系が問題となることは少ないように思います。その代わり、今度はフォントそのものが対応しているかが関係してくるようになりました。
フォントにどんな文字が含まれているかは、どの文字集合で作られているかによります。文字集合というのは例えばJIS X0208やJIS X 0213などのように規格で定められた文字の集まりで、含まれる文字の種類や数といった仕様が異なります。
例えばShift-JISに対応して作られたフォントでは7000文字弱が含まれますが、その後JIS X 0213-2004という規格で作られたフォントでは、収録数11,000字前後となり、かなりの差があります。また、公共的な事業によって作られたIPAmj明朝というフォントでは約6万字も含まれています。
●まとめ
JIS第一水準・第二水準と呼ばれる文字の範囲を使う分には、文字セットやフォントに気を使うことはほとんどないでしょう。ただし、通常とちょっと違う文字=異体字を出そうとするときには、自分の使っているパソコンで表示できる文字なのか、そして環境依存文字で他のパソコンと共有できない文字なのか、そのあたりを気にする必要があります。
文字コード規格やフォントは、時代とともに進化し、使える文字も格段に多くなりました。ただし、やはりOS環境やフォント種類など様々な条件があり、全てで同じように使えるわけもありません。かえって使える文字、使えない文字の判断が難しくなってきたと言っても過言ではないでしょう。
なお、人名用の異体字を多く使うのであれば、初めから自分の環境でしか使えない文字と考えて、人名専用の外字製品を使うのも一つの手です。イーストの人名外字シリーズは、人名用の異体字がまとまって外字として収録されているので、文字が探しやすく使いやすいものです。外字ソフトについてはイーストまでお気軽にお声がけください。