コンテンツにスキップ

「MacJapanese」の版間の差分

出典: フリー百科事典『ウィキペディア(Wikipedia)』
削除された内容 追加された内容
m 表示環境追加
機種依存文字へのリンク
232行目: 232行目:
'''区分1''' - [[Microsoftコードページ932#NEC特殊文字|NEC特殊文字]]に対応する文字が存在するもの(73字)
'''区分1''' - [[Microsoftコードページ932#NEC特殊文字|NEC特殊文字]]に対応する文字が存在するもの(73字)


シフト符号化表現で符号化すると、MacJapaneseと [[Microsoftコードページ932|Windows-31J]]、[[Shift_JIS-2004]] とでは別のコードポイントが与えられているために[[文字化け]]の原因となる。例えば「{{JIS2004フォント|⑫}}」(○で囲まれた「12」)は Windows-31J や Shift_JIS-2004 では 0x874B に割り当てられているが、MacJapanese においては 0x874B に「{{JIS2004フォント|㈹}}」(「(代)」)が割り当てられているといった具合である。[[Unicode]] においては同じコードポイントが与えられているため、文字化けは発生しない。
シフト符号化表現で符号化すると、MacJapaneseと [[Microsoftコードページ932|Windows-31J]]、[[Shift_JIS-2004]] とでは別のコードポイントが与えられているために、[[機種依存文字]]として[[文字化け]]の原因となる。例えば「{{JIS2004フォント|⑫}}」(○で囲まれた「12」)は Windows-31J や Shift_JIS-2004 では 0x874B に割り当てられているが、MacJapanese においては 0x874B に「{{JIS2004フォント|㈹}}」(「(代)」)が割り当てられているといった具合である。[[Unicode]] においては同じコードポイントが与えられているため、文字化けは発生しない。





2014年4月3日 (木) 05:07時点における版

MacJapanese または Mac OS Japaneseは、アップルShift_JISを独自に拡張した文字コードである。

主にMac OSのバージョン 7.1からバージョン 9.xまでの間で利用された。

対応する文字コード

MacJapaneseはIANAによって登録されていない。そのためRFC 2045の§ 6.3に従って、XMLMIMEなどでは "x-Mac-Japanese" という名称がこの文字コードの名前として使われている(アップル製であるiPodもこの名前を認識する[1])。

また、MacJapaneseをUnicodeにマッピング(対応付け)した上で、 Unicode用の文字符号化方式UTF-16UTF-8など)を使って符号化する方法もあり、Mac OS X のファイル名などにはこの方法が使われている。ただし、MacJapanese固有の文字を私用領域 (Private Use Area) のU+F860、U+F861、U+F862、U+F87A、U+F87E、U+F87Fを使って表現するので、Mac OS X以外の環境との互換性は無い。

歴史

文字セット

以下、「0x」を数字の先頭に付けた十六進法表記を用いて各文字のコードを表す。

0x00から0x7Fまでと0xA1から0xDFまでの部分(いわゆる半角文字の部分)はJIS X 0201に準ずる。ただし0x7EにはASCIIに倣ってU+7Eのチルダが割り当てられている。

次の記号が追加されている。

  • 0x80 …… U+5C reverse solidus (= backslash)、半角バックスラッシュ\」(ASCII の0x5Cと同じ)
  • 0xA0 …… U+A0 no-break space、ノーブレークスペース (NBSP)
  • 0xFD …… U+A9 copyright sign、著作権記号「©」(○で囲まれた「C」)
  • 0xFE …… U+2122 trade mark sign、商標記号「」(「TM」)
  • 0xFF …… halfwidth horizontal ellipsis、半角の欧文用三点リーダー(半角幅の「...」)

2バイトで表される文字(いわゆる全角文字)はJIS X 0208-1990を基にしている。さらに0x8540から0x886Dに「Apple標準システム外字」(記号など)が、0xEB41から0xED96までに縦書き用の文字が追加されている。Apple標準システム外字のうちUnicodeに対応している文字には次のようなものがある。

文字 内容   文字 内容   文字 内容
○で囲まれた1   ○で囲まれた11   ●で囲まれた白抜きの1
○で囲まれた2 ○で囲まれた12 ●で囲まれた白抜きの2
○で囲まれた3 ○で囲まれた13 ●で囲まれた白抜きの3
○で囲まれた4 ○で囲まれた14 ●で囲まれた白抜きの4
○で囲まれた5 ○で囲まれた15 ●で囲まれた白抜きの5
○で囲まれた6 ○で囲まれた16 ●で囲まれた白抜きの6
○で囲まれた7 ○で囲まれた17 ●で囲まれた白抜きの7
○で囲まれた8 ○で囲まれた18 ●で囲まれた白抜きの8
○で囲まれた9 ○で囲まれた19 ●で囲まれた白抜きの9
○で囲まれた10 ○で囲まれた20  
  • 丸括弧附き数字
文字 表記   文字 表記   文字 表記   文字 表記   文字 表記
(1)   (5)   (9)   (13)   (17)
(2) (6) (10) (14) (18)
(3) (7) (11) (15) (19)
(4) (8) (12) (16) (20)
  • ドット附き数字
文字 表記   文字 表記   文字 表記
1.   4.   7.
2. 5. 8.
3. 6. 9.
文字 表記   文字 表記   文字 表記   文字 表記   文字 表記   文字 表記
I   V   IX   i   v   ix
II VI X ii vi x
III VII XI iii vii xi
IV VIII XII iv viii xii
  • 丸括弧附きアルファベット小文字
文字 表記   文字 表記   文字 表記   文字 表記   文字 表記   文字 表記   文字 表記
(a)   (e)   (i)   (m)   (q)   (u)   (y)
(b) (f) (j) (n) (r) (v) (z)
(c) (g) (k) (o) (s) (w)  
(d) (h) (l) (p) (t) (x)
  • 単位記号
文字 表記   文字 表記   文字 表記   文字 表記   文字 表記   文字 表記   文字 表記
mm   cm   km2   ml   ms   °F   KB
mm2 cm2 mg dl μs mb MB
m2 cm3 kg l ns HP GB
m3 km cc kl ps Hz  
  • アルファベットの組文字
文字 表記   文字 表記   文字 表記
No.   K.K.   TEL
文字 内容   文字 内容
スペード記号   白抜きスペード記号
ハート記号 白抜きハート記号
ダイヤ記号 白抜きダイヤ記号
クローバー記号 白抜きクローバー記号
  • その他記号
文字 内容   文字 内容   文字 内容
顔郵便マーク   黒電話   JISマーク
  • 矢印記号
文字 内容   文字 内容   文字 表記
指さし矢印上   白抜き矢印上   ↑↓
指さし矢印下 白抜き矢印下
指さし矢印左 白抜き矢印左
指さし矢印右 白抜き矢印右  
  • 丸括弧附き漢字
文字 表記   文字 表記   文字 表記   文字 表記   文字 表記
(日)   (金)   (至)   (名)   (特)
(月) (土) (代) (有) (監)
(火) (祭) (呼) (学) (企)
(水) (祝) (株) (財) (協)
(木) (自) (資) (社) (労)
文字 内容   文字 内容   文字 内容   文字 内容
○で囲まれた上   ○で囲まれた左   ○で囲まれた財   ○で囲まれた印
○で囲まれた中 ○で囲まれた右 ○で囲まれた優 ○で囲まれた秘
○で囲まれた下 ○で囲まれた医 ○で囲まれた労  
文字 表記   文字 表記   文字 表記   文字 表記
ミリ   ヘクタール   ミリバール   ハイツ
キロ リットル ページ ビル
センチ ワット アパート フィート
メートル カロリー インチ ヘルツ
グラム ドル キログラム ホーン
トン セント キロメートル マンション
アール パーセント コーポ ヤード
株式会社  
  • 数学記号
文字 内容   文字 内容   文字 内容
閉曲線積分
(閉路積分・周回積分)記号
  直角記号   直角三角形
文字 内容   文字 内容
始めダブルミニュート
日本語用の「“」
  終わりダブルミニュート
日本語用の「”」
  • 濁点附きのひらがな・カタカナ
文字 表記   文字 表記   文字 表記   文字 表記   文字 表記
う゛   ワ゛   ヰ゛   ヱ゛   ヲ゛

縦書き用文字には、括弧などの記号を回転させたものと、句読点小書きの仮名を右上に寄せたものがある。「︰」(二点リーダ)、「︙」(三点リーダ)、「︵」「︶」(括弧)、「︻」「︼」(すみ付き括弧)など。三点リーダは U+FE19 に収録されているが、MacJapaneseのコードポイントとは異なり、互換性はない。

これらは、DTPなどの縦書きに対応したアプリケーションで縦書き表示をする際に、本来の文字コードを変換してQuickDrawの描画APIに渡すために使われたものである。通常、情報交換に使われることはない。

他の文字コードとの対応

全角文字に関しては、縦書き用文字を別にすると、次のように区分できる。


区分1 - NEC特殊文字に対応する文字が存在するもの(73字)

シフト符号化表現で符号化すると、MacJapaneseと Windows-31JShift_JIS-2004 とでは別のコードポイントが与えられているために、機種依存文字として文字化けの原因となる。例えば「」(○で囲まれた「12」)は Windows-31J や Shift_JIS-2004 では 0x874B に割り当てられているが、MacJapanese においては 0x874B に「」(「(代)」)が割り当てられているといった具合である。Unicode においては同じコードポイントが与えられているため、文字化けは発生しない。


区分2 - NEC特殊文字に対応する文字が存在せず、JIS X 0213に対応する文字が存在するもの(53字)

区分1と同じく、Shift_JIS-2004で表現するとMacJapaneseとは別のコードポイントが割り当てられているため、文字化けの原因となる。


区分3 - NEC特殊文字にも JIS X 0213 にも対応する文字が存在せず、Unicodeに対応する文字が存在するもの(109字)

Unicodeのエンコーディング(UTF-16UTF-8など)を用い、対応する文字のグリフが存在するフォントを利用すれば、正常に情報交換することができる。仮にMacJapaneseを用いて情報交換し、Unicode に変換しようとした場合には、「Unicode と MacJapanese の変換テーブル」を使わないと変換することができない。


区分4 - NEC特殊文字にも JIS X 0213 にも対応する文字が存在せず、Unicodeでは文字合成で表す必要があるもの(3字)

囲み文字であり、記号用ダイアクリティカルマークU+20DDを用いた文字合成で表現するか、CSSOpenType feature tagで表現する。そのため、対応していないOS・フォントやアプリケーションで表示しようとしても、合成されるべきところが合成されずに表示される[2]。文字一覧を下記に記す。文字のうち、左は文字合成、右はCSSのOpenType feature tagを使用したもの。

文字 Unicode 内容   文字 Unicode 内容   文字 Unicode 内容
大⃝ U+5927
U+20DD
○で囲まれた大[2]   小⃝ U+5C0F
U+20DD
○で囲まれた小[2]   控⃝ U+63A7
U+20DD
○で囲まれた控[2]

区分5 - NEC特殊文字にもJIS X 0213にもUnicodeにも対応する文字は存在しないが、同型・同用途の文字がUnicodeに存在するもの(7字)

Unicodeのエンコーディングと対応するフォントを用いて情報交換することはできるが、コードポイントは別であり、MacJapanese との互換性は無い[3]。なお、MacJapanese で入力[4]した場合に Unicode へ変換するならば区分7に準ずる。Unicode のコードポイントにある同型の文字一覧を下記に記す。

文字 Unicode 内容   文字 Unicode 内容・表記
U+2B06 黒塗り矢印上[3]   🄀 U+1F100 0.[3]
U+2B07 黒塗り矢印下[3] U+213B 組文字・FAX[3]
U+2B05 黒塗り矢印左[3] U+21F5 ↓↑[5]
U+27A1 黒塗り矢印右[3]

区分6 - NEC特殊文字にもJIS X 0213にもUnicodeにも同用途の文字は存在しないが、同型の文字がJIS X 0213やUnicodeに存在するもの(2字)

区分5と同様に、別のコードポイントに同型の文字があるもの。この同型の文字は、MacJapaneseおよびJIS X 0213やUnicodeに収録されている。共に全角ラテン文字。なお、MacJapanese で入力した場合に Unicode へ変換するならば区分7に準ずる。Unicode のコードポイントにある同型の文字一覧を下記に記す。

文字 Unicode 内容   文字 Unicode 内容
U+217F メートル記号   U+210A グラム記号

区分7 - NEC特殊文字にも JIS X 0213にもUnicodeにも対応する文字が存在せず、同型・同用途の文字がUnicodeにも存在しないもの(9字)

文字合成を行なったり異体字タグを利用したりして表現することになる。そのためにUnicodeの私的領域であるU+F860、U+F861、U+F862、U+F87A、U+F87E、U+F87Fを使っている。したがって、MacJapaneseに対応していないフォントやアプリケーションで表示しようとしても、合成されるべきところが合成されずに表示されたり、異体字となったりする[4]。文字一覧を下記に記す。なお、印は、CSSのOpenType feature tagで表示可能。

記号 Unicode表記 内容   記号 Unicode表記 内容   記号 Unicode表記 内容
U+F862
U+6709
U+9650
U+4F1A
U+793E
組文字・有限会社   XIII U+F862
U+0058
U+0049
U+0049
U+0049
ローマ数字13大文字   xiii U+F862
U+0078
U+0069
U+0069
U+0069
ローマ数字13小文字
U+F862
U+8CA1
U+56E3
U+6CD5
U+4EBA
組文字・財団法人 XIV U+F861
U+0058
U+0049
U+0056
ローマ数字14大文字 xiv U+F861
U+0078
U+0069
U+0076
ローマ数字14小文字
TB U+F860
U+0054
U+0042
単位・テラバイト XV U+F860
U+0058
U+0056
ローマ数字15大文字 xv U+F860
U+0078
U+0076
ローマ数字15小文字

Mac OS X での対応

Mac OS Xにおいては、MacJapaneseは「Shift_JIS (Mac)」(文字パレット)あるいは「日本語 (Mac OS)」(テキストエディット)と表現される。

また、Mac OS X附属のフォントではOsakaのみがMacJapaneseに完全対応している。ヒラギノはUnicodeとCIDに対応しているため、Unicodeを扱えるアプリケーション上ではUnicodeに対応する文字が存在しない18字(上記の区分5-7)を除いてMacJapaneseの文字を表示できる。一方、CID を扱えるアプリケーション上でヒラギノを使う場合には、halfwidth horizontal ellipsis (半角三点リーダー)以外の文字を全て表示できる。

iPod での対応

脚注

  1. ^ iPod 2.0: 日本語、韓国語、繁体字中国語、簡体字中国語で作成されたテキストファイルを表示する方法
  2. ^ a b c d Mac OSMac OS Xであれば標準の環境なら正しく表示されるが、Windowsでは合成に対応したフォントが少ないのが現状。無料導入できるものは和田研フォントをベースにしたものがあり、和田研細丸ゴシック Wiki - SourceForge.JPの下部にて「和田研細丸ゴシックProN」がダウンロード可能。他にも、にしき的フォントにある手書きのポップ体「Nishiki-teki」が対応している。
  3. ^ a b c d e f g UnicodeでARIB外字を扱えるフォントなどが表示に対応している。無料導入できるものは和田研フォントをベースにしたものがあり、和田研細丸ゴシック Wiki - SourceForge.JPの下部にて「和田研細丸ゴシック2004絵文字、和田研中丸ゴシック2004絵文字」がダウンロード可能。旧バージョンの「和田研細丸ゴシック2004ARIB、和田研中丸ゴシック2004ARIB」も対応。
  4. ^ a b Mac OS X では通常の変換でリストに出てこないため、過去の文章との互換性を保つ目的と思われる。
  5. ^ 無料で導入できるフォントで表示に対応しているものは、Y.Oz Voxにある「YOzFont」や、Unicodeフォントの「Code2000」、にしき的フォントにある手書きのポップ体「Nishiki-teki」などがある。

関連項目

外部リンク