ニュースレターNo.18/2000年12月発行
3 特集 English Page
3-2 日本語ドメイン名の実現について
(IDN-TF)
日本語ドメイン名とは
日本語ドメイン名は汎用JPドメイン名(本紙特集3-1参照)の一部であり、JPドメインの第2レベルのラベルとして、従来の英数字とハイフンに追加して漢字や仮名などを使用できるようにしたものです。すなわち、汎用JPドメイン名のうち、第2レベルに漢字や仮名など日本語として使われる文字を含むドメイン名が日本語ドメイン名です。以下に、日本語ドメイン名の例を示します。
日本語ドメイン名.JP
日本語ドメイン名は、JPNICがドメイン名の階層構造や名前空間を新たに創るものではなく、従来のドメイン名に、使用できる文字を追加する、多言語ドメイン名の技術を使用して実現しています。
多言語ドメイン名の標準化動向
多言語ドメイン名(Multilingual Domain Name)の技術は、IETF(InternetEngineering Task Force)のIDN WG(Internationalized Domain Name Working Group)で標準化作業が進められています。多言語ドメイン名は、ドメイン名の国際化技術の一つであり、従来のドメイン名に使用できる文字を追加するものです。
IDN WGは2000年2月に設立されたばかりの新しいWGであり、標準化の作業を積極的に進めていますが、まだRFC(Request For Comments、インターネットの標準を規定する文書)の発行には至っていません。
IDN WGの現在の作業状況は、
- 現在のDNSの使用法と管理に影響を与えないこと
- 場所を問わずどのようなシステムでも名前解決ができるDNSであり続けること
の基本方針のもと、
-
国際化ドメイン名の要求条件(Requirements)のまとめ
→結果はInformational RFC化を目標 -
DNS(Domain Name Service)プロトコル上での多言語ドメイン名の表現方式
→結果はStandard track RFC化
を行っているところです。
DNSプロトコル上での多言語ドメイン名の表現方式は、現在以下の方針で検討が進んでいます。
- 文字セットはUnicode(ISO/IEC 10646)のUCS(Universal Multiple-Octet Coded Character Set)を使う
- 既存のDNSとの互換性を維持するため、現在ドメイン名として使用が許されている文字(ASCII文字)のみで多言語ドメイン名を表現するASCII Compatible Encoding方式(以下、ACE)を使用する
- 多言語ドメイン名の正規化(全角・半角文字や大文字・小文字の統一など)はACEに変換する前に行う
これにともない、正規化ルールの検討も進んでいます。表現方式と正規化ルールについては、IDN WGの中に特別チームが編成され、現在提案されている方式について詳細な検討が進められることになりました。
多言語ドメイン名の標準化動向については、今後も定期的に報告していきます。
JPNICの方針
多言語ドメイン名に対するJPNICの取り組み方針は、2000年2月25日にJPNIC Webページで公開しました「多言語ドメイン名に対するJPNICの取り組み(案)」
http://www.nic.ad.jp/jp/topics/archive/20000225-01.html
から変更はありません。取り組み方針で述べている導入の条件概略は以下のとおりです。
-
技術的、管理的な条件
- インターネット全体で整合性のあるZLD※またはこれに代わる多言語ドメイン名空間のスキーマが決定されていること
- DNSプロトコル、特に文字コードシステムが決まっていること
- トップレベルドメイン名の多言語化については、gTLD、ccTLD全体での合意とルールがあること
-
実装に関する条件
- 技術的な条件を満たした標準的なDNSサーバ(例: BIND)の実装があること
-
運用上の条件
- 非日本語ユーザーへの配慮。非日本語ユーザーのために、日本語ドメイン名に対応するアルファベットのドメイン名を確保するなどの配慮が必要となる
- 商標権に関連した紛争が多発する可能性があり、そのための解決手段が用意されている必要がある
取り組み方針を公表してから半年以上経過し、以下のように条件は満たされてきています。
-
- 識別子を持つACEの提案により、既存のドメイン名空間で多言語ドメイン名を表現できるようになった
- UCSの採用がほぼコンセンサスとなった
- 既存のドメイン名空間で多言語ドメイン名を表現できるようになり、TLDの多言語化は長期的な課題になった
-
- ACEの提案により、既存のDNSで運用できる
-
- ACEの提案により、ドメイン名が多言語非対応の端末でも表示できないということはなくなった
-
「JPドメイン名紛争処理方針」が発効された
http://www.nic.ad.jp/jp/regist/dom/drp/
この状況を鑑み、JPNICでは2000年10月10日にJPNIC Webページで公開しました
「汎用JPドメイン名における日本語ドメイン名に関する技術方針」
http://www.nic.ad.jp/dotjp/doc/tech-policy.html
で述べた方針にしたがって、日本語ドメイン名の試験運用を開始することとしました。技術方針で述べている、採用する技術の条件概略は以下のとおりです。
- IETF IDN WGの方針に従う
- 多言語ドメイン名を実現する方式として、ZLDを必要とする方式は採用しない。これは、当該方式がドメイン名空間の分断を招く恐れがあるからである
- 既存のDNSおよびアプリケーションに与える影響を最小限にするため、DNSプロトコル上での文字エンコーディングとしてACEを採用する。ただし、通常のASCII文字列と区別がつかず、ZLDを必要とするACEは採用しない
- 運用試験期間中のACEとしては、RACE(Row-based ACE)を採用する
- JPゾーンのネームサーバに、日本語ドメイン名を設定するリソースレコードはNSとする。
また、日本語ドメイン名の登録に関しては2000年11月2日に公開しました「汎用JPドメイン名登録等に関する技術細則」
http://www.nic.ad.jp/dotjp/doc/saisoku-1.html
で使用可能な文字、文字数、正規化ルール(表記もしくは意味的に同一の文字が異なる文字として区別されないよう統一する処理)を規定しています。それらの概略は以下のとおりです。
-
使用可能な文字
第一水準漢字、第二水準漢字、平仮名、片仮名、以下の7つの記号
「・」「ヽ」「ヾ」「ゝ」「ゞ」「々」「ー」
上記に加え、英字、数字、ハイフン(ハイフンは文字列の先頭もしくは末尾では使用不可) -
使用可能な文字数
1文字以上15文字以下
(1文字以上漢字、仮名、記号が含まれる場合)
3文字以上63文字以下
(すべての文字が英字、数字、ハイフンのみからなる場合) -
正規化ルール
英数字はASCIIに統一
仮名は全角に統一
日本語ドメイン名の表現方式について
前述のとおり、運用試験中の日本語ドメイン名は、RACEを採用します。
RACEはUCSのエンコーディング方式の一つであるUTF-16をベースにしたACEで、以下の特徴をもちます。
- ACE識別子をもつ
(RACEバージョン3では、BQ--というプリフィックス。BQの大文字小文字の区別はない) - Row-baseの圧縮アルゴリズムをもつ
(文字コードが特定の範囲に収まっている場合、共通のビットパターンをくくりだす方式)
RACEによる日本語ドメイン名の表現例を以下に示します。
日本語ドメイン名.JP
↓
BQ--3BS6KZZMRKPDBSJQ4EYKIMHTKQGQ.JP
混在EXAMPLE.JP
↓
BQ--3BW7OVZIABCQAWAAIEAE2ACQABGAARI.JP
ABCカンパニー.JP
↓
BQ--GD7UD72C75B2X46RZP6A.JP
JPNICでの運用試験について
JPNICでは、前述の「汎用JPドメイン名における日本語ドメイン名に関する技術方針」にしたがって、2段階の日本語ドメイン名運用試験を行う予定であり、11月6日から日本語ドメイン名運用試験(フェーズ1)を開始しています。フェーズ1についての詳細はJPNIC Webページ
http://www.nic.ad.jp/jp/research/idn/index.html#phase1
をご参照ください。
それぞれのフェーズの概略は以下のとおりです。
-
フェーズ1:
JPゾーンのネームサーバにJPNICが実験用に予約した日本語ドメイン名を設定し、既存システムとの相互運用性確認試験を行う。このフェーズでは、多言語ドメイン名システムへのアクセスを先行して評価するための試験環境を提供する -
フェーズ2:
汎用JPドメイン名として利用者から登録された日本語ドメイン名をJPゾーンのネームサーバに設定し、総合運用試験を行う。このフェーズでは、多言語ドメイン名システムを参照する各種アプリケーションの対応や、多言語ドメイン名の普及を促進する
フェーズ2の開始は、2001年4月2日を予定していますが、変更される可能性がありますのでご了承ください。フェーズ2は、IETF IDN WG で多言語ドメイン名の文字エンコーディング標準化(Proposed Standard RFC化)が終了するまで継続する予定です。
日本語ドメイン名が使えるとはどういうことか
現在JPNICが提供している多言語ドメイン名評価キット(以下、mDNkit)は、多言語化されたドメイン名のDNSによる名前とアドレスの相互変換の問題を解決するためのテスト環境を提供しています。そのため、各アプリケーションで日本語ドメイン名が使えるような環境が必ずしも実現できるわけではありません。以上のことを踏まえて、日本語ドメイン名が使えるとはどのようなことかを概観します。
telnet 日本語ドメイン名試験.jp
ftp 日本語ドメイン名試験.jp
foo@日本語ドメイン名試験.jp
http://ウェブサーバ.日本語ドメイン名試験.jp/
のような使い方ができるのは容易に想像できると思います。
しかしながら、ドメイン名はさらに多くの場面で使われます。たとえば、現在の多くのUNIXシステムにおいて、
% hostname
host.example.co.jp
のように、DNSとは割と関係ない部分で使われる場合もあります。ドメイン名に日本語が使えるとは、このようなすべての局面で日本語が利用できるようになることが理想的です。しかし、現実にはなかなかそうはならないかもしれません。特に、hostnameのような場合は、OSに依存するわけですから、OS内部が国際化対応されていなければお手上げとなります。
mDNkitはとりあえず、後者のような例は取り扱わずに、前者のような例を取り扱っています。おそらく、一般ユーザーにとって、日本語ドメイン名が使えるということの大部分は前者のような局面でドメイン名が日本語となっていることを想定していると考えています。
しかし、現状では前者の場合においても、アプリケーションが日本語ドメイン名に対応しなければ、利用することはできません。mDNkitはアドホックな手法で、アプリケーションの名前とアドレスの解決問題に関する解を提供していますが、一般ユーザーには不満な点が多々あると思います。たとえば、現状では、電子メールのようなプロトコル内にメールアドレスが強くバインドして使われているような局面ではmDNkitは無力です。このような場合は、メールシステム全体の抜本的な対策が必要となります。もちろん将来、アプリケーション側の対応が進めば、最初に記したように通常ドメイン名が利用できる種々の局面で日本語ドメイン名が使えるようになることでしょう。
しかし、それでもまだ不満は残ります。たとえば、電子メールの場合、
foo@日本語ドメイン名試験.jp
のfooの部分はどうするかということです。この部分を日本語化する場合は、同時にメールサーバのアカウントそのものの日本語化という別の側面が登場します。もちろん、アカウントを日本語化することは、ときによりUNIXやWindows NTなどのユーザ名を日本語化することを含むかもしれません。
また、
http://ウェブサーバ.日本語ドメイン名試験.jp/お知らせ.html
のような、URLのパス名の問題もあります。パス名は、前述したhostnameと同じくOS依存部分(IDも同じ)となります。したがって、OS全体の日本語化という問題が大きく横たわってきます。たとえば、ID程度の問題であれば、日本語名と対応したIDへの変換規則があれば事足りるかもしれませんが、ドメイン名の日本語化以上に難しいかもしれません。
さらにいえば、
誰か@日本語ドメイン名試験.jp
のようなデリミタ問題(どうせなら、デリミタも日本語にしたい)や、
誰か@日本語ドメイン名試験。日本
のような、トップレベルドメイン名問題等も含みます。一般ユーザーにとり、理想的な姿は、最後の例かもしれませんが、JPNICではデリミタの日本語化には慎重な姿勢で望みたいと思っています。なぜなら、デリミタの問題はアプリケーション依存が強く、アプリケーションごとに動いたり動かなかったりする可能性があります。では、デリミタの標準化ができるかといえば、これは完全にローカルな問題なので、国際的な標準ができるとは思えません。
トップレベルドメインの問題はインターネット全体の整合性の中で議論されるべきであり、現状ではいかんともしがたい問題です。
このように、たとえばアドレス記述としての全体的な日本語化の問題は波及効果が大きく今すぐ一般ユーザが使えるレベルにはありません。現在ではようやくドメイン名の日本語化(正確には多言語化)の部分の標準が決まりつつある段階ですので、一般ユーザーが最初に示したような形でドメイン名が使えるようになりつつあるというのが現状でしょう。
多言語ドメインに関する技術解説
JPNICでは「多言語ドメインに関する技術解説」のWebページを公開しています。ここで述べた技術情報や試験環境などについて解説、関連情報へのリンク掲載していますので、合わせてご参照ください。
http://www.nic.ad.jp/jp/research/idn/
※ ZLD: Zero Level Domain、ドメイン名が多言語ドメインであることを識別する、利用者からは隠蔽される特別なトップレベルドメイン