メインコンテンツへジャンプする

JPNICはインターネットの円滑な運営を支えるための組織です

ロゴ:JPNIC

WHOIS 検索 サイト内検索 WHOISとは? JPNIC WHOIS Gateway
WHOIS検索 サイト内検索

ニュースレターNo.61/2015年11月発行

日本語生成パネル(JGP)のご紹介

現在、新gTLD導入プログラムにより大きく広がるトップレベルドメイン(TLD)空間に関し、TLDで国際化ドメイン名(IDN)を利用する際の文字列について規定する「ルートゾーンラベル生成ルール(Root Zone Label Generation Rules: ルートゾーンLGR)」を作ろうとする取り組みが、ICANNによって進められています。

日本語に関しても、JPNICから2015年3月18日にお知らせした※1通り、日本語生成パネル(Japanese Generation Panel ; JGP)が設立され、日本語に関するルートゾーンLGRの検討を進めています。本稿では、このルートゾーンLGRとJGPに関する動きを、順を追って説明したいと思います。

JPドメイン名におけるラベル生成ルール

そもそもラベル生成ルールとは、ドメイン名の各レベル(トップレベル、セカンドレベルなど)の文字列(これをラベルと呼びます)として、登録可能なものを定めるルールです。例えばJPドメイン名に関しては、「汎用JPドメイン名登録等に関する技術細則」で定められています。うちIDNに関しては、日本語文字だけが登録可能であり、使える文字や、文字列の長さなどが定められています。こうした技術細則の文字列ルールを具体的な事例とともに説明したページもあります。

ラベル生成ルールでは、文字の配列に関する制限を定めることもあります。例えばASCII文字の場合、先頭がハイフンで始まるものが、DNSの規格から禁じられています。また、日本語の場合、中点(・)は他に1文字以上の日本語文字を併用する必要があります。さらに、異体字(異なる見た目ながら意味や読みが同じであり、文化的背景などから同一の文字としてみなされる文字)に関して登録上の扱いを定めることもあります。

JPドメイン名の日本語ラベルでは、文字の配列に関して中点に関する制限があるのみであり、異体字に関しては定めはありません。

多言語が混在するTLD空間におけるLGR作り

上記のJPドメイン名のように、ccTLDにおけるラベル生成ルールは、そのccTLDのレジストリがその国の状況や方針に応じて定めればよいのですが、TLD空間の場合、さまざまな言語やスクリプト(文字の種類)が存在しており、グローバルに合意されたラベル生成ルールが必要です。

そこでICANNは、言語やスクリプトごとに、それを利用するコミュニティ自身が生成パネル(Generation Panel: GP)を組成して、それぞれのラベル生成ルール案を制定して、それらを整合性のある形で統合することによりひとそろいのルールにまとめ、ルートゾーンLGRとして制定することにしました。この方針に従って、日本語に関して組成したGPが、先に述べた通り、日本語生成パネル(JGP)というわけです。

ここで、世界で使用されているスクリプトの中には、複数の言語で共有されるものがあります。日本語においては、平仮名、片仮名は日本語独自のものですが、漢字は中国語や韓国語とも共有されています。

このようなスクリプトの場合、スクリプトを共有する各言語のGPが相互に連携して、矛盾がないように調整した上で、各言語のラベル生成ルールを構成することが求められています。このため、JGPは、中国語GP(Chinese GP: CGP)、韓国語GP(Korean GP: KGP)と連携する必要があります。

漢字を共有する言語での悩み

漢字を共有する中国語、韓国語、日本語の間の調整は、簡単ではありません。調整が難しいものの一つが、異体字の定義です。

言語によって異体字の定義が異なる場合、TLDラベルを申請する言語によって異体字の扱いが異なる結果となり、TLD空間の中で混乱が生じてしまいます。これを防ぐために、漢字を用いる言語の間で、統一された異体字の定義が必要になります。

中国語では、中華人民共和国で利用されている簡体字と、台湾、香港、マカオ、シンガポールなどで利用されている繁体字の二つがあることは、よく知られています。中華人民共和国では繁体字に対応する簡体字が定められており、これらは完全に置き換えられる異体字として定義され、同時に使用されることがありません。中国語では繁体字の文字列と簡体字の文字列は意味的には全く同一であるため、このように中国語ドメイン名では、異体字の定義は必要だと考えられています。

一方日本語では、新字旧字のように異体関係にあると認識される漢字は存在しますが、同時に使用されることもあり、中国語における異体字とは扱いが異なります。そのため、TLDのドメイン名として日本語を利用する際には、JPドメイン名で採用されて、10年以上の運用実績があることからも、異体字を定義しないことが、現時点で妥当だと考えられます。

中国語ルールで異体字が定義され、日本語ルールで異体字が定義されない場合を考えると、日本語と中国語の双方で意味を成し、かつ異体字を含む文字列をTLDラベルとして申請する場合、中国語で申請した場合は両方登録可能だが、日本語で申請した場合はどちらか一方しか登録できないという形で、矛盾が生じることになります。

また、さらに複雑な事情として、中国語で異体字とされるものの中に、日本語では意味が異なるものが存在します。例としては、「機」と「机」、「葉」と「叶」などがあります。日本語の場合、これらは別々の文字として、意味に応じて使い分けて利用されるべきであるところ、中国語ではこれらの文字は異体字として扱われ、どちらの意味で使う場合にも同じ字があてられます。

このように、統一されたルートゾーンLGRを設定する上で、漢字を共有する中韓日3ヶ国語すべてに影響がない方法はないので、それぞれの言語が、他の言語における影響も考慮に入れた上で、自言語における影響をできるだけ抑えるような結論を見つけるというのが、漢字を共有する三つのGPの連携によって達成されるべきことだと言えます。

まとめ

JGPでは、2014年8月29日に開催した第1回準備会合の段階から、これらの問題に関してパネル構成員全員で理解を深め、課題を抽出し、その対処を検討してきました。上に述べた漢字を共有する3言語のLGRの統合に関しては、恣意的でなく、一定の原則に沿った検討が進められるよう「言語LGR統合アルゴリズム」を考案しました。このアルゴリズムは、2015年5月15日、16日に開催された、CGP、KGP、JGPの正式合同会合※2において提案され、三者間ではこれをベースに検討を進めていくことの合意を得ることができました。

写真: 合同会合の様子
● 中日韓3ヶ国のパネルによる合同会合の様子

今後CGP、KGPとの連携や、それを経た日本語LGRの検討など作業が続きますが、適宜技術情報や検討経過などをお伝えするとともに、日本語LGRが具体化してきた段階では、皆さまのご意見をうかがう機会を設ける予定です。

JGPに関する情報は、JGP Webサイトに集積されていますので、ぜひともご参照ください。

(JPNIC インターネット推進部 前村昌紀)


※1 ICANNが新gTLD日本語ラベルのルールを検討するグループ「日本語生成パネル(JGP)」の設立を承認
https://www.nic.ad.jp/ja/topics/2015/20150318-02.html
※2 中国語/日本語/韓国語の生成パネルが正式合同会合を初開催
http://j-gp.jp/topics/20150522-01

このページを評価してください

このWebページは役に立ちましたか?
よろしければ回答の理由をご記入ください

それ以外にも、ページの改良点等がございましたら自由にご記入ください。

回答が必要な場合は、お問い合わせ先をご利用ください。

ロゴ:JPNIC

Copyright© 1996-2024 Japan Network Information Center. All Rights Reserved.