JPドメイン名のサービス案内、ドメイン名・DNSに関連する情報提供サイト
JPRS トピックス&コラム No.025
トップレベルドメイン(TLD)に登録できるラベルの文字に関するルールである、「ルートゾーンLGR」の作成背景や作成プロセス、ルール概要、日本語ラベルのルールについて解説します。
日本語ラベルのルールを含む「ルートゾーンLGR(Root Zone Label Generation Rules)」の第5版が、ICANN(*1)から2022年5月26日に公開されました(*2)。
ルートゾーンLGRは、トップレベルドメインのラベルの文字(英字や英字以外も含む)に関するルールを定めたものです。このルールに従ったトップレベルドメインだけが、ルートゾーン(*3)に登録可能になります。
ルートゾーンLGR作成の背景
ドメイン名のTLD部分(ラベル)には、英字(a ~ z)以外にも、漢字や平仮名、片仮名、ギリシャ文字といったさまざまな言語の文字(スクリプト)の利用が認められています(*4)。ただし、文字は言語を書き表せるものでなければなりません(記号や、改行などの制御文字は禁止されています)。
TLD部分は世界中のインターネット利用者がアクセスするため、インターネット利用者が、「ラベルの認識」で混乱しないよう、言語・文字間で整合の取れたルールが必要です。特に、同時に使用できる文字の範囲や、同一とみなす文字の組の定義が重要です。
言語によっては、例えば漢字であれば「国」と「國」のように、異体字が存在します。通常、異体字は意味や発音が同じものを指しますが、ルートゾーンLGRでは、「カ(カタカナ)」と「力(漢字)」のように視覚的類似も含みます。
また、先頭や末尾に用いることができない文字、特定の文字にのみ続くなど、文字の位置のルールも含まれます。
ルートゾーンの安定運用に影響を及ぼさないようにするためには、言語ごとにルールを用意し、それらが互いに整合していることが必要です。そこでICANNは、各言語コミュニティにおいて、それぞれの言語ルール案を作成し、それら各言語ルール案を統合して、TLDで利用可能な文字とその異体字を統合的に取り扱うためのルール「ルートゾーンLGR」を作成することにしました。
ルール作成のプロセス(2種のパネル)
ルートゾーンLGRの作成は、以下の2種のパネルが行います。
各言語の生成パネルは、言語コミュニティと調整し、言語ルール案の提案書を作成します。統合パネルが提案書に技術的問題がないことを確認すれば、ICANNによるパブリックコメント(意見募集)の手続きが行われ、統合パネルによる最終評価の後、ルートゾーンLGRに統合されます。
2022年5月26日に公開されたルートゾーンLGRでは、25の言語ルールが統合されています。
ルール概要
各言語の生成パネルは、以下の観点から言語ルール案を作成します。
各言語のルール案の検討や概要を、日本語ラベルのルールを例に紹介します。
日本語ラベルのルール検討
日本語ラベルのルール案の検討は、「日本語生成パネル(JGP:Japanese Generation Panel)(*6)」により行われました。日本語生成パネルは、国際化ドメイン名に関する有識者、言語専門家、レジストリ専門家らで構成されました。JPRSからも、日本語JPドメイン名のサービス設計・提供及び運用の経験で得た知見を活かして数名が参画しました。
ルール案の検討には、日本語と同様に漢字を使う中国語と韓国語の生成パネル間で整合性を取る必要がありました。そのため、日本語生成パネルは、中国語生成パネル(CGP:Chinese Generation Panel)、韓国語生成パネル(KGP:Korean Generation Panel)と漢字の異体字の定義について意見交換を行いながら、ルール案の作成を進めました。
日本語生成パネルは、中国語生成パネルや韓国語生成パネル、統合パネルと調整後、2021年9月にルール案の提案書をICANNに提出しました。提案書は、パブリックコメントの手続きを経て、統合パネルによる最終評価を終え、2022年5月26日、ルートゾーンLGRに統合されました。
日本語ラベルのルール概要
日本語ラベルのルール(日本語用ルートゾーンLGR)の概要は以下の通りとなります。
以下は、視覚的類似性を根拠として定義された12組の異体字です(括弧内はUnicodeの文字固有番号(Code Point))。
平仮名 | 片仮名 | 漢字 |
---|---|---|
へ(U+3078) | ヘ(U+30D8) | |
べ(U+3079) | ベ(U+30D9) | |
ぺ(U+307A) | ぺ(U+30DA) | |
ニ(U+30CB) | 二(U+4E8C) | |
カ(U+30AB) | 力(U+529B) | |
ハ(U+30CF) | 八(U+516B) | |
ト(U+30C8) | 卜(U+535C) | |
ロ(U+30ED) | 口(U+53E3) | |
タ(U+30BF) | 夕(U+5915) | |
エ(U+30A8) | 工(U+5DE5) |
記号文字 | 漢字 |
---|---|
ー(U+30FC) | 一(U+4E00) |
ヽ(U+30FD) | 丶(U+4E36) |
漢字ラベルの異体ラベルの取り扱いに関しては、漢字ラベルを日本語や韓国語、中国語のどの言語として申請するかによって異なります。ICANNは、登録可能なラベルや異体字の取り扱いを確認できるように、公開しているルートゾーンLGRを参照し、ラベルを検証できるツール(LGR Tool(*7))をWebサイトで提供しています。
なお、ICANNは、ルートゾーンLGRを参考に、gTLD用のセカンドレベルドメイン(SLD)におけるラベルのルールのひな型を作成しています(*8)。
ドメイン名やIPアドレスなどのインターネットの資源管理を行っている非営利法人 【↑】
https://www.icann.org/
Root Zone Label Generation Rules 【↑】
https://www.icann.org/resources/pages/root-zone-lgr-2015-06-21-en
トップレベルドメインの名前解決に必要なDNS情報が設定されたファイル 【↑】
Maximal Starting Repertoire 【↑】
https://www.icann.org/resources/pages/msr-2015-06-21-en
ギリシャ文字で「テスト」の意味 【↑】
https://www.icann.org/resources/pages/lgr-toolset-2015-06-21-en 【↑】
https://www.icann.org/resources/pages/second-level-lgr-2015-06-21-en 【↑】
掲載内容は2022年6月のものです。