JPドメイン名のサービス案内、ドメイン名・DNSに関連する情報提供サイト


JPRS トピックス&コラム No.025


トップレベルドメインのラベル生成ルール「ルートゾーンLGR」の概要


トップレベルドメイン(TLD)に登録できるラベルの文字に関するルールである、「ルートゾーンLGR」の作成背景や作成プロセス、ルール概要、日本語ラベルのルールについて解説します。

日本語ラベルのルールを含む「ルートゾーンLGR(Root Zone Label Generation Rules)」の第5版が、ICANN(*1)から2022年5月26日に公開されました(*2)
ルートゾーンLGRは、トップレベルドメインのラベルの文字(英字や英字以外も含む)に関するルールを定めたものです。このルールに従ったトップレベルドメインだけが、ルートゾーン(*3)に登録可能になります。

ルートゾーンLGR作成の背景

 ドメイン名のTLD部分(ラベル)には、英字(a ~ z)以外にも、漢字や平仮名、片仮名、ギリシャ文字といったさまざまな言語の文字(スクリプト)の利用が認められています(*4)。ただし、文字は言語を書き表せるものでなければなりません(記号や、改行などの制御文字は禁止されています)。

図 1 ドメイン名のTLD 部分(ラベル)
図 1 ドメイン名のTLD 部分(ラベル) ※図中(*5)

 TLD部分は世界中のインターネット利用者がアクセスするため、インターネット利用者が、「ラベルの認識」で混乱しないよう、言語・文字間で整合の取れたルールが必要です。特に、同時に使用できる文字の範囲や、同一とみなす文字の組の定義が重要です。
 言語によっては、例えば漢字であれば「国」と「國」のように、異体字が存在します。通常、異体字は意味や発音が同じものを指しますが、ルートゾーンLGRでは、「カ(カタカナ)」と「力(漢字)」のように視覚的類似も含みます。
 また、先頭や末尾に用いることができない文字、特定の文字にのみ続くなど、文字の位置のルールも含まれます。
 ルートゾーンの安定運用に影響を及ぼさないようにするためには、言語ごとにルールを用意し、それらが互いに整合していることが必要です。そこでICANNは、各言語コミュニティにおいて、それぞれの言語ルール案を作成し、それら各言語ルール案を統合して、TLDで利用可能な文字とその異体字を統合的に取り扱うためのルール「ルートゾーンLGR」を作成することにしました。

ルール作成のプロセス(2種のパネル)

 ルートゾーンLGRの作成は、以下の2種のパネルが行います。

  1. 生成パネル(GP:Generation Panel)
    各言語のコミュニティを代表する有識者・言語やドメイン名の専門家により構成される、その言語に関するラベル生成ルールを作成するためのパネルです。生成パネルはルートゾーンに追加する言語ごとに組織されます。
  2. 統合パネル(IP:Integration Panel)
    文字コードや国際化ドメイン名の専門家により構成される、各言語の生成パネルが作成したルールの整合をとり、一つに統合するためのパネルです。ルールを一つに統合するため、統合パネルは一つしか存在しません。
図2 作成プロセスの概要
図2 作成プロセスの概要

 各言語の生成パネルは、言語コミュニティと調整し、言語ルール案の提案書を作成します。統合パネルが提案書に技術的問題がないことを確認すれば、ICANNによるパブリックコメント(意見募集)の手続きが行われ、統合パネルによる最終評価の後、ルートゾーンLGRに統合されます。
 2022年5月26日に公開されたルートゾーンLGRでは、25の言語ルールが統合されています。

ルール概要

 各言語の生成パネルは、以下の観点から言語ルール案を作成します。

  • レパートリーの定義
    * その言語で使われる文字のうち、ラベル申請時に使用してよい文字の一覧
  • 異体字の組の定義
    * 同一文字の複数の表記(意味、発音が同一で、置き換えが可能な文字の組)
    * 視覚的類似
  • 文字特性の定義
    * 文字位置や連続性などに制約がある文字の特性(日本語の場合は、捨て仮名、踊り字、長音記号など)
  • 異体ラベル(異体字の置き換えによってできるラベル)の登録可否判定ルールの定義
    * 異体ラベルをTLDとして登録可能か、登録不可かの判定
    * レパートリーに定義されていない文字が含まれる場合はラベルとして認められない
    * 登録可能である場合、元の申請者のみが登録できるが、必ず登録しなければならないわけではない

 各言語のルール案の検討や概要を、日本語ラベルのルールを例に紹介します。

日本語ラベルのルール検討

 日本語ラベルのルール案の検討は、「日本語生成パネル(JGP:Japanese Generation Panel)(*6)」により行われました。日本語生成パネルは、国際化ドメイン名に関する有識者、言語専門家、レジストリ専門家らで構成されました。JPRSからも、日本語JPドメイン名のサービス設計・提供及び運用の経験で得た知見を活かして数名が参画しました。
 ルール案の検討には、日本語と同様に漢字を使う中国語と韓国語の生成パネル間で整合性を取る必要がありました。そのため、日本語生成パネルは、中国語生成パネル(CGP:Chinese Generation Panel)、韓国語生成パネル(KGP:Korean Generation Panel)と漢字の異体字の定義について意見交換を行いながら、ルール案の作成を進めました。
 日本語生成パネルは、中国語生成パネルや韓国語生成パネル、統合パネルと調整後、2021年9月にルール案の提案書をICANNに提出しました。提案書は、パブリックコメントの手続きを経て、統合パネルによる最終評価を終え、2022年5月26日、ルートゾーンLGRに統合されました。

日本語ラベルのルール概要

 日本語ラベルのルール(日本語用ルートゾーンLGR)の概要は以下の通りとなります。

  • レパートリーはJIS第1水準、第2水準の平仮名・片仮名・漢字・一部の準漢字からなる6532文字とする
  • 日本語用ルートゾーンLGRでは各文字に日本語独自の異体字(意味・発音に由来する)を定義しないが、中国語用ルートゾーンLGRや韓国語用ルートゾーンLGRが定義する漢字の異体字を取り込む
  • 視覚的類似文字に由来する異体字は、誤認発生が明らかなもののみ定義する
  • 登録可能なTLDは申請されたラベルのみとし、異体字ラベルは登録できない
  • 捨て仮名(「っ」「ォ」などの小さい仮名)・踊り字(「々」「ヾ」など)・長音記号(「ー」)はラベルの先頭に使えない

 以下は、視覚的類似性を根拠として定義された12組の異体字です(括弧内はUnicodeの文字固有番号(Code Point))。

平仮名片仮名漢字
へ(U+3078)ヘ(U+30D8)
べ(U+3079)ベ(U+30D9)
ぺ(U+307A)ぺ(U+30DA)
ニ(U+30CB)二(U+4E8C)
カ(U+30AB)力(U+529B)
ハ(U+30CF)八(U+516B)
ト(U+30C8)卜(U+535C)
ロ(U+30ED)口(U+53E3)
タ(U+30BF)夕(U+5915)
エ(U+30A8)工(U+5DE5)
記号文字漢字
ー(U+30FC)一(U+4E00)
ヽ(U+30FD)丶(U+4E36)

 漢字ラベルの異体ラベルの取り扱いに関しては、漢字ラベルを日本語や韓国語、中国語のどの言語として申請するかによって異なります。ICANNは、登録可能なラベルや異体字の取り扱いを確認できるように、公開しているルートゾーンLGRを参照し、ラベルを検証できるツール(LGR Tool(*7))をWebサイトで提供しています。
 なお、ICANNは、ルートゾーンLGRを参考に、gTLD用のセカンドレベルドメイン(SLD)におけるラベルのルールのひな型を作成しています(*8)


ドメイン名やIPアドレスなどのインターネットの資源管理を行っている非営利法人 【↑】
https://www.icann.org/

Root Zone Label Generation Rules 【↑】
https://www.icann.org/resources/pages/root-zone-lgr-2015-06-21-en

トップレベルドメインの名前解決に必要なDNS情報が設定されたファイル 【↑】

Maximal Starting Repertoire 【↑】
https://www.icann.org/resources/pages/msr-2015-06-21-en

ギリシャ文字で「テスト」の意味 【↑】

https://j-gp.jp/ 【↑】

https://www.icann.org/resources/pages/lgr-toolset-2015-06-21-en 【↑】

https://www.icann.org/resources/pages/second-level-lgr-2015-06-21-en 【↑】


掲載内容は2022年6月のものです。