情報アイランド

「情報を制する者は世界を制す」をモットーに様々な情報を提供することを目指すブログです。現在はプログラミング関連情報が多めですが、投資関連情報も取り扱っていきたいです。

ウェブ開発者なら必ず知っておくべき基礎知識(8)IRI

IRIはInternationalized Resource Identifierの略称であり、URI(URL)をユニコードの文字が使えるように拡張したものです。

IRIではURIのホスト部分やパス部分やクエリ部分やフラグメント部分にユニコードの文字を使用することができます(スキーム部分には使用できませんので注意してください)。

ただし、使用できるユニコードの文字は下のコードポイントの範囲のもののみです。下ではコードポイントは16進数として表しています。

  • A0からD7FFまで
  • F900からFDCFまで
  • FDF0からFFEFまで
  • 10000から1FFFDまで
  • 20000から2FFFDまで
  • 30000から3FFFDまで
  • 40000から4FFFDまで
  • 50000から5FFFDまで
  • 60000から6FFFDまで
  • 70000から7FFFDまで
  • 80000から8FFFDまで
  • 90000から9FFFDまで
  • A0000からAFFFDまで
  • B0000からBFFFDまで
  • C0000からCFFFDまで
  • D0000からDFFFDまで
  • E0000からEFFFDまで

ただし、下のコードポイントは使用できませんので注意してください。

  • 200E
  • 200F
  • 202A
  • 202B
  • 202C
  • 202D
  • 202E

ただし、クエリ部分には上の範囲のものに加えて下の範囲のものも使用できます。

  • E000からF8FFまで
  • F0000からFFFFDまで
  • 100000から10FFFDまで

IRIからURIへの変換

IRIをURIに変換するにはIRIでは使用できてURIでは使用できない文字をパーセントエンコード(URLエンコード)したものに置き換えます。

pizyumi
プログラミング歴19年のベテランプログラマー。業務システム全般何でも作れます。現在はWeb系の技術を勉強中。
スポンサーリンク

-web