2013年5月22日水曜日

Blogger URL の表示で %xx の憂鬱

Blogger のトラフィックを見ていて %xx の表示に気付かれた方いらっしゃいますよね。
何かよく分らない記号が並ぶ意味不明の URL 。
外部のリンクで 参照しようとするウェブアドレスを入力しても %xx が現れる事がありますね。
これ何とかならない ... って思いません?



実は Internet は特殊記号や日本語が苦手。
そのままでは送信できません。
UTF-8 という文字列 (*1) に変換して、送受信しています。
いわば、翻訳。
% の付いている部分が、ある文字を示していますが、まぁ、一般的には意味不明。
これを パーセントエンコーディング符号化( URL エンコーディング の一部) とも言います。

分らなくても、あなたのパソコン(もしくはブラウザ)は、ちゃんと お仕事をしてくれます。

             注 *1 IE10 では、標準状態では、UTF-8 の URL を送信 に設定されています。
             UTF-8 以外にも Shift JIS や EUC-JP といた文字コードで変換する場合もあります。 

通常はそれで OK !
でも、気になりませんか?

統計 > トラフィック で 参照元 URL を見てみましょう。
検索エンジンで参照されて来たトラフィックでは、検索文字列がこの % 付きの よく分らない 文字列で並んでいます。
また、いかがわしそうな アドレスも、これらに紛れて、さらにミステリアス。

私たちの使う言語が英語なら、こんな 不明瞭な 表示では 無い筈。
UTF-8 に翻訳されて表現が極端に変わる部分は少ないですから。

こんな状態に出くわすと、やはり Internet は英語圏が出発点だから日本などの2バイト圏は面倒だなぁ なぁんて諦め感が漂います。


気を取り直して、

これに対して、% 付きの よく分らない 文字列 を、元の形(私達が分り易い形)に戻すことを URL デコード と呼びます。


Google もしくは Blogger の Japan さま (?) に お願いです!
是非、(リンク において) 表示する文字列に URL デコード したものを採用して下さい!


参考までに、開発言語 Visual Basic を使って、URL デコード する簡単なアプリを作りました。
こんな感じの画面です。


興味のある方は こちら の 投稿もどうぞ。


0 件のコメント:

コメントを投稿