北青山通信 – from aoyama » 2008 » 9月 » 26

タイトルの件、考えてみれば当たり前なのですが、お客さんからの仕様で引っかかりました。ここでいう全角文字は、マルチバイト文字のこと。

フォームに文字を入力する処理で、入力した文字の長さをチェックする処理が必要です。そこで文字長でチェックするか、バイトでチェックするか。

これをCakePHPのバリデーションで用意しているmaxLengthのルールでチェックしたところ、何も考えずに内部コードのバイト長でチェックしていまいます。これをお客様から指摘されました。希望としては、全角文字を2バイトでチェックして欲しいとのこと。

例えば、「あああ」は6バイトではなく9バイトとして判定されます。これは内部のコードがUTF-8だからです。CakePHPのバリデーションで正しく文字数で判定するには、maxLengthの処理をmb_strlen()で変更してあげます。詳細な対応方法は、こちらのサイトをご覧ください。

ここで簡単な実験です。こんなコードと結果です。

<?php

$str = "あああ";

echo(strlen($str)); // 9

echo(mb_strlen($str));  // 9

echo(mb_strlen($str, ‘UTF-8′));  // 3

echo(mb_strlen(mb_convert_encoding($str, ‘SJIS’, ‘UTF-8′), ‘SJIS’)); // 3

echo(strlen(mb_convert_encoding($str, ‘SJIS’, ‘UTF-8′)));  // 6

?>

UTF-8のままですと、全角文字は2バイトにはなりません。しかも、正しく文字コードをしてあげないと正しい文字数になりません。

一旦、シフトJISに変換してあげて、mb_stringではないstrlen()で全角文字を2バイトで計算してくれます。

昔の人間ですと、どうしても全角=2バイト、半角=1バイトと考えてしまうのですが、この考え方は古いかもしれませんね。

社内で使っているデルのサーバーは、ファイルサーバー、IMAPサーバー、AsteriskのソフトPDXのサーバーとして利用しています。メモリ1GBでディスク100GB4台をRAID5です。

導入して4年目、多少トラブルがあったものの、とりあえず無事に動いています。

しかし、いつ壊れるかもしれません。ファイルサーバーのバックアップは毎日取っていますが、安心してはいられません。しかも、そろそろディスクの残量がなくなってきています。

そこで、サーバーの更新を検討してみます。条件としては、

  • ディスクは1Tバイト以上。
  • RAID構成で安全に。
  • メモリは仮想化されたサーバーを動かすので2MB以上。
  • 日頃メンテナンスで面倒がないこと。

となります。現在のサーバー構成でメモリとディスクを増やして、デルで見積もりをしたら、30万近くになります。。

代案として

  • Linuxのサーバーで構築するのをやめて、NASのTera Stationとを入れてしまう。しかし、これですと、IAMPとかAsteriskなどのアプリケーションが動かない。
  • NASのTera StationとLinuxサーバーを入れてしまう。そのときのLinuxサーバーはディスクは最小構成。ディスクはTera Stationにマウントする。Linuxサーバーが故障したら、OSだけ再インストール。でも、LinuxサーバーからTeraStationへのマウントはSMBでマウントするの? 遅そうですね。
  • 上のNASのTera Stationの代わりにiSCSIのTeraStarion ISを入れる。もし、ディスクが足りなくなったら、iSCSIの機器を追加していく。NASよりもパフォーマンスは上か? でも、iSCSI自体、新しい技術のためハードルが高いか? それにLinuxとの接続はBUFFALOも推奨していなさそうだし。
  • サーバー自体をパーツを買ってきて自作してしまう。でも、自作してしまうと故障したときに自分で面倒みなければいけないし大変かもしれません。

お客様には、何台もTeraStationを薦めてきましたが、そろそろ自社でも導入しておいたほうがいいかもしれません。3番目がおもしろいかもしれません。

さて、どうするか・・・。

契約しているレンタルサーバー会社から、PHP4からPHP5に移行するという連絡がありました。PHP4がサポート停止になる措置です。

おそらく何もしなくても、今動いているサイトやブログ(ここのブログ)は動くと思いますが、当日は注意しておかなくてはいけません。

しかし、ようやくですね。PHP4に対応しているということで、CakePHPを推奨してきましたが、それも関係なくなります。だけど、いまさらCakePHPにいどっぷり浸かっていますので、他のフレームワークに行くのも辛いところです。