返信先: KanjiTranslatorとUTF-8化

#62
o6asan
キーマスター

りりさん,おはようございます。

>> HTMLファイルは多量にあったので

と,sugiyamaさんもお書きのように,HTMLファイルにはKanjiTranslatorなどを利用できますが,他の部分はファイルの文字コードを変えるだけではだめですので,

> ミラーでそっくりUTF-8版を作り動作確認
> 他のCGI部分がUTF-8化できるか

もし,TODOSをUTF-8化するという話になると,お書きのように上記は必須ですよね。
cgiスクリプトの場合,中に使われている文字がアスキーだけなら,ファイルそのものはエンコードし直す必要はありませんが,日本製のスクリプトの場合,コメント部分は大概日本語ですので,これが足を引っ張ります。

>> あのくらいのスケールになると単なる変換でもかなり大変だろうと思っていました。

「単なる変換でも」と書いていますように,単なるデータの文字コード変換でも大変なのに,TODOSではそれだけでは済まないだろうという気持ちが入っています。
でも,単なる文字コード変換でも,量が多いと大変です。XSERVERはSSH(シェル)が使えるのですか。使えれば,少なくとも,ダウンロード・アップロードの手間は省けますが。

サイトの文字コードがいろいろなのは,何かやるときの文字化けの原因ですよね。私の場合は,自宅サーバでしかもユーザが自分だけですから,文字コードはUTF-8だけに統一していますが,これがバラバラだと管理は結構面倒です。わからないなりに,サーバ管理者が読むようなところを読むこともあるのですが,昔からのサイトの運用で,結構文字コードで手を焼いているのをみます。

話はそれますが,今回,SSHの実験をやるのにTeraTermを使いました。一時期,TeraTermはすたれていました。SSH2に対応が遅れたのも原因ですが,UTF-8への未対応も原因のひとつです。

現在のTeraTermはSSH2にもUTF-8にも対応しています。それで,使うことにしたのですが―なんといっても日本発祥のソフトですし―もし今でも未対応だったら,採用しなかったです。
http://sourceforge.jp/projects/ttssh2/