2000/07/03

| コメント(0) | トラックバック(0)

今日は久しぶりに朝から出社。通勤ラッシュの電車に乗るのも久しぶり。だからって、たまにはいいもんだ、なんてとても思えないけどね。暑いー。

昨日買った本の著者名に“î”という文字があるんだけど、これをHYMLでは“î”と書く。そういう書き方の一覧を作った。当然W3Cには置いてあるんだろうけど、手近にあると便利だし。DTDからHTMLへはJavaプログラムで変換した。場当たり的なコードだから公開できないけど。

そのXML本にUTF-8が基本だと書いてあった。試しにNativeテキストをUTF8に変換するJavaアプリケーションを書いて試してみる。をお。IEもNNもちゃんと表示する。エライエライ。あ、当然ヘッダにおまじない(<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">)を書いてやらないとダメなんだけど。

import java.io.*;
public class Native2UTF8 {
	public static void main(String[] args) {
		try {
			BufferedReader in = new BufferedReader(new InputStreamReader(args.length < 1 ? System.in : new FileInputStream(args[0])));
			BufferedWriter out = new BufferedWriter(new OutputStreamWriter(args.length < 2 ? (OutputStream)System.out : new FileOutputStream(args[1]), "UTF8"));
			while (true) {
				String line = in.readLine();
				if (line == null) {
					break;
				}
				out.write(line);
				out.newLine();
			}
			out.flush();
		} catch (Exception ex) {
			System.err.println(ex.getMessage());
			System.err.println("usage: java Native2UTF8 [input [output]]");
		}
	}
}

あ。しょっくー。↑を調べてたらお気に入りだった<xmp>タグってHTML4.0外なのね。仕方ないから全部<pre>に置換だ。

トラックバック(0)

トラックバックURL: http://www.septigram.jp/mt/mt-tb.cgi/48

コメントする

月別 アーカイブ

ウェブページ

Powered by Movable Type 5.04

このブログ記事について

このページは、wyvernが2000年7月 3日 00:00に書いたブログ記事です。

ひとつ前のブログ記事は「2000/07/02」です。

次のブログ記事は「2000/07/04」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。