Unicode化
職場の名簿データをUnicode化しようと考えている。これまでShift JISでやってきたのだが,そろそろいいかな,と。スクリプトもそれにあわせていくつか書き換えてきたが,Windows標準のsortなどの外部コマンドが対応してなくて残念な思いを何度かした。
一方,職場と別の仕事でメールから自動でデータをまとめるスクリプトを書いていたときのこと。WordPressから届いたメールはISO-2022-JPになっているのでそれを前提に処理していたら,特定のメールでエラーになってしまう。どうやらISO-2022-JPになくてISO-2022-JP-MSにある微妙な文字が原因らしい。そこで仕方なくnkfを通してUnicode化することにした。nkfって懐が広くて便利だなあ。
外字からIPA mj明朝に移行する件はいまだ頓挫中。
コメントの受付は終了しました。