Unicode::Normalizeプラグイン(MT)。
公開日 : 2007-04-19 12:27:30
属性値に指定できるのは以下の4種類。デフォルトはNFKC。
- NFD(Normalization Form D)
- NFC(Normalization Form C)
- NFKD(Normalization Form KD)
- NFKC(Normalization Form KC)
<$MTEntryBody normalize="NFD"$>
単にPerlのUnicode::Normalize;で正規化しているだけですが、半角に変換されると困る以下の文字については事前に置換するようにしました。
$text =~ s/</</g; $text =~ s/>/>/g; $text =~ s/&/&/g; $text =~ s/[“”]/"/g;
MT3.34, Perl5.8, 文字コードUTF-8環境でのみ検証済みです。
ダウンロード:
※正規化って何? という方は以下を参照ください。