読者です 読者をやめる 読者になる 読者になる

perl で utf8 の日本語の文字数をカウントする。

perl

utf8 だと日本語はバイト数がめんどいことに・・・。
文字コードはプログラムする上で永遠の敵かも・・・。

やりかた。

use Encode qw(decode);

my $text = 'utf8で書かれた日本語';
my $length = length(decode('utf-8', $text));

簡単にでけた。

改行がはいるとずれるので、改行が入っている文字列をやるときは、改行取り除いてくだされ。