【PHP】配列の添字と文字列のオフセット指定


文字列のオフセット指定について、ちゃんと理解しないまま使用していたら、ちょっとハマッた箇所があったので整理しました。

配列の添字

$array = array('Yamada', 'Tarou',);

echo $array[0];		// 「Yamada」が出力される

文字列のオフセット指定

$string = 'Yamada';

echo $string[0];	// 「Y」が出力される

 

まあ、この辺の違いは今更書くまでもないことだろうけど・・・。

処理の高速化について調べていたところ、下記のような記述を見つけました。

 

33. if (strlen($foo) < 5) を調べたいなら if (!isset($foo{5})) と書くと速い。

参考サイト PHPコード最適化高速化TIPSまとめ

 

この $foo{5} という記述を見慣れていなかった私は「おぉ、便利だなぁ」と、PHPマニュアルをちゃんと読んだりすることなく、整数を扱う変数にも使ってしまっていました。

if (isset($number['a']{0}))
{
 // 処理
}

ところが、期待したような結果を得られず、ちゃんと調べてみたところ、この {0} という記述は文字列のオフセット指定 [0] と同じ処理を行っており、変数が文字列型でない場合は当然ながら期待した動作を行いません。

 

注意:
その他の型の変数 (配列や、適切なインターフェイスを実装したオブジェクトを除く) に対して [] や {} でアクセスすると、何もメッセージを出さずに単に NULL を返します。

参考サイト PHP: 文字列 – Manual

 

また、波括弧 {}を使用したオフセット指定方法は、PHP 6で廃止予定とのことなので、角括弧 []に統一しておいた方が良いです。

ということで、整数値の変数が入っているかチェックを行いたい場合は

if (isset($number['a']))
{
 // 処理
}

通常通り、単にこれだけの記述になりますね。
何を今更な内容ですが、マニュアルをちゃんと読まなかったため、勘違いをしてしまいました。

数値か調べたい場合は is_numeric がありますが、今回の用途では「数値が入る」か「何も入らない」かの2パターンしかないため isset を使用しています。

 

17. $row[‘id’] は $row[id] より7倍速い。
参考サイト PHPコード最適化高速化TIPSまとめ

ついでといってはなんですが、配列の添字指定時に’(シングルクォーテーション)で括った場合の処理速度を確認してみました。

処理は単純に、配列の要素を変数に代入するだけという物を10万回実行。

$test = array(
	'a' => 'Yamada',
	'b' => 'Tarou',
);

$max = 100000;

for ($i=0; $i<$max; $i++)
{
	$x = $test['a'];
}

for ($i=0; $i<$max; $i++)
{
	$y = $test[a];
}

結果は下記のとおりとなりました。

$x = $test[‘a’]; 0.0095689296722412 秒
$y = $test[a]; 0.83886814117432 秒

また、添字が数字だった場合がどうなるかも試してみました。

$x = $test[‘0’]; 0.0065720081329346 秒
$y = $test[0]; 0.0066301822662354 秒

こちらは何回か試してみましたが、[‘0’]が早い時もあれば、[0]が早い時もあったので、処理速度に大きな差はないようです。
コーディングスピードを上げるという観点から考えると、添字が数字の場合は[0]で良さそうです。
といっても、数字の添字を直接指定して使う機会ってほとんどない気がします。

 

文字列のオフセット指定時の’(シングルクォーテーション)
また、文字列のオフセット指定についても’(シングルクォーテーション)のあり・なしで処理速度が変わるのか試してみました。

$test = 'Yamada Tarou';

実行回数を10回に増やして比較してみました。
早かった方が赤色です。

回数 $x = $test[‘0’]; $y = $test[0];
1 0.010056972503662 秒 0.012347936630249 秒
2 0.010039806365967 秒 0.009335994720459 秒
3 0.010890007019043 秒 0.0094809532165527 秒
4 0.0096769332885742 秒 0.012487173080444 秒
5 0.012174844741821 秒 0.0098400115966797 秒
6 0.0097651481628418 秒 0.0092430114746094 秒
7 0.0090720653533936 秒 0.0089559555053711 秒
8 0.012573003768921 秒 0.010463953018188 秒
9 0.0095231533050537 秒 0.0098400115966797 秒
10 0.012336015701294 秒 0.010035037994385 秒

大きな差は見られず誤差範囲のようです。
こちらもタイピング量を減らし、コーディングスピードを上げるという観点からシングルクォーテーション無しの [0] で良さそうでした。

結論としては、$a{0}のような波括弧を使用した記述は撲滅して欲しいです(笑)
ネットはどうしても古い記事がそのままメンテナンスされず残ってしまうので、非推奨な書き方がいつまでも出回るのが難しいところですね。

私も、古い記述の記事を掲載し続けないように気をつけねば。。。