関数・クラス解説

str_word_count

version:PHP 4 >= 4.3.0, PHP 5, PHP 7 (公式)

文字列に含まれる単語の数や単語に関する情報を返却する

フォーマット

mixed : str_word_count ( string $string [, int $format = 0 [, string $charlist ]] )

パラメータ

string $string (必須)
調べたい文字列

int $format = 0
この関数の戻り値の形式を指定できます。

  • 0 - 見つかった単語の数を int で返却(デフォルト値)。
  • 1 - 見つかった単語を配列へ格納して返却
  • 2 - 見つかった単語を連想配列で返します。単語の開始位置がキー、単語自体を値とした形式の連想配列となります。


string $charlist
文字列中に単語としてみなされない文字が存在していても通常は無視されるが、ここで文字列を指定することで単語として認識される。

返値 mixed
format で指定した形式(整数・配列・連想配列)で返却。

解説

この関数は、string に含まれる単語数をや各単語の開始位置などを返却します。format の指定により返却される情報が変わります。
上記の int $format の項目を参照してください。

記述サンプル

//PHP 7.4.6で実行
$str = "Hello world!, I am a Pen! Thank You";

//format を無指定で実行
$result = str_word_count($str);

//結果 単語数が返る
echo $result;
8

//format に 1 を指定
$result = str_word_count($str, 1);

//結果 配列が返る
print_r($result);
Array
(
    [0] => Hello
    [1] => world
    [2] => I
    [3] => am
    [4] => a
    [5] => Pen
    [6] => Thank
    [7] => You
)


//format に 2 を指定
$result = str_word_count($str, 2);

//結果 開始位置をキーとした連想配列が返る
print_r($result);
Array
(
    [0] => Hello
    [6] => world
    [14] => I
    [16] => am
    [19] => a
    [21] => Pen
    [26] => Thank
    [32] => You
)

/* ----------------------------- */

//マルチバイト文字列を指定
$str = "Hello world!!, ありがとう!";

//format に 2 を指定
$result = str_word_count($str, 1);

//結果 通常はマルチバイト文字列は認識しない
print_r($result);
Array
(
    [0] => Hello
    [1] => world
)

//string $charlist で単語として認識できるように指定
$result = str_word_count($str, 1, "ありがとう");

//結果
print_r($result);
Array
(
    [0] => Hello
    [1] => world
    [2] => ありがとう
)

参考リンク

preg_split 正規表現で文字列を分割する
split 正規表現により文字列を分割し、配列に格納する
count_chars 文字列内の各文字についてバイト値に関する情報を返す
explode 文字列を指定した文字で分割し配列で返す
substr_count 副文字列の出現回数を数える

タグ

単語 情報 String 文字列


公式リファレンス

書式

str_word_count ( string $string [, int $format = 0 [, string $charlist ]] ) : mixed

説明

string に含まれる単語数を数えます。 オプションの format が指定されていない場合、 見つかった単語の数を整数値で返します。 format が指定されている場合は結果が配列で返され、 配列の内容は format に依存します。 format に設定できる値と対応する出力については 以下で示します。

この関数を使用するうえで、'単語' は「ロケールに依存したアルファベットから なる文字列で、その先頭以外の部分に "'" および "-" を含 めることができる」ものと定義されています。

パラメータ

string
文字列。
format
この関数の戻り値を設定します。現在サポートされている値は 以下のとおりです。
  • 0 - 見つかった単語の数を返します。
  • 1 - string の中に見つかった単語を含む 配列を返します。
  • 2 - 連想配列を返します。string の中での 単語の開始位置がキー、単語自体を対応する値となります。
charlist
'単語' とみなされる文字に追加する文字のリスト。

返値

選択した format に応じて、配列あるいは整数を返します。

サンプル

例1 str_word_count() の例

$str = "Hello fri3nd, you're        looking          good today!"; print_r(str_word_count($str, 1)); print_r(str_word_count($str, 2)); print_r(str_word_count($str, 1, 'àáãç3')); echo str_word_count($str);

上の例の出力は以下となります。

Array ( [0] => Hello [1] => fri [2] => nd [3] => you're [4] => looking [5] => good [6] => today ) Array ( [0] => Hello [6] => fri [10] => nd [14] => you're [29] => looking [46] => good [51] => today ) Array ( [0] => Hello [1] => fri3nd [2] => you're [3] => looking [4] => good [5] => today ) 7

参考

  • explode() - 文字列を文字列により分割する
  • preg_split() - 正規表現で文字列を分割する
  • split() - 正規表現により文字列を分割し、配列に格納する
  • count_chars() - 文字列で使用されている文字に関する情報を返す
  • substr_count() - 副文字列の出現回数を数える
  • ワード検索


    ※入力キーワードが、関数名・説明文・タグに含まれるものを検索

    関数名アルファベット別

    A B C D E F G H I J
    K L M N O P Q R S T
    U V W X Y Z _

    最終更新一覧

    stristr
     大文字小文字を区別せず文字列を検索し、ヒット箇所以降(あるいは以前)の文字列を返却

    stripslashes
     バックスラッシュでエスケープされた文字列から、バックスラッシュを取り除く

    stripos
     大文字小文字を区別せずに文字列が最初に現れる位置を取得する

    stripcslashes
     addcslashes() でクォートされた文字列をアンクォートする

    strip_tags
     文字列から HTML と PHP のタグを除去して返却

    strcspn
     指定した文字が最初に現れる位置を調べる

    strcoll
     ロケールに基づいて2つの文字列を比較し同じか(あるいは大小)を判定する

    strcmp
     2つの文字列を比較し同じか(あるいは大小)を判定する

    strchr
     strstr() のエイリアス

    strcasecmp
     2つの文字列を比較(大文字小文字を区別せず同じとみなす)

    カテゴリー一覧

    PHP の振る舞いの変更
    音声フォーマットの操作
    認証サービス
    コマンドライン関連
    圧縮およびアーカイブ
    暗号
    データベース関連
    日付および時刻関連
    ファイルシステム
    自然言語および文字エンコーディング
    画像処理および作成
    メール関連
    数学
    テキスト以外の MIME 型
    プロセス制御
    その他の基本モジュール
    その他のサービス
    検索エンジン用の拡張モジュール
    サーバー固有のモジュール
    セッション関連
    テキスト処理
    変数・データ型関連
    ウェブサービス
    Windows 用のモジュール
    XML 操作
    GUI用の拡張モジュール