数组中不区分大小写的语音搜索

问题描述 投票:0回答:2

我有一个像这样的数组

array
  0 => string 'Schmitt' (length=6)
  1 => string 'Maier' (length=1)
  2 => string 'Müller' (length=7)
  3 => string 'müller' (length=7)
  4 => string 'mueller' (length=7)
  5 => string 'Toll' (length=4)

我想要得到这样的东西

array
  0 => string 'Schmitt' (length=6)
  1 => string 'Maier' (length=1)
  2 => string 'Müller' (length=7)
  3 => string 'Toll' (length=4)

我想检查所有变音符号,例如“䔓ö”“ü”,并且应该不区分大小写。 第一个字母将是大写的,但这我会自己得到。只是需要语音方面的帮助,因为我不想做一件巨大的

if...else
事情。

php arrays
2个回答
2
投票

你可以将“拼音版本”作为键存储在结果数组中(这样你就可以知道该单词是否已经添加,而无需使用

in_array
搜索,只需检查该键是否存在):

$names = ['Schmitt', 'Maier', 'Müller', 'müller', 'mueller', 'Toll'];
$rules = ['ü' => 'ue', 'ä' => 'ae', 'ö' => 'oe', 'ß' => 'ss' ]; // uzw

$result = [];

foreach ($names as $name) {
    $phonetic = strtr(mb_strtolower($name), $rules);
    if ( !isset($result[$phonetic]) )
        $result[$phonetic] = $name; // put mb_ucfirst here
}

$result = array_values($result);

print_r($result);

由于您正在处理多字节字符,因此需要使用

mb_strtolower
以避免错误。出于同样的原因,如果需要将第一个字符设为大写,则应该使用 php 手册中 plemieux 发布的函数

function mb_ucfirst($str) {
    $fc = mb_strtoupper(mb_substr($str, 0, 1));
    return $fc . mb_substr($str, 1);
}

注意:

mb_ucfirst
已在 PHP 8.4 中添加。


1
投票

你可以尝试这样的事情:

$replacements = ['ü' => ['ue']];

$names = ['Schmitt', 'Maier', 'Müller', 'müller', 'mueller', 'Toll'];

$names = array_map('strtolower', $names);

$names = array_reduce($names, function ($carry, $name) use ($replacements) {

    foreach ($replacements as $replaceWith => $replaceWhat) {
        $name = str_replace($replaceWhat, $replaceWith, $name);
    }

    if (!in_array($name, $carry)) {
        $carry[] = $name;
    }

    return $carry;

}, []);

$names = array_map('ucfirst', $names);

var_dump($names);

结果将是:

array(4) {
  [0]=>
  string(7) "Schmitt"
  [1]=>
  string(5) "Maier"
  [2]=>
  string(7) "Müller"
  [3]=>
  string(4) "Toll"
}
© www.soinside.com 2019 - 2024. All rights reserved.